词组输入规则
山人码LTS是一款词句输入友好的形码方案,下述输入规则的核心目的是尽可能减轻编码记忆负担,优化输入体验。
N+N规则
- ▶ 所有词库内的词组均可使用N+N(N>1)输入规则。
- ▶ 所谓的N+N规则是指输入词组中所有单字编码的前N位(N>1)。
- ▶ 如词组「发展」允许匹配的输入包括
【cx ec】
【cx ech】
【cxd ec】
【cxd echy】
【cxd echyis】等等。 - 上述编码的空格只是为了区分,实际不需要输入。
- ▶ N+N规则类似于常用的拼音输入法中的简拼。
信息
N+N规则在最近更新的版本中放弃了N=1的支持,这是因为山人码单字码表的使用编码总数庞大(九万余个编码),如果允许N=1,输入编码会触发大量的码表查询工作,严重影响性能。
如输入【rtnn】,则会对音节(形码在方案实现上被视作音节进行组合预测)进行划分为【r·tnn】【rt·nn】【rtn·n】【rtnn·】【r·t·nn】【r·tn·n】【r·t·n·n】等等可能的情况,每种情况都将进行N规则扩展后在词典中查询。若允许N=1,r,t,n为前缀的编码是相当大量的,仅【r·t·n·n】一条就将会被扩展成海量音节组合进行查询,因此带来较大性能负担
相对的,普通拼音输入法所使用的编码总数对应普通话合法音节数,数量仅约为四百个,使用N=1就带来的性能负担会小得多。
4+1规则
- ▶ 4+1规则是N+N规则的扩展
- ▶ 所有词库内的长度大于5的词组均可使用4+1输入规则
- ▶ 4+1规则允许输入只取词组前四个字和最后一字的单字编码进行N+N输入
- ▶ 如词组「全国人民代表大会」:
在N+N规则下允许使用基于【rgwn agvk rn ni rjyn cyi nr rwvn】的变换进行输入, 同时也允许在4+1规则下基于【rgwn agvk rn ni rwvn】的变换进行输入,如【rg ag rn ni rw】。
信息
上述两个规则所适用的单字编码取码范围如下:
- 单字根字允许取标准码
- 多字根字允许取常用码、特设码
简码规则
- 部分高频常用词在过去所见的山人码方案中被赋予了“简码”,其编码规则为:
-
- 部分极高频用词仅取词组各个单字编码的首位作为简码,如【网络 ay】【时候 br】【出来 cm】【为了 dl】等
-
- 部分高频用词取词组第一个字编码的前两位,再取剩余单字编码的首位,如【内容 ara】【实在 asf】等
- 山人码LTS对这些“简码” 做了继承,具体编码用词见项目仓库的【简码码表】。