跳到主要内容

词组输入规则

山人码LTS是一款词句输入友好的形码方案,下述输入规则的核心目的是尽可能减轻编码记忆负担,优化输入体验。

N+N规则

  • ▶ 所有词库内的词组均可使用N+N(N>1)输入规则。
  • ▶ 所谓的N+N规则是指输入词组中所有单字编码的前N位(N>1)。
  • ▶ 如词组「发展」允许匹配的输入包括
    【cx ec】
    【cx ech】
    【cxd ec】
    【cxd echy】
    【cxd echyis】等等。
  • 上述编码的空格只是为了区分,实际不需要输入。
  • ▶ N+N规则类似于常用的拼音输入法中的简拼。
信息

N+N规则在最近更新的版本中放弃了N=1的支持,这是因为山人码单字码表的使用编码总数庞大(九万余个编码),如果允许N=1,输入编码会触发大量的码表查询工作,严重影响性能。
如输入【rtnn】,则会对音节(形码在方案实现上被视作音节进行组合预测)进行划分为【r·tnn】【rt·nn】【rtn·n】【rtnn·】【r·t·nn】【r·tn·n】【r·t·n·n】等等可能的情况,每种情况都将进行N规则扩展后在词典中查询。若允许N=1,r,t,n为前缀的编码是相当大量的,仅【r·t·n·n】一条就将会被扩展成海量音节组合进行查询,因此带来较大性能负担
相对的,普通拼音输入法所使用的编码总数对应普通话合法音节数,数量仅约为四百个,使用N=1就带来的性能负担会小得多。

4+1规则

  • ▶ 4+1规则是N+N规则的扩展
  • ▶ 所有词库内的长度大于5的词组均可使用4+1输入规则
  • ▶ 4+1规则允许输入只取词组前四个字和最后一字的单字编码进行N+N输入
  • ▶ 如词组「全国人民代表大会」:
    在N+N规则下允许使用基于【rgwn agvk rn ni rjyn cyi nr rwvn】的变换进行输入, 同时也允许在4+1规则下基于【rgwn agvk rn ni rwvn】的变换进行输入,如【rg ag rn ni rw】。
信息

上述两个规则所适用的单字编码取码范围如下:

  1. 单字根字允许取标准码
  2. 多字根字允许取常用码、特设码

简码规则

  • 部分高频常用词在过去所见的山人码方案中被赋予了“简码”,其编码规则为:
    1. 部分极高频用词仅取词组各个单字编码的首位作为简码,如【网络 ay】【时候 br】【出来 cm】【为了 dl】等
    1. 部分高频用词取词组第一个字编码的前两位,再取剩余单字编码的首位,如【内容 ara】【实在 asf】等
  • 山人码LTS对这些“简码”做了继承,具体编码用词见项目仓库的【简码码表】