美文网首页
输入法 原理

输入法 原理

作者: ltochange | 来源:发表于2021-07-11 22:41 被阅读0次

    转自 《电脑爱好者》2014第9期 妙手生花的背后——输入法原理解密
    http://m.cfan.com.cn/article/65

    文字输入过程主要是:
    输入编码,然后根据编码选择所需字符的过程。
    因此Windows系统下汉字输入法实际就是:将输入的标准ASCII字符串(英文字符),按照一定的(编码规则)转换为汉字或词组。在将英文字符转换成汉字的过程中,码表文件(字库)起到了关键作用,码表文件有点类似英汉词典,将特定组合的英文字符与汉语字词一一对应起来。
    如下图的搜狗字库:


    这里写图片描述

    要是的输入法高效,应该要满足一下几个条件:

    1.全面才会准确

    日常使用中我们需要输入一些生僻字、网络流行语,如果输入法的字库不够全面的话就无法输入。现在的输入法一方面借助本地字库,另一方面则充分发挥“云字库”优势,可以将生僻字、网络流行语等一网打尽。

    云字库:应该会保留最近用户的输入记录吧,当过了一段时间,某一条记录达到一定的频次,应该就会作为本地字库保留下来。而那些长时间频次只是很小的,可能就会被作为错词剔除。

    2.输入法“猜你喜欢” 个性化

    好的词库还需要搭配智能的算法,只有依靠智能算法才能将字库的功能充分发挥出来。现在大多数输入法能够自动分析用户的输入,选择和调整接下来文字显示的优先级,这样既可以可以大大降低词语拼错的可能性,同时方便用户高效选择输入,这种功能的实现是借助输入法后台强大的算法实现的。比如搜狗输入法,在你首次输入“dnahz”并选择“电脑爱好者”后,它就会“记忆”下你的选择,等再次输入“dnahz”,它就会智能判断你可能要输入“电脑爱好者”,于是将这一词组调整到优先选择的位置。如果你多次输入“dnahz”但选择的是不同的词组,这时输入法的算法程序会根据你选择的频率(选的最多),将你最有可能想要的结果放在优先的位置

    3.统计是智能算法的核心

    上面的根据词频调整,已经具有初步的学习功能了,而优秀的输入法还可以(智能联想、智能纠错、智能组句)。有时我们会发现,刚刚输入一两个字母,输入法就已经给出我们想要的长长的词组,非常智能。这些看起来有些神秘,但它们的算法核心其实很简单,就是统计。

    聊天、写作、打报告,你每天究竟打了多少字,也许你自己并不清楚,但你所用的输入法却在默默地记录着,你每一次的输入每一次的选择,都会纳入它统计的数据中,正是根据这些数据分析得出你常用的词语,以及你特殊的喜好和选择。所以,并非输入法“聪明”,而是我们自己“出卖”了自己。

    4.输入法搞“兼职”

    除了识别编码的输入,现在输入法的扩展功能也越来越多。一方面是扩展字符的输入方式,比如为了方便用户输入不会读音但会写的汉字,搜狗输入法提供了手写组件,启动该组件后只要使用鼠标将字写出来,我们就可以在识别框进行选择输入
    怎么得到候选的匹配字形?

    另一方面则将输入法和其他相关的功能关联起来,比如谷歌输入法就整合其强大的搜索功能,在输入需要搜索的关键字后,只要点击状态栏的谷歌图标,这样即可自动打开谷歌的搜索页面进行搜索

    相关文章

      网友评论

          本文标题:输入法 原理

          本文链接:https://www.haomeiwen.com/subject/yxplpltx.html