吾思语

语言与语言技术(语言与翻译、翻译技术、输入技术)

博客园 首页 新随笔 联系 订阅 管理

1. 眼前、后顾与前瞻

(1) 眼前:眼前看到的是尚未确定的输入内容,该内容显示在写作窗口中,包括编码和已经转换但等待确认的文字(主要是汉字)。如果编码的转换产生重码,则会通过候选窗口来显示,以供用户选择。如果眼前的内容只容许单字,则为基于单字的输入法;如果眼前的内容还容许词组,则为基于词组的输入法;如果眼前的内容更容许短语,则为基于短语的输入法;如果眼前的内容再容许句子,则为基于语句的输入法;如果眼前的内容容许整篇文章,则为基于篇章的输入法,或称编码文件转换法。

(2) 后顾:对于眼前无法确认的内容,借助已经输入的而不再显示的内容来增强其确定性。这种输入法的输入历史是有记忆的,能记住多少历史内容,因设计和计算能力而定。对于汉字文本来说,按照目前设备的计算能力,一般使用基于字的4-gram或基于词的2-gram。

(3) 前瞻:对于眼前无法确认的内容,等待将来输入的编码或文字来增强其确定性。

2. 输入窗口与转换窗口:输入窗口仅包含眼前输入的内容,而转换窗口还可以包括历史和/或未来的输入内容。所以,转换窗口并不一定是完全可见的,但它可能影响输入窗口中的内容。

posted on 2016-05-07 09:41  Daniel Dai  阅读(277)  评论(0编辑  收藏  举报