fcitx5-pinyin要一统江湖了

为了面向未来，又装上fcitx5细细品了一下。转换正确率很高。

于是apt source fcitx5-pinyin看了下，发现两个2012年的文件：

用这两个文件就能达到如此好的效果？这不科学啊！

莫非默认开启了云输入？抓包啥的我不擅长，干脆断网，还是一样。

然后发现源码里有：
　　StandardPath::Type::Data, "libime/sc.dict"

然后apt list --installed | grep libime

dpkg -L libime-data发现

dpkg -L libime-data-language-model:

这就说得通了嘛。This adds up.

这些天我发表了不少错误言论，索性再来几个：

看大小是bi-gram. Sunpinyin的LM肯定是tri-gram，但造路径的代码好像(very much like) bi-gram.
fcitx5可以直接加载搜狗的细胞词库，不必先转成文本文件。不过它这个代码可能有个别词库处理不了，但搜狗只是改了下偏移量。〔详情〕
虽然在xfce下的360浏览器里不能输入(/etc/environment, /etc/profile, 360.desktop里放环境变量都试了)，但在编辑器里输入再贴过来也不麻烦。

谁活不重要，搜狗死翘翘就好:-)，不死我“眼不见心不烦”，不装它也能输汉字嘛。
似曾相似: Windows 3.2中文版出来后，四通利方等中文平台都没了。也许最后收尾的是Debian Input Method Team甚至AI. 音字转换也是种“翻译”和prompt. 输入xie pian gong zuo bao gao，后面的全都不用输入了。:-)
再鼓吹下GB2312汉字的bi-gram. 数据充盈速度快。比如用户打开现有文档，自动或点个按钮立刻用文档全文更新LM，文档里有的词马上就能转换对。有backoff的tri-gram目前还做不到秒出吧？

这句话没错：元音的英语是vowel不是vocal.

# apt install fcitx

升级了 0 个软件包，新安装了 115 个软件包，要卸载 0 个软件包，有 16 个软件包未被升级。
需要下载 82.8 MB 的归档。解压缩后会消耗 334 MB 的额外空间。

Ahhhh! 还好网速快。重启后浏览器里能输入汉字啦^_^。又开始删包了。

dpkg-query -W -f='${Installed-Size}\t${Package}\n' | sort -nr

posted @ 2025-11-23 20:00 华容道专家阅读(85) 评论(0) 收藏举报

刷新页面返回顶部

Penilum meum pullo sententia Latin a est 「通过浪费时间获得快乐」