fcitx5-pinyin要一统江湖了
为了面向未来,又装上fcitx5细细品了一下。转换正确率很高。
于是apt source fcitx5-pinyin看了下,发现两个2012年的文件:
- 1.4M 2012年12月 2日 py_stroke.mb
- 359K 2012年11月25日 py_table.mb
用这两个文件就能达到如此好的效果?这不科学啊!
莫非默认开启了云输入?抓包啥的我不擅长,干脆断网,还是一样。
然后发现源码里有:
StandardPath::Type::Data, "libime/sc.dict"
然后apt list --installed | grep libime
- libime-bin/oldstable,now 1.0.16-1
- libime-data-language-model/oldstable,now 1.0.16-1
- libime-data/oldstable,oldstable,now 1.0.16-1
- libimecore0/oldstable,now 1.0.16-1
- libimepinyin0/oldstable,now 1.0.16-1
- libimetable0/oldstable,now 1.0.16-1
dpkg -L libime-data发现
- 5.8M /usr/share/libime/sc.dict
dpkg -L libime-data-language-model:
- 17M /usr/lib/x86_64-linux-gnu/libime/zh_CN.lm
- 4.7M /usr/lib/x86_64-linux-gnu/libime/zh_CN.lm.predict
这就说得通了嘛。This adds up.
这些天我发表了不少错误言论,索性再来几个:
- 看大小是bi-gram. Sunpinyin的LM肯定是tri-gram,但造路径的代码好像(very much like) bi-gram.
- fcitx5可以直接加载搜狗的细胞词库,不必先转成文本文件。不过它这个代码可能有个别词库处理不了,但搜狗只是改了下偏移量。〔 详情〕
- 虽然在xfce下的360浏览器里不能输入(/etc/environment, /etc/profile, 360.desktop里放环境变量都试了),但在编辑器里输入再贴过来也不麻烦。
- 我不需要Wayland,过两天再换回fctix(4)和华宇拼音。哦,还是麻烦。改完此帖就换。不食言而肥者,几希。
- 谁活不重要,搜狗死翘翘就好:-),不死我“眼不见心不烦”,不装它也能输汉字嘛。
- 似曾相似: Windows 3.2中文版出来后,四通利方等中文平台都没了。也许最后收尾的是Debian Input Method Team甚至AI. 音字转换也是种“翻译”和prompt. 输入xie pian gong zuo bao gao,后面的全都不用输入了。:-)
- 再鼓吹下GB2312汉字的bi-gram. 数据充盈速度快。比如用户打开现有文档,自动或点个按钮立刻用文档全文更新LM,文档里有的词马上就能转换对。有backoff的tri-gram目前还做不到秒出吧?
这句话没错:元音的英语是vowel不是vocal.
# apt install fcitx
升级了 0 个软件包,新安装了 115 个软件包,要卸载 0 个软件包,有 16 个软件包未被升级。
需要下载 82.8 MB 的归档。解压缩后会消耗 334 MB 的额外空间。
Ahhhh! 还好网速快。重启后浏览器里能输入汉字啦^_^。又开始删包了。
dpkg-query -W -f='${Installed-Size}\t${Package}\n' | sort -nr

浙公网安备 33010602011771号