fcitx5-pinyin要一统江湖了

为了面向未来,又装上fcitx5细细品了一下。转换正确率很高。

于是apt source fcitx5-pinyin看了下,发现两个2012年的文件:

  • 1.4M 2012年12月 2日 py_stroke.mb
  • 359K 2012年11月25日 py_table.mb

用这两个文件就能达到如此好的效果?这不科学啊!

莫非默认开启了云输入?抓包啥的我不擅长,干脆断网,还是一样。

然后发现源码里有:
  StandardPath::Type::Data, "libime/sc.dict"

然后apt list --installed | grep libime

  • libime-bin/oldstable,now 1.0.16-1
  • libime-data-language-model/oldstable,now 1.0.16-1
  • libime-data/oldstable,oldstable,now 1.0.16-1
  • libimecore0/oldstable,now 1.0.16-1
  • libimepinyin0/oldstable,now 1.0.16-1
  • libimetable0/oldstable,now 1.0.16-1

dpkg -L libime-data发现

  • 5.8M /usr/share/libime/sc.dict

dpkg -L libime-data-language-model:

  • 17M /usr/lib/x86_64-linux-gnu/libime/zh_CN.lm
  • 4.7M /usr/lib/x86_64-linux-gnu/libime/zh_CN.lm.predict

这就说得通了嘛。This adds up.

这些天我发表了不少错误言论,索性再来几个:

  • 看大小是bi-gram. Sunpinyin的LM肯定是tri-gram,但造路径的代码好像(very much like) bi-gram.
  • fcitx5可以直接加载搜狗的细胞词库,不必先转成文本文件。不过它这个代码可能有个别词库处理不了,但搜狗只是改了下偏移量。〔 详情
  • 虽然在xfce下的360浏览器里不能输入(/etc/environment, /etc/profile, 360.desktop里放环境变量都试了),但在编辑器里输入再贴过来也不麻烦。
    • 我不需要Wayland,过两天再换回fctix(4)和华宇拼音。哦,还是麻烦。改完此帖就换。不食言而肥者,几希。
  • 谁活不重要,搜狗死翘翘就好:-),不死我“眼不见心不烦”,不装它也能输汉字嘛。
  • 似曾相似: Windows 3.2中文版出来后,四通利方等中文平台都没了。也许最后收尾的是Debian Input Method Team甚至AI. 音字转换也是种“翻译”和prompt. 输入xie pian gong zuo bao gao,后面的全都不用输入了。:-)
  • 再鼓吹下GB2312汉字的bi-gram. 数据充盈速度快。比如用户打开现有文档,自动或点个按钮立刻用文档全文更新LM,文档里有的词马上就能转换对。有backoff的tri-gram目前还做不到秒出吧?

这句话没错:元音的英语是vowel不是vocal.

# apt install fcitx

升级了 0 个软件包,新安装了 115 个软件包,要卸载 0 个软件包,有 16 个软件包未被升级。
需要下载 82.8 MB 的归档。解压缩后会消耗 334 MB 的额外空间。

Ahhhh! 还好网速快。重启后浏览器里能输入汉字啦^_^。又开始删包了。

dpkg-query -W -f='${Installed-Size}\t${Package}\n' | sort -nr
posted @ 2025-11-23 20:00  华容道专家  阅读(11)  评论(0)    收藏  举报