05 2018 档案
摘要:不多介绍,可自行Google,或者其它关键词: "datrie" 放代码链接: "double_array_trie.py" 因为也是一段学习代码,参考的文章都记在里面了,主要参考github项目: komiya atsushi/darts java。 另外,增加了一个从某叶子节点回溯得到字符串的方
阅读全文
摘要:通过unihan的文件来实现。 只要是unihan中有kTotalStrokes字段,获取其笔画数。 Hash也是非常简单清楚的,但想到这些unicode其实会有一个分布规律,就记录了一下, 利用此性质通过数组方式来获取笔画。 记录了一下unicode的范围 start: [13311, 19968
阅读全文
摘要:"0 背景" "1 文件" + "1.1 IRG Sources" + "1.2 Dictionary Indices" + "1.3 Dictionary like Data" + "1.4 Other Mappings" + "1.5 Radical stroke Indices" + "1.6
阅读全文
摘要:阅读目录 "1. Z轴上的区别" "2. 问题" Unihan 的 kZVariant 字段 译自: en.wikipedia.org/wiki/Z variant | 已发布zh.wiki 在Unicode中,如果两个字形共享相同的词源(etymology),但外观和Unicode字符编码稍有不同
阅读全文

浙公网安备 33010602011771号