会员
周边
新闻
博问
AI培训
云市场
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
深蓝居
关注C#、数据库、区块链、商务智能和微软开发技术。
博客园
首页
新随笔
联系
订阅
管理
2012年3月1日
各大输入法分类词库内部格式的简单比较
摘要: 之前一直利用闲暇时间做深蓝词库转换,对各大输入法的分类词库有了一些大概的了解,下面来比较下各个词库格式的特点: 1.搜狗细胞词库scel格式 scel格式是采用Unicode编码了汉字、拼音。整个scel格式的内容是:头信息、词库简介、拼音组合列表、词条列表。scel格式的词条的数据结构设计的还是比较好的,它使用了拼音指针来避免在词条中出现重复的拼音来占据内容,也会把同音词合并在一起,节省空...
阅读全文
posted @ 2012-03-01 14:48 深蓝
阅读(7455)
评论(1)
推荐(2)
编辑
公告