中文繁简字对照表(继) 保留一简多繁的映射关系
摘要:
接上一篇文章中文繁简字对照表讨论的问题:去掉[中文繁简字对照表.txt]中不通用的字(以word为依据),并保留一简多繁的映射关系。下面讲述一下实现步骤:1.将[繁体字.txt]中的简体字抽取出来,作为要剔除的字的样本。 (执行时比对[繁体字.txt]与[简体字.txt],它们公共的字即为要剔除的字)2.在[中文繁简字对照表.txt]中遍历简体字,若遍历到的字不在样本中,则添加到新字符串中;否则,用"x=x;"占位。将得到的字符串导出保存为[中文繁简字对照表[修正版2].txt]。具体实现细节可以参考下面贴出的代码,这里讲一下注意的地方:由于发现已经剔除的字与要剔除的字不完 阅读全文
posted @ 2012-08-21 21:35 qinxike 阅读(2711) 评论(0) 推荐(0)
浙公网安备 33010602011771号