会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
kfpa
博客园
首页
新随笔
联系
管理
订阅
2017年10月19日
C++里将string类字符串(utf-8编码)分解成单个字(可中英混输)
摘要: 最近在建词典,使用Trie字典树,需要把字符串分解成单个字。由于传入的字符串中可能包含中文或者英文,它们的字节数并不相同。一开始天真地认为中文就是两个字节,于是很happy地直接判断当前位置的字符的ASCII码是否处于0~127之间,如果是就提取一个字符,否则提取两个。在测试分字效果的时候,这种方法
阅读全文
posted @ 2017-10-19 16:49 KFPA
阅读(2189)
评论(0)
推荐(0)
公告