使用friso中文分词注意

friso是使用c语言开发的一款中文分词器,使用流行的mmseg算法实现。完全基于模块化设计和实现,可以很方便的植入到其他程序中,例如:MySQL,PHP等。目前只支持
UTF-8 编码。 源码无需修改就能在各种平台下编译使用,加载完20万的词条,内存占用稳定为13.5M。
官方首页: https://code.google.com/p/friso
下载地址: https://code.google.com/p/friso/downloads/list

C++等引用,添加头文件时要注意:

extern "C"
{
#include "friso_API.h"
#include "friso.h"
}

friso中的字典等最好不要使用中文路径,否则很悲催。

 

 

posted on 2013-12-11 17:23  鸳都学童  阅读(833)  评论(0)    收藏  举报

导航