06 2017 档案
摘要:原理介绍,cppjieba作者对于HMM的介绍和分词中的应用: http://yanyiwu.com/work/2014/04/07/hmm-segment-xiangjie.html 读后感: 1.基于统计模型 2.利用HMM模型公式简化,简化到可以根据大规模语料进行增强 3.3个矩阵 一个是初始
阅读全文
posted @ 2017-06-26 17:16
dodng
摘要:1.关键词提取 github地址:https://github.com/yanyiwu/cppjieba 1.切词 2.过滤掉单个字的词和停用词 3.时使用TF-IDF计算,TF为 (词频* 1.0),IDF从外部文件的词表中获得如果不存在就赋为平均的IDF 代码如下 2.词典说明: ## 分词 #
阅读全文
摘要:1.cout<< xxx << endl 转换为string #include<sstream> #include<iostream> #include<string> using namespace std; int main() { stringstream conv; conv<<"Initi
阅读全文
posted @ 2017-06-26 10:47
dodng

浙公网安备 33010602011771号