2017 年 6月随笔档案 - dodng

中文分词--HMM用于切词

摘要：原理介绍，cppjieba作者对于HMM的介绍和分词中的应用： http://yanyiwu.com/work/2014/04/07/hmm-segment-xiangjie.html 读后感： 1.基于统计模型 2.利用HMM模型公式简化，简化到可以根据大规模语料进行增强 3.3个矩阵一个是初始阅读全文

posted @ 2017-06-26 17:16 dodng

cppjieba的使用

摘要：1.关键词提取 github地址:https://github.com/yanyiwu/cppjieba 1.切词 2.过滤掉单个字的词和停用词 3.时使用TF-IDF计算，TF为 (词频* 1.0),IDF从外部文件的词表中获得如果不存在就赋为平均的IDF 代码如下 2.词典说明: ## 分词 # 阅读全文

posted @ 2017-06-26 14:19 dodng 阅读(3383) 评论(0) 推荐(0)

常见的编程小技巧

摘要：1.cout<< xxx << endl 转换为string #include<sstream> #include<iostream> #include<string> using namespace std; int main() { stringstream conv; conv<<"Initi 阅读全文

posted @ 2017-06-26 10:47 dodng

dodng

广度探索and深度挖掘

06 2017 档案

公告