2012年8月4日

TSE中关于分词的算法的改写--最少切分

摘要: 今天比较闲,想到以前也看了好多tse的代码,还没有上手改过呢,一时也不知从何入手,后来在书上看到了分词的算法,TSE用的是正向最大匹配,其中貌似有个好玩的算法-----最少切分,捣鼓了一下午,终于把代码弄出来了。如果有人有兴趣的话,在HzSeg中修改SegmentSentenceMM函数的代码,将s2+=SegmentHzStrMM(dict, s1.substr(0,i));改成s2+=SegmentHzStr_min_cut(dict, s1.substr(0,i));就OK了。代码显得还是有些冗余,还是有优化的余地的,有时间再改吧。 1 string get_res(map<int 阅读全文

posted @ 2012-08-04 22:20 kakamilan 阅读(1535) 评论(0) 推荐(0)

全组和问题

摘要: 1 #include <iostream> 2 #include <string> 3 #include <vector> 4 #include <queue> 5 #include <algorithm> 6 #include <cstdio> 7 using namespace std; 8 9 #define MAX_N 1010 int n; //共n 个数11 int rcd[MAX_N]; // 记录每个位置填的数12 int num[MAX_N]; // 存放输入的n 个数13 int usd[MAX_N]; 阅读全文

posted @ 2012-08-04 13:54 kakamilan 阅读(133) 评论(0) 推荐(0)

全排列问题

摘要: 全排列 1 #include <iostream> 2 #include <string> 3 #include <vector> 4 #include <queue> 5 #include <algorithm> 6 #include <cstdio> 7 8 using namespace std; 9 #define MAX_N 1010 int n; //共n 个数11 int rcd[MAX_N]; //记录每个位置填的数12 int used[MAX_N]; //标记数是否用过13 int num[MAX_N] 阅读全文

posted @ 2012-08-04 13:18 kakamilan 阅读(146) 评论(0) 推荐(0)

导航