eastcowboy

 

随笔分类 -  搜索引擎技术

A*算法的一份C语言实现品!
摘要:#include ”stdio.h“ #include “conio.h” #include ”assert.h“ #include“stdlib.h” #define MAPMAXSIZE 100 //地图面积最大为 100x100 #define MAXINT 8192 //定义一个最大整数, 地... 阅读全文

posted @ 2009-08-18 21:12 eastcowboy 阅读(357) 评论(0) 推荐(0)

[转载]中文分词免费源码资源
摘要:1。http://www.chinesecomputing.com/nlp/segment.html此链接介绍了很多分词资源。注意看其第二项(ASimplified Chinese Segmenter written in Perl)。里面有Perl和Java版的简体中文分词程序,完全free。我试了一下,效果不错。网上很多人向Lucene中添加中文分词时用的都是中科院ICTCLAS的接口。而中科... 阅读全文

posted @ 2009-08-18 21:10 eastcowboy 阅读(305) 评论(0) 推荐(0)

Smoothing of Language Model
摘要:本文主要让读者快速学习Language Model。语言模型最初在语音识别领域中应用,然后逐渐将起扩展到各个领域OCR、手写识别、统计机器翻译、拼写校正、信息检索等各个领域。基本Language Model 主要涉及(1) LM的定义.(2) N-gram作为LM的主要工具.下面所涉及都指N-gram(3) LM链式规则.(4) LM MLE(Maximum LikelihoodEstimatio... 阅读全文

posted @ 2009-08-18 21:08 eastcowboy 阅读(628) 评论(0) 推荐(0)

文本聚类
摘要:摘要:常用聚类算法介绍ATutorial on Clustering Algorithms 阅读全文

posted @ 2009-08-18 21:06 eastcowboy 阅读(196) 评论(0) 推荐(0)

自然语言处理领域的相关算法!
摘要:开始收集相关算法!1.PorterStemming算法(词干抽取) http://tartarus.org/~martin/PorterStemmer/ 里面有各个版本的词干抽取算法的实现。2.Lawrence Philips' Metaphone Algorithm http://aspell.net/metaphone/里面有各个版本此算法的实现!附一篇简要介绍此算法相关背景的文章An Int... 阅读全文

posted @ 2009-08-18 21:05 eastcowboy 阅读(883) 评论(0) 推荐(0)

导航