摘要: 之前项目中也遇到了对文档的相关性进行分析。今天看到了《数学之美》的一篇文章,谈到谷歌使用余弦定理为文档进行相关性搜索,感觉特别有趣,在此记录。计算机只能进行快速的计算,它读不懂新闻,图片,因此,对于新闻的描述、归类是件很麻烦的事情,曾经听百度介绍,为了给图片库的图片打上标签,他们开发了一款游戏,在游戏过程中,玩家输入图片描述,通过此法,才完成了对大量图片的描述构建。然而,谷歌,利用余弦定理,轻松地对心肺分类和整理进行自动化。主要分为几步:step1:维护一张词汇表,这张词汇表中记录平时新闻中经常出现的字、词例如:1、啊 2、中国 3、的4、报到。。。。。。。 10000、冬天step2:统计每 阅读全文
posted @ 2012-03-04 18:52 KAYAK 阅读(951) 评论(0) 推荐(0) 编辑