King_K

导航

2015年2月3日 #

第十章 PageRank——Google的民主表决式网页排名技术

摘要: 搜索引擎的结果取决于两组信息:网页的质量信息,这个查询与每个网页的相关性信息。这里,我们介绍前一个。1.PageRank算法原理 算法的原理很简单,在互联网上,如果一个网页被很多其他网页所链接,说明它收到普遍的承认和信赖,那么它的排名就高。比如我们要找李开复博士,有100个人举手说自己是李开复... 阅读全文

posted @ 2015-02-03 19:03 King_K 阅读(566) 评论(0) 推荐(0) 编辑

利用sklearn进行tfidf计算

摘要: 转自:http://blog.csdn.net/liuxuejiang158blog/article/details/31360765?utm_source=tuicool 在文本处理中,TF-IDF可以说是一个简单粗暴的东西。它可以用作特征抽取,关键词筛选等。 以网页搜索“核能的应... 阅读全文

posted @ 2015-02-03 18:59 King_K 阅读(10556) 评论(0) 推荐(0) 编辑