信息检索与排序模型之布尔模型
摘要:在学习布尔模型之前首先让我们了解一下模型的基本概念为后面的学习奠定基础。模型是采用数学工具对现实世界某种事物或某种运动的抽象描述,面对相同的输入,模型输出应能够无限地逼近现实世界的输出(如:天气预报模型)。 信息检索模型就是表示文档与用户查询以及查询与文档的关系框架。下图是常用的信息检索模型以及所支撑其的相关数学背景。信息检索模型以及支撑的数学背景信息检索模型以及支撑的数学背景布尔模型描述:文档(用D表示)—— 一个文档被表示为关键字的集合;查询式(用Q表示)—— 用于表示用户查询的关键词的布尔组合,并用“与(And)、或(or)、非(Not)”链接起来,且用括号知名优先次序;举例下面有2个文
阅读全文
HITS算法解析与光年论坛的两个问题
摘要:最近在研究文本聚类与文本分类这些东西,觉得这些都是seo中非常核心而且非常基础的算法和处理,如果不能好好地把握到核心,很多处理的过程并不能很好地理解,虽然很多人不屑于基础理论的建设。HITS算法是一个非常常见的算法,无数的seoer都了解或者阅读过百度百科,不过,对于HITS算法的深层次理解的人想来却不是很多,例如最近在光年论坛上讨论的两个帖子,一个是Hub主题确定处理现象,就是说首页由于内页的一个链接,导致在搜索内页title时候出现结果却是首页http://www.gnbase.com/thread-12078-1.html,另一个是GSA的测试http://www.gnbase.com/
阅读全文
生活是一张seo的网络
摘要:生活是一张seo的网络我们总要走错多少路径,才发现正确的方向?一路走来,蓦然回首,忽然发现自己站在一张空白的起点,周围的一切那么真实,却又有点不熟悉。昨天晚上去红袖原本想采集几篇文章弄在博客上,看着看着那些熟悉的字句,忽然想到,谁还在写着这些诗歌,这些散文,这些散文诗还能令谁感到振奋?会不会是另一个我,或者是以后N年的后的我,抱着这些熟悉文字感叹这些时光匆匆……没有人可以肯定这些不会发生,就像2年前我还想着等我大学毕业了,我去做个老师,去红袖好好写些文字,我要好好地码字,好好地做一个热爱文字的人。可是现在,思维里早就忘记了这些文字曾有过温度,这些文字都是鲜活可爱的,他们之于我现在就是几个可怜的
阅读全文