搜索引擎工作原理

在做SEO优化的过程,除了简单的熟悉掌握关键词选择、关键词布局及关键词的划分以外,还需要了解网站、用户和搜索引擎之间的关系,即搜索引擎如何抓取网站,如何将网站展现给用户?

一、什么是搜索引擎?

所谓的搜索引擎指是一个提供检索的系统,搜索引擎拥有一个特定的抓取程序(爬虫程序,机器人程序),百度的叫做百度蜘蛛,利用这个程序抓取收集互联网上的信息,对于收集来的信息,搜索引擎进行加工整理(去重处理,关键词排名)把加工整理好的页面根据用户搜索的关键词展现给用户的过程。

二、网站、用户、搜索引擎之间的关系

搜索引擎相当于一个中介的平台,网站是提供信息的,用户是需求信息的一方。

用户可以通过搜索引擎的平台找到我们想要的信息。

搜索引擎是免费提供用户搜索,是为了抢占用户,当搜索引擎有了足够多的用户,那么这个时候很多网站的拥有者看到了广告了机会,会选择做搜索引擎的广告。

三、搜索引擎工作原理

搜索引擎工作原理


第一步:爬行

搜索引擎的抓取程序(百度蜘蛛)会沿着网站的链接进行爬行。所以说网站的链接一定要四通八达,不能存在死链接,让蜘蛛可以畅通无阻的在我们的网站上爬行。网站的链接相当于蜘蛛网。

第二步:抓取存储

蜘蛛会把沿着链接爬行所对应的页面存储到自己的原始数据库里面。

第三步:预处理

所谓的预处理其实就是给收集来的信息进行加工整理。

根据网页的标签记录关键词的出现次数,以及关键词的字符长度,来计算这个关键词的密度是否合理,一般正常的一个页面的关键词合理密度控制在2%到8%之间。
(1)、去重处理:对于存储的页面,搜索引擎会计算页面的相似度或者重复度,对于百度数据库里面已经存在的内容,如果大家直接的超的内容,百度会丢弃掉。
(2)、去停止词处理:所谓的停止词指的是的、地、得,啊吗之类的语气词。(内容伪原创)
以上两点处理就要求我们在做优化的时候,创建的内容必须要原创或者伪原创。
(3)、消除噪音处理
所谓的噪音是指网站页面上面挂了很多垃圾广告或者是弹窗。一个好的页面不要装太多垃圾弹窗。

第四步:建立索引

把上面这些步骤处理完了,剩下的网页就会被建立百度的索引库了。比如:蜘蛛一个爬行了100个页面,100个页面被存储到原始数据库。经过加工整理百度删掉了20个相似度很高的页面。还剩下80个页面,把剩下的80个页面根据页面的权重来排序 这个就是索引。其实我们使用的百度的site出来的结果页面就是百度索引库里面释放出来的排序。

第五步:排名

当用户在百度里面搜索关键词的时候,搜索引擎就会把索引库的链接所对应的页面,根据页面的权重做出排名,展现给用户。

关于搜索引擎工作原理,就分为以上几步,作为一个合格SEOer,我们需要经常关注百度的算法改变,那才是最重要的,根据百度算法的更改调整网站优化策略。

posted @ 2017-11-06 11:37  重庆时中文化  阅读(808)  评论(0)    收藏  举报