YY6359:网站百度不收录情况解析

网站百度不收录情况解析 一、蜘蛛为什么要不停的爬,不断地更新? ①抓取页面 ②页面解析 ③提取网页中所有链接 ④判断内链和外链 ⑤引入当前列表——对比 网站更新机制——蜘蛛会看到新的文章 网站的结构会内链 ⑥抓取并放出页面 二、搜索引擎如何安排蜘蛛进行网站搜索? 百度原因 ①堆砌关键词 ②链接诱饵 ③对敏感领域的调整 ④百度观察期 三、百度不收录情况解析 搜索引擎遇到 多域名单IP 或是 多域名多IP时 会怎么办?网站本身 3.1框架 搜索引擎很难识别多层嵌套网页 3.2图片多,文字少 导致近似度高 ALT适当设置不相同 3.3过于频繁的提交让搜索引擎误认为此站不稳定 3.4页面静态化有利于搜索引擎爬取。 3.5内链。锚文本的精确度及所在位置(具体设置查看 “关键词权重所在”文章3.6网站服务器不稳定或被攻击 3.7索引robots(是否屏蔽搜索引擎) 3.8网站结构/目录——内容 a:目录不要过深 b:点评(扁平)式网状结构 3.9原创性,质量度 丰富性 本文来自东莞尼嘉斯机械:http://www.xieguang133.com/

posted on 2010-11-12 08:35  xieguang133  阅读(180)  评论(0)    收藏  举报

导航