导航

2013年5月14日

摘要: 先说一下采集的原理吧。一内容:当我们采集内容的时候,可以发现内容页都是用的同一个模板,即样子一样,内容不一样。所以我们可以在html代码中找到显示内容的那个html代码的开始和结尾。如内容页html代码为:<p><b>这里是内容一</b></p>则所有内容页都是以<p><b>开始 以</b></p>结尾,它们中间的那一段是内容。我们提取的就是它们之前的那一段。它的规则设置在上图的 内容配置 这个tab里。二 网址: 内容页的内容我们已经找到规律了,可以抓取了。但内容页的网址从哪里来呢,那当然是列表页 阅读全文

posted @ 2013-05-14 20:21 曙光城邦 阅读(494) 评论(0) 推荐(0)

摘要: 之前用dedecms做了电影站,写了采集规则。之后做成了半自动化采集。每天只需上去采集生成一下静态页面。可是电影下载网站竞争很残酷啊,因为采集基本没有原创而且电影下载百度指数太高,网站只收录了两页,基本没有访问量。 最近又学习了一下淘宝客的思路,利用百度指数可以查看一个关键词的搜索量,从而可以选取一些热度低一点的词,然后看是否有同类网站,从而选择一个方向。总之啊,选择真的是远大于努力,方向不对努力白费! 这次淘宝客做站,也注意了一些seo方面的事项。也还在摸索和学习阶段。 不管最终效果如何,一路上也学习了很多的东西,后面有效果的话,和大家分享一下成功的经验,当然成功是建立在失败之上,毕竟我不是 阅读全文

posted @ 2013-05-14 19:31 曙光城邦 阅读(208) 评论(0) 推荐(0)