采集器的比较--选秀榜selectop.com网站内容管理系统之一

      帮客户建一个基于MySQL的PHP网站,里面有一个模块是网页内容采集。首先是上google,baidu狂搜索。找到一个PHP的小蜜蜂beecollector,带源代码。

      小蜜蜂基本能用,最后更新日期是2006年中,因为是开放源码,找不到新的版本,就是付费也可以,只要自己慢慢研究。
      功能上:规则,内容替换等基本行。但采sina博客有些力不从心,搞了一个星期才搞定多页博客文章采集。采集到的文章管理是个头痛的问题,只好放弃。

       重复第一步,虫虫博客2009。费用可能接受,仔细一问,采博客还不行,是群建博客。

       重复第一步,火车头采集器。综合来看,可能是普通中最好的一个。下了个试用版,安装使用都不错。采集真不错,怪不中科院都用(中科院在火车头家旁边)。关键问题又出来了,采集到的文章管理和上传。虽然支持好多种论坛,博客等。

      只剩下长征一条路,自己开发,成本最高的方法之一。

      国人死抓住源代码不放,想二次开发,难。这一方面增加再开发的成本,使更多的智力浪费,这可能是知识产权不保护的恶果。本来10W程序员已足够,但由于知识产权不能正常转移,必须增加到20W的程序员,这多出的10W收入想高都难,出路做外包,说白就是用输出脑力劳动力。

       我在网上放了几个源码,只要尊重版权,可以半买半送。问的人个个想要全部版权,欲占别人的劳动为已有,又不原出全部版权的价。

      这也是我重新开博的原因,发牢骚骂不平,救不了华夏。
    
      只有经济单元的效率,才是制胜之道。

posted @ 2009-09-12 23:03  网销通  阅读(556)  评论(0)    收藏  举报