idhttp--选秀榜selectop.com网站内容管理系统之二 (9-12 23:03)

      网页采集选择indy控件的idhttp,获取网页的页面和文件有两种不同存储方式,网页用string,文件用stream。

      代码如下:
        StrSource:=IdHTTP1.Get('www.selectop.com'); 取出网页

取文件如下:(参考http://repro.blogbus.com/logs/42810637.html重新学编程)      
MyStream:=TMemoryStream.Create;
try
    //下载我站点的一个ZIP文件
    IdHTTP1.Get('http://www.138soft.com/download/Mp3ToExe.zip',MyStream);
except//INDY控件一般要使用这种try..except结构.
    Showmessage('网络出错!');
    MyStream.Free;
    Exit;
end;
MyStream.SaveToFile('c:\Mp3ToExe.zip');
MyStream.Free;

      防假死,放一个IdAntiFreeze1,

    关于图片识别码的问题,这要用cookie,从网上搜索未找到好的答案。个人认为,网站对于自动发贴,自动注册是严历打击,好像游戏中的打外挂。现有的外挂日子验证过些,一周游戏更新一到两次,每次调整下算法,几分钟的事,破解者就要忙一阵子。

      对于图片识别码的研究也就放弃,做好关键功能更重要。    

       批量采集,运行下来,有时提示出错。估计是内在漏洞,退出再进出,就OK。100多个博客及圈子,也就操作20分钟。

posted @ 2009-09-13 16:40  网销通  阅读(243)  评论(0)    收藏  举报