会员
周边
捐助
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
hustlijian
博客园
首页
博问
闪存
新随笔
订阅
管理
2015年3月20日
一个网络爬虫的分析
摘要: 说明这个爬虫是从outofmemory看到的,只有100行,内容是抓取淘宝商品信息,包括商品名、卖家id、地区、价格等信息,json格式,作者说他曾经抓取到了一千万条信息。出于对这个爬虫能力的感叹,我好奇的对它进行了分析,发现原理是如此的简单,感叹python的强大之余,好也把分析的心得记录一下,引...
阅读全文
posted @ 2015-03-20 14:38 hustlijian
阅读(3812)
评论(0)
推荐(0)
编辑