会员
周边
新闻
博问
AI培训
云市场
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
清风君
我本一缕清风,逍遥天地间...
管理
2014年8月21日
nutch 抓取需要登录的网页
摘要: 题记:一步一坑,且行且珍惜 最近接到任务,要利用nutch去抓取公司内部系统的文章,可是需要登录才能抓到。对于一个做.net,不熟悉java,不知道hadoop,很少接触linux的我,这个过程真是艰难且痛苦的,盲人摸象搬的折腾出来了,但是我对hadoop还是没了解。这个东西在网上真的很难查到...
阅读全文
posted @ 2014-08-21 21:21 清风君
阅读(2884)
评论(0)
推荐(0)
编辑
公告