随笔分类 - 爬虫抓取数据

爬虫抓取5大门户网站和电商数据day1:基础环境搭建

摘要：最新想用爬虫实现抓取五大门户网站（搜狐、新浪、网易、腾讯、凤凰网）和电商数据（天猫，京东，聚美等），今天第一天先搭建下环境和测试。采用maven+xpath+ HttpClient+正则表达式。 maven pom.xml配置文件信息 <dependency> <groupId>junit</g 阅读全文

posted @ 2016-02-25 11:20 zhanggl 阅读(2096) 评论(0) 推荐(0)

随笔分类 - 爬虫抓取数据

公告