摘要: 能够实现基于给出的网页连接爬取html后 进行正文内容的提取(测试网页反应情况良好) 通过正则表达式匹配左右给定的字符串,可以获取对应的数字。 通过设定左右字符串分别为”地区生产总值“和”亿元“,可以爬取出地区生产总值为1576.69 目前存在的问题: 1. 设想通过excel直接生成搜索关键词,并 阅读全文
posted @ 2017-11-09 14:12 pppeony 阅读(1398) 评论(0) 推荐(0)