2019 年 8月 12 日随笔档案 - 波哥产品

2019年8月12日

摘要：时间不等人，我学爬虫的近期目的是爬取一个网站的资源，主要是在大量的伪html中访问url不断请求数据，关键问题在正则表达和访问速度上。 1/简单的爬虫架构示例 2/ 运行流程 3/URL管理器网页下载器-urllib2 网页解析器-正则表达式、html.paser、BeautifulSoup、I 阅读全文

posted @ 2019-08-12 23:08 波哥产品阅读(162) 评论(0) 推荐(0)

公告