摘要: 网络爬虫一般分为两个过程: 1.通过网络连接获取网页内容,即以HTML语言写成的网页源代码;(主要是掌握requests库) 2.对获得的网页内容进行处理,可通过re(正则表达式)、beautifulsoup4等函数库来处理。 requests库: get()是获取网页最常用的方式,在调用reque 阅读全文
posted @ 2020-02-05 12:18 陈振铭 阅读(164) 评论(0) 推荐(0) 编辑