摘要: python爬虫 解析库的安装(lxml、Beautiful Soup、pyquery) 简介 抓取网页代码之后,下一步就是从网页中提取信息。提取信息的方式有多种多样,可以使用正则来提取,但是写起来相对比较繁琐。这里还有许多强大的解析库,如lxml、Beautiful Soup、pyquery等,此 阅读全文
posted @ 2020-10-24 10:27 等风吹来 阅读(348) 评论(0) 推荐(0) 编辑
摘要: python爬虫 aiohttp的安装 简介 之前介绍的requests库是一个阻塞式的HTTP请求库,当我们发出一个请求后,程序会一直等待服务器相应,直到得到相应后,程序才会进行下一步处理,其实,这个过程比较耗费时间。如果程序可以在这个等待过程中做一些其他的事情,如进行请求的调度、响应的处理等,那 阅读全文
posted @ 2020-10-24 10:07 等风吹来 阅读(586) 评论(0) 推荐(0) 编辑