摘要:
python爬虫 解析库的安装(lxml、Beautiful Soup、pyquery) 简介 抓取网页代码之后,下一步就是从网页中提取信息。提取信息的方式有多种多样,可以使用正则来提取,但是写起来相对比较繁琐。这里还有许多强大的解析库,如lxml、Beautiful Soup、pyquery等,此 阅读全文
摘要:
python爬虫 aiohttp的安装 简介 之前介绍的requests库是一个阻塞式的HTTP请求库,当我们发出一个请求后,程序会一直等待服务器相应,直到得到相应后,程序才会进行下一步处理,其实,这个过程比较耗费时间。如果程序可以在这个等待过程中做一些其他的事情,如进行请求的调度、响应的处理等,那 阅读全文