摘要:
一、缘由 有的时候为了提高爬虫的效率,那么就需要使用各种方法来提高爬虫的效率,无疑多线程是一个非常好的选择。不过在使用的时候,一定要控制好爬取的速率,短时间的访问量不要太大。第一,避免给别人家的服务器造成比较大的影响。第二,方式你的IP或者你的账号被封禁。即使出现第二种情况的时候,我们可以使用由代理 阅读全文
posted @ 2021-08-06 00:15
山水无期
阅读(107)
评论(0)
推荐(0)
摘要:
一、缘由 上一篇输入关键词“口红”,将淘宝中的的相关商品信息全部爬取了下拉,并且以CSV的文件格式储存。我们拿到数据之后,那么就需要对数据进行处理。只是将爬取到的数据以更直观的方式——图表呈现出来。并且最后使用jieba、wordcloud来对商品名称进行词云的分析。 二、代码实现 话不多说,直接上 阅读全文
posted @ 2021-08-06 00:03
山水无期
阅读(481)
评论(0)
推荐(0)

浙公网安备 33010602011771号