摘要: 检查网页源代码 首先让我们来检查豆瓣top250的源代码,一切网页爬虫都需要从这里开始。F12打开开发者模式,在元素(element)页面通过Ctrl+F直接搜索你想要爬取的内容,然后就可以开始编写正则表达式了。 如下是我们将要爬取内容的html局部区域: <div class="item"> <d 阅读全文
posted @ 2022-08-09 13:43 孤飞 阅读(1306) 评论(2) 推荐(5) 编辑