摘要: 今天我们爬取网页中的文字,与上次的爬取网页中的图片相似,网页的中的文字也是在网页的源码中(一般情况下)。 所以我们就以在某小说网站上爬取小说《圣墟》为例,使用爬虫爬取网页中的文本内容,并根据小说的章节名保存。 我们的思路如下: 1.爬取当前网页的源码: 2.提取出需要的数据(标题,正文) 3.保存( 阅读全文
posted @ 2019-12-01 18:30 杨小平# 阅读(1841) 评论(0) 推荐(1) 编辑