随笔档案「2020年12月」 - 花落无痕亦有痕♡

从mysql调用链接爬取章节

摘要：调用数据库小说链接进行爬取完整链接 from bs4 import BeautifulSoup import requests import time import pymysql class DB: def __init__(self,host='',port=3306,user='',pass 阅读全文

posted @ 2020-12-09 21:53 花落无痕亦有痕♡ 阅读(99) 评论(0) 推荐(0)

爬取小说{章节，内容，链接}

摘要：今天下午完成了对小说的章节以及章节内容分别进行了抓取。小说章节及链接抓取：上图代码输出了书名，章节，和章节链接，但是章节链接缺少了第三中文网主页链接，因此这个链接不能完全说是章节链接。根据链接sql方面的知识对代码进行了调整，组成了完整链接。小说内容抓取：上图是抓取到的章节内容，但是这些内阅读全文

posted @ 2020-12-07 19:38 花落无痕亦有痕♡ 阅读(158) 评论(0) 推荐(0)

小说爬取问题总结1

摘要：1：爬取内容的标签要找准确 2：时间设置3以上，防止被封爬取小说数据时mysql列名设置为一个，但pyth代码没有更改导致运行报错，通过代码对比发现错误及时更改。网速跟爬取数据有直接的关系，网速过慢就会导致代码还在运行，就是爬取不到东西。解决方法是及时更换网络或到网速快的地方爬取。阅读全文

posted @ 2020-12-06 19:30 花落无痕亦有痕♡ 阅读(165) 评论(0) 推荐(0)

花落无痕亦有痕♡

12 2020 档案

公告