会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
花落无痕亦有痕♡
博客园
首页
新随笔
联系
订阅
管理
2020年12月9日
从mysql调用链接爬取章节
摘要: 调用数据库小说链接进行爬取 完整链接 from bs4 import BeautifulSoup import requests import time import pymysql class DB: def __init__(self,host='',port=3306,user='',pass
阅读全文
posted @ 2020-12-09 21:53 花落无痕亦有痕♡
阅读(99)
评论(0)
推荐(0)
2020年12月7日
爬取小说{章节,内容,链接}
摘要: 今天下午完成了对小说的章节以及章节内容分别进行了抓取。 小说章节及链接抓取: 上图代码输出了书名,章节,和章节链接,但是章节链接缺少了第三中文网主页链接,因此这个链接不能完全说是章节链接。 根据链接sql方面的知识对代码进行了调整,组成了完整链接。 小说内容抓取: 上图是抓取到的章节内容,但是这些内
阅读全文
posted @ 2020-12-07 19:38 花落无痕亦有痕♡
阅读(158)
评论(0)
推荐(0)
2020年12月6日
小说爬取问题总结1
摘要: 1:爬取内容的标签要找准确 2:时间设置3以上,防止被封 爬取小说数据时mysql列名设置为一个,但pyth代码没有更改导致运行报错,通过代码对比发现错误及时更改。 网速跟爬取数据有直接的关系,网速过慢就会导致代码还在运行,就是爬取不到东西。解决方法是及时更换网络或到网速快的地方爬取。
阅读全文
posted @ 2020-12-06 19:30 花落无痕亦有痕♡
阅读(165)
评论(0)
推荐(0)
公告