会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
-Destiny
博客园
首页
新随笔
联系
订阅
管理
2020年12月9日
爬取小说的二级页面和三级页面
摘要: 从小说中调取连接然后用python在进行爬取运行 上面的是为装头找到要爬取的标签 这个是从数据库中调取连接并去掉数据库中的来链接上的括号的和逗号 conn = pymysql.connect(host='localhost', user='root', password='root', databa
阅读全文
posted @ 2020-12-09 21:16 -Destiny
阅读(2776)
评论(0)
推荐(0)
2020年12月7日
安装库和爬取二级页面
摘要: 下面那个红线的地方就是报错的地方这个地方是因为没有导包才会出现的情况: 安装pycharm中的快捷包有两种方法: 1.点击左上角的File的下拉菜单,在里面点击Settings 然后进去点击图Project代码在点击Python Interpreter,再点右面的加号 最后在这里搜索要用到的包,然后
阅读全文
posted @ 2020-12-07 18:35 -Destiny
阅读(89)
评论(0)
推荐(0)
2020年12月6日
爬取小说封装进数据库
摘要: 爬取小说的书名简介和作者,在这中间遇到了爬不出来东西的情况,再通过自己查找和小组成员的帮忙,找到发现是标签出了问题。然后就是开始创建数据库吧爬取的数据通过代码的形式存入到数据库中,在这中间要注意很重要的一点就是,对齐列名,要不是会出现报错的情况,还有就是导入数据的时候网络要好不好的情况会出现导不进去
阅读全文
posted @ 2020-12-06 17:49 -Destiny
阅读(105)
评论(0)
推荐(0)
公告