会员
周边
新闻
博问
融资
云市场
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
三个零
无论走到哪里 都应该记住 过去都是假的 回忆是一条没有尽头的路
博客园
首页
新随笔
联系
管理
2019年11月23日
爬取小说时--去空行和有序化
摘要: 有序化 以小说章节目录的数字为文件名,一章一个文件(但上千章就得有上千个文件) 在每次获取小说章节里的内容时,给item添加新的标识,添加对应的章节的数字,全部存入数据库,然后根据这个数字标识排序取出数据即可(没打印小说内容的字段) 去空行 利用splitlines()和strip() str.sp
阅读全文
posted @ 2019-11-23 21:43 三个零
阅读(632)
评论(0)
推荐(0)
编辑
公告