会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
冷夜独酌
导航
博客园
首页
新随笔
联系
订阅
管理
公告
2016年5月6日
Python - 爬取博客园某一目录下的随笔 - 保存为docx
摘要: 由于博客园的原创博客都是通过随笔的形式保存的,因此我们可以通过对某一随笔目录进行解析,获取出该目录下所有博文的标题,链接以及摘要,存储到MySQL数据库中(主要是因为可以持久记录相关信息,后续有新博文的时候可以通过对比判断直接下载新的博文)。然后再对每个条目进行单独解析,将博文的内容,图片保存到Wo
阅读全文
posted @ 2016-05-06 23:50 冷夜独酌
阅读(3049)
评论(0)
推荐(0)