hexo-migrator博客园搬家至hexo工具
1.前言
前阵子搭建了hexo博客,但是没有能直接搬家的工具,所以就自己用Python写了一个小工具进行搬家
github仓库地址:https://github.com/vhyz/hexo-migrator
2.支持哪些博客
这个工具适合老博客就用Markdown写文章的人,因为Markdown编辑器渲染后的html的可以转化为markdown
但是不是用markdown编辑器写的文章渲染出来的html是无法直接转化为markdown,当然如果要写的话应该还是可以写出来的
但是由于Markdown编辑器可以内嵌html标签,也就是说如果直接把文章的主体html导入其实也是可以实现博客搬家功能的
当然前提是你没有用一些CSS渲染你的博客文章,
3. 爬取博客园分类时遇到的麻烦
博客园分类是js脚本加载出来的,是无法直接通过静态爬取出来的,刚开始使用了模拟浏览器抓取该内容
但是耗时实在是太久了,后来查了一下资料,可以通过分析请求来判断哪个链接是请求分类的js
然后我们模拟发送该请求即可获得该信息,获得了该信息可以用正则表达式来处理
但正则表达式比较水的我,还是选择了直接用字符串处理即可获得该内容
4.json设置
该工具理论上只要你将对应的json设置导入到该工具的Setting文件夹中,你就能实现任何博客到hexo搬家的功能
但是由于某些博客的结构不同等等,需要人工修改一下源爬取代码