摘要: 1. 首先是下载中文维基数据 wget https://dumps.wikimedia.org/zhwiki/latest/zhwiki latest pages articles.xml.bz2 2. 下载提取工具https://github.com/attardi/wikiextractor 3 阅读全文
posted @ 2018-01-28 12:18 狂徒归来 阅读(1412) 评论(0) 推荐(0) 编辑