Fork me on GitHub
摘要: 下面是测试结果: 阅读全文
posted @ 2017-04-12 23:35 石头木 阅读(9556) 评论(0) 推荐(0)
摘要: 一.下载中文维基百科数据https://dumps.wikimedia.org/zhwiki/并使用gensim中的wikicorpus解析提取xml中的内容 二.利用opencc繁体转简体 三.利用jieba对转换后的文本进行分词,去停词 四.利用gensim中的word2vec训练分词后的文本 阅读全文
posted @ 2017-04-12 23:15 石头木 阅读(8498) 评论(0) 推荐(2)