会员
周边
新闻
博问
AI培训
云市场
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
牛云杰
博客园
首页
新随笔
联系
订阅
管理
2018年12月9日
学习笔记--python中使用多进程、多线程加速文本预处理
摘要: 一.任务描述 最近尝试自行构建skip-gram模型训练word2vec词向量表。其中有一步需要统计各词汇的出现频率,截取出现频率最高的10000个词汇进行保留,形成常用词词典。对于这个问题,我建立了两个list,词汇list 和 词汇数量list,分别记录新出现的词汇和该词汇出现的次数。遍历整个语
阅读全文
posted @ 2018-12-09 20:01 牛云杰
阅读(1530)
评论(0)
推荐(0)
编辑
公告