会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
coooole的技术博客
博客园
首页
新随笔
联系
订阅
管理
2017年8月15日
[自然语言处理] 文本向量化技术
摘要: 前期准备 使用文本向量化的前提是要对文章进行分词,分词可以参考前一篇文章。然后将分好的词进行向量化处理,以便计算机能够识别文本。常见的文本向量化技术有词频统计技术、TF-IDF技术等。 词频统计技术 词频统计技术是很直观的,文本被分词之后。 用每一个词作为维度key,有单词对应的位置为1,其他为0,
阅读全文
posted @ 2017-08-15 10:55 chyq
阅读(5232)
评论(0)
推荐(0)
公告