会员
周边
捐助
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
持续学习的JielongZ
不积跬步无以至千里
博客园
首页
新随笔
联系
订阅
管理
2019年2月11日
文本向量化及词袋模型 - NLP学习(3-1)
摘要: 分词(Tokenization) - NLP学习(1) N-grams模型、停顿词(stopwords)和标准化处理 - NLP学习(2) 之前我们都了解了如何对文本进行处理:(1)如用NLTK文本处理库将文本的句子成分分成了N-Gram模型,与此同时引入了正则表达式去除一些多余的句子成分;(2)将
阅读全文
posted @ 2019-02-11 15:57 JieLongZ
阅读(2940)
评论(1)
推荐(1)
编辑
公告