会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
坚持就好了
博客园
首页
新随笔
联系
管理
订阅
2019年9月25日
初步涉及短文本分类,jieba+词袋+TF-IFG+SVM
摘要: 短文本分类,首先对文本做预处理,包括分词,去停顿词,文本向量化 1.分词:使用jieba分词,使用比较简单,jieba分词有三种模式, 精确模式:将句子最精确的分开,适合文本分析 全模式:句子中所有可以成词的词语都扫描出来,速度快,不能解决歧义 搜索引擎模式:在精确的基础上,对长词再次切分,提高召回
阅读全文
posted @ 2019-09-25 23:49 坚持就好了
阅读(1082)
评论(0)
推荐(0)
公告