摘要:
10.1 分词问题: ('钱收错了,怎么办?\n' '钱收错了 怎么办' ('钱什么时候到账?\n' '钱 什么时候 到账' 因为使用了hmm模型,会自动识别新词 ('配方卡支持吗?\n' '配方 卡 支持' '寄养卡怎么弄?(购物卡)\n' '寄养 卡 怎么弄 购物 卡' 添加自定义词库 ('那手 阅读全文
posted @ 2018-11-01 16:30
yjy888
阅读(121)
评论(0)
推荐(0)
该文被密码保护。 阅读全文
posted @ 2018-11-01 16:28
yjy888
阅读(11)
评论(1)
推荐(0)
摘要:
测试文件在result下面, 1、word2vec还需要丰富训练数据,去噪音,加入博客,新增加预处理的方法。 2、建立评估准确率和召回率的机制 3、去除停用词是不是去多了,增加原文打印的结果 4、原文521条,最终应跑出(521*520)/2对 阅读全文
posted @ 2018-11-01 08:50
yjy888
阅读(199)
评论(0)
推荐(0)
浙公网安备 33010602011771号