摘要:
一、Dirichlet-Multinomial共轭 二、LDA=PLSA(Probabilistic Latent Semantic Analysis)+bayes 三、训练方法有gibbs sampling(吉布斯采样)和variation inference-EM算法(变分推断-EM算法) 四、 阅读全文
posted @ 2019-10-26 21:20
熊猫blue
阅读(403)
评论(0)
推荐(0)
只有注册用户登录后才能阅读该文。 阅读全文
posted @ 2019-10-26 17:48
熊猫blue
阅读(0)
评论(0)
推荐(0)
摘要:
python中的re库用于正则化,相当于一个过滤器,可以过滤掉不需要的字符,得到自己想要的。 运行结果是: 其中,\u4e00-\u9fa5表示匹配中文字符,\u4e00是在编码中中文字符开始的值,\u9fa5是中文字符结束的值。 jieba.posseg.cut(text) 可以对段落进行词的划分 阅读全文
posted @ 2019-10-26 11:17
熊猫blue
阅读(404)
评论(0)
推荐(0)

浙公网安备 33010602011771号