随笔分类 -  Word2vec

002-词向量,神经网络模型,CBOW,哈夫曼树,Negative Sampling
摘要:词向量: 无论是一段话或是一篇文章,词都是最基本的组成单位。 如何让计算机利用这些词? 重点是如何把一个词转换成一个想向量 如果在一个二维空间中,had,has,have意思相同,所以要离的比较近。 need,help也是离的比较近 要表现出相同,相关。 比如说下面的例子: 哪些词离青蛙frog比较 阅读全文

posted @ 2018-10-20 00:01 医疗兵皮特儿 阅读(667) 评论(0) 推荐(0)

001-语言模型
摘要:语言模型: 我 今天 下午 打 篮球 p(S)=p(w1,w2,w3,w4,w5,…,wn)=p(w1)p(w2|w1)p(w3|w1,w2)...p(wn|w1,w2,...,wn-1) . p(S)被称为语言模型,即用来计算一个句子概率的模型 p(w2|w1)p(w3|w1,w2)...p(wn 阅读全文

posted @ 2018-10-19 21:27 医疗兵皮特儿 阅读(189) 评论(0) 推荐(0)

导航