随笔分类 - NLP
摘要:通用型单句Embedding 词向量平均 词向量乘上词权重后进行累加 综合考虑词频、词向量矩阵分解 http://www.hankcs.com/nlp/cs224n-sentence-embeddings.html 类似word2vec训练sentence2vec Distributed Repre
阅读全文
摘要:http://www.sohu.com/a/220353074_744545 编辑距离的作用主要是用来比较两个字符串的相似度的。 编辑操作只有三种:插入,删除,替换。对两个字符串,将其中一个字符串经过上面的这三种操作之后,得和另外一个完全相同的字符串付出的代价就是编辑距离。 例如: 如果str1=”
阅读全文
摘要:word2vec阅读笔记 word2vec使用指导 用word2vec 跑搜狗SogouCS语料 - 大小4G | 6.8 亿词长 | 57万词汇 利用word2vec对关键词进行聚类
阅读全文
摘要:Deep Learning in NLP (一)词向量和语言模型
阅读全文
浙公网安备 33010602011771号