随笔分类 -  NLP

摘要:通用型单句Embedding 词向量平均 词向量乘上词权重后进行累加 综合考虑词频、词向量矩阵分解 http://www.hankcs.com/nlp/cs224n-sentence-embeddings.html 类似word2vec训练sentence2vec Distributed Repre 阅读全文
posted @ 2018-09-10 20:04 activeshj 阅读(538) 评论(0) 推荐(0)
摘要:http://www.sohu.com/a/220353074_744545 编辑距离的作用主要是用来比较两个字符串的相似度的。 编辑操作只有三种:插入,删除,替换。对两个字符串,将其中一个字符串经过上面的这三种操作之后,得和另外一个完全相同的字符串付出的代价就是编辑距离。 例如: 如果str1=” 阅读全文
posted @ 2018-08-27 20:16 activeshj 阅读(571) 评论(0) 推荐(0)
摘要:word2vec阅读笔记 word2vec使用指导 用word2vec 跑搜狗SogouCS语料 - 大小4G | 6.8 亿词长 | 57万词汇 利用word2vec对关键词进行聚类 阅读全文
posted @ 2015-01-14 23:36 activeshj 阅读(157) 评论(0) 推荐(0)
摘要:Deep Learning in NLP (一)词向量和语言模型 阅读全文
posted @ 2015-01-14 23:33 activeshj 阅读(129) 评论(0) 推荐(0)
摘要:中文分词器性能比较 阅读全文
posted @ 2014-11-09 19:48 activeshj 阅读(106) 评论(0) 推荐(0)