随笔分类 -  语言模型

摘要:word2vec 是 Google 于 2013 年开源推出的一个用于获取 word vector 的工具包,它简单、高效,因此引起了很多人的关注。由于 word2vec 的作者 Tomas Mikolov 在两篇相关的论文 [3,4] 中并没有谈及太多算法细节,因而在一定程度上增加了这个工具包... 阅读全文
posted @ 2014-07-21 10:04 peghoty 阅读(152153) 评论(13) 推荐(36) 编辑
摘要:开源软件包 SENNA 和 word2vec 中都用到了词向量(distributed word representation),当时我就在想,对于我们的中文,是不是也类似地有字向量(distributed character representation)的概念呢? 最近恰好... 阅读全文
posted @ 2013-10-30 01:20 peghoty 阅读(1374) 评论(0) 推荐(0) 编辑
摘要:在知乎网站上看到一个关于词向量的问题:词向量( Distributed Representation)工作原理是什么,哪位大咖能否举个通俗的例子说明一下? 恰好最近在学习 word2vec, 尝试着根据对所读文献的理解写了个回答,供大家参考。 要将自然语言交给机器学习算法来处理,通常需要首先将... 阅读全文
posted @ 2013-10-16 17:14 peghoty 阅读(2034) 评论(0) 推荐(0) 编辑