NLP:词向量与ELMo模型

逻辑回顾,最多的应用是在分类问题上。

词向量

one hot编码不能表示单词间语义相似度,所以就出现了词向量
我们:[1, 0, 0, 0, 0, 0, 0] -> [0.1, 0.3, 0.4, 0.2]
运动:[0, 0, 0, 0, 1, 0, 0] -> [0.3, 0.2, 0.1, 0.4]
稀疏矩阵sparse Mat -> 稠密矩阵 dense Mat
针对词向量的降维算法:T-SNE
one hot编码和词向量都是将文档等文字量化成数字
ELMo、bert、XLNet等都是为了将文字转成词向量,得到词之间的相似度

语言模型

语言模型用来判断:是否一句话从语法上通顺,方法是计算一个句子或字序列的可能性

ELMo

ELMo是deep 双向LSTM的深度学习模型
对比图像的层次表达,NLP:文字 -> 单词特征 -> 句法特征 -> 语义特征





































posted @ 2020-02-15 21:52  qccz123456  阅读(322)  评论(0编辑  收藏  举报