词向量

在自然语言处理中，文本最终需要交给模型进行计算，但模型只能处理数值，无法直接理解文字。因此，一个最基础的问题是：

如何把“词”转化为计算机可以处理的数值形式？

词向量正是为了解决这个问题而提出的。
它的目标是：

用向量来表示词，并尽量让向量之间的几何关系反映词与词之间的语义关系。

在学习 NLP 的过程中，我逐渐认识到，词向量并不是某一种具体算法，而是一整类文本表示思想的统称。

词向量可以理解为：
为每一个词分配一个向量，用这个向量来表示该词在语言中的语义特征。

理想状态下，词向量应该满足以下直觉：

这使得文本不再只是离散的符号，而是进入了一个可以进行数学运算的向量空间。

在实际学习过程中，我接触到的词向量相关方法大致可以归纳为一条清晰的演进路线：

这些方法并不是相互替代关系，而是解决问题角度逐步深化的过程。

在没有词向量之前，文本只能以离散符号的形式存在，这会带来几个严重问题：

词向量的引入，使得模型能够：

可以说，词向量是现代 NLP 的基础组件之一。

词向量并不是某一个具体的模型，而是一种将语言映射到向量空间的核心思想。

posted @ 2025-11-10 14:08 元始天尊123 阅读(8) 评论(0) 收藏举报

刷新页面返回顶部

yuanshitianzun123