摘要:
词向量 在自然语言处理(NLP)中,词向量将单词按照含义编码成向量,从而更好地进行语言建模和特征学习。词向量经常作为下游 NLP 任务的基本组件,出现在文本分类、翻译、问答、推荐等各种任务模型中;此外,我们也可以通过多种方式,训练自己的词向量。(for more, see here) 通过本次实验, 阅读全文
posted @ 2021-04-12 22:47
Dallas98
阅读(410)
评论(1)
推荐(0)
摘要:
数据预处理 我们将一些不必要的标点字去除,因为这些标点字不会参与目标词的生成。 理论简介 新词发现 词级别中文 NLP 任务首先需要分词,目前主流的分词方法都是基于词库的,那么,词库从哪里来?我们使用的分词工具的词库适用于当前数据集吗?数据集包含大量新词怎么办?此类问题在网络数据集(大量网络新词)和 阅读全文
posted @ 2021-04-12 22:45
Dallas98
阅读(789)
评论(0)
推荐(0)

浙公网安备 33010602011771号