摘要: 词向量 在自然语言处理(NLP)中,词向量将单词按照含义编码成向量,从而更好地进行语言建模和特征学习。词向量经常作为下游 NLP 任务的基本组件,出现在文本分类、翻译、问答、推荐等各种任务模型中;此外,我们也可以通过多种方式,训练自己的词向量。(for more, see here) 通过本次实验, 阅读全文
posted @ 2021-04-12 22:47 Dallas98 阅读(410) 评论(1) 推荐(0)
摘要: 数据预处理 我们将一些不必要的标点字去除,因为这些标点字不会参与目标词的生成。 理论简介 新词发现 词级别中文 NLP 任务首先需要分词,目前主流的分词方法都是基于词库的,那么,词库从哪里来?我们使用的分词工具的词库适用于当前数据集吗?数据集包含大量新词怎么办?此类问题在网络数据集(大量网络新词)和 阅读全文
posted @ 2021-04-12 22:45 Dallas98 阅读(789) 评论(0) 推荐(0)
蜀ICP备20020397号