摘要: 前情提要: 因为需要使用kenlm语言模型工具 所以在远程Linux服务器上安装了这个工具,现在在windows上使用pycharm平台,通过远程的python解释器进行使用。但是在进行import kenlm 的时候 总是报错,说找不到该库文件 。然而,我通过终端,在远程服务器上是可以执行该语句, 阅读全文
posted @ 2019-09-04 14:49 叮当睡宝 阅读(349) 评论(0) 推荐(0) 编辑
摘要: 在NLP领域,词向量是一个非常基础的知识点,计算机是不能识别文字,所以要让计算机记住文字只能通过数字的形式,在最初所采用的是one-hot(独热)编码,简单回顾一下这种编码方式 例如:我很讨厌下雨 分词之后:我 很 讨厌 下雨 可知词表大小为4,采用one-hot编码方式则为 我:[1,0,0,0] 阅读全文
posted @ 2019-08-28 12:47 叮当睡宝 阅读(5439) 评论(3) 推荐(3) 编辑
摘要: 在使用负采样函数的时候出现了该错误,错误代码: 阅读全文
posted @ 2019-08-26 16:15 叮当睡宝 阅读(621) 评论(0) 推荐(0) 编辑
摘要: 在学习NLP过程当中,语言模型使我们都要学习的一部分知识。常用的N-gram训练工具有SRILM、IRSTLM、BerkeleyLM和KenLM等。 在使用kenlm的过程中也是遇到了许多问题。 环境的搭建: 参照博客:https://www.cnblogs.com/jasmine-Jobs/p/7 阅读全文
posted @ 2019-08-26 13:31 叮当睡宝 阅读(1232) 评论(3) 推荐(0) 编辑
摘要: 机器学习,一直以来都是计算机相关从业者研究的领域之一,整个行业也在欺负之中不断地深入发展。随着深度学习的崛起,及其徐诶再一次乘上了时代的浪潮,成为新宠!今后将在博客园和大家一起分享我在深度学习这一块的各种酸甜苦辣 机器学习:顾名思义是指机器学习的一个过程。 在机器学习中,有三个基本的要素:任务T、经 阅读全文
posted @ 2019-06-10 16:55 叮当睡宝 阅读(297) 评论(0) 推荐(0) 编辑