NLP - 随笔分类(第10页) - 今夜无风

python中的os.path.dirname(__file__)的使用

摘要：在编程时，我们要获取当前文件所在的路径，以适合所有的工程，建立相对路径。 python的os.path.dirname(__file__)非常好用，建议大家使用：输出：阅读全文

posted @ 2019-03-11 19:05 今夜无风阅读(2335) 评论(0) 推荐(0)

摘要：1、查看cuda版本 cat /usr/local/cuda/version.txt2、查看cudnn版本 cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2 按照结果顺序读取出版本号阅读全文

posted @ 2019-03-06 18:04 今夜无风阅读(3984) 评论(0) 推荐(0)

TensorRT下安装pycuda

摘要：为了模型小型化，效率更高，使用TensorRT进行优化。前提是你必须要安装pycuda，可是费了我一番功夫。做一个笔记如下： 1.参考网址： https://wiki.tiker.net/PyCuda/Installation/Linux/ 2.配置代码阅读全文

posted @ 2019-03-04 15:00 今夜无风阅读(3764) 评论(0) 推荐(0)

NLP去特殊字符

摘要：在自然语言处理中，我们有时对文本进行处理，需要去除一些特殊符号，保留中文，这是在预处理过程中常用到的。分享给你，希望对你有帮助！阅读全文

posted @ 2019-02-28 16:22 今夜无风阅读(760) 评论(0) 推荐(0)

tensorflow模型在实际上线进行预测的时候，使用CPU工作

摘要：最近已经训练好了一版基于DeepLearning的文本分类模型，TextCNN原理。在实际的预测中，如果默认模型会优先选择GPU那么每一次实例调用，都会加载GPU信息，这会造成很大的性能降低。那么，在使用的过程中我们无关乎使用GPU还是CPU，使用CPU反而是很快的，所以在有GPU的服务器部署模型阅读全文

posted @ 2019-02-21 17:17 今夜无风阅读(1801) 评论(0) 推荐(0)

二分类模型精度高而召回率低的原因

摘要：最近在做二分类模型的调优工作。最终发现模型的正例精度在95%，而正例的召回率在83%，这是什么情况呢。我把模型预测的2000条样本结果的错误标签和内容都打印出来，发现，在样本标注的时候，多数的正样本被错误的标注为负样本，这样模型学到正例的能力就变弱了，这样将大多数正样本预测为负样本的同时，负样本的阅读全文

posted @ 2019-02-18 10:33 今夜无风阅读(7751) 评论(0) 推荐(0)

seaborn画热力图注意的几点问题

摘要：最近在使用注意力机制实现文本分类，我们需要观察每一个样本中，模型的重心放在哪里了，就是观察到权重最大的token。这时我们需要使用热力图进行可视化。我这里用到：seaborn seaborn.heatmap seaborn.heatmap(data, vmin=None, vmax=None, c 阅读全文

posted @ 2019-02-14 16:40 今夜无风阅读(5346) 评论(0) 推荐(0)

微信、QQ群短文本聊天语料总结

摘要：在文本分类任务中，语料的特性千差万别，我们需要找到适合模型并抓住数据的特性，最终才能得到较好的model。最近在文本类别标注任务，就是给文本打标签确定该文本的类别。这是一个很费人工的过程，需要认真仔细，因为我们都知道有多少人工就有多少智能。微信、QQ短文本：（1）如何分段聊天文本的边界是无法确阅读全文

posted @ 2019-01-16 10:28 今夜无风阅读(1677) 评论(0) 推荐(0)

tensorflow的ckpt文件总结

posted @ 2019-01-14 09:41 今夜无风阅读(10711) 评论(0) 推荐(0)

tensorflow如何正确加载预训练词向量

摘要：使用预训练词向量和随机初始化词向量的差异还是挺大的，现在说一说我使用预训练词向量的流程。一、构建本语料的词汇表，作为我的基础词汇二、遍历该词汇表，从预训练词向量中提取出该词对应的词向量三、初始化embeddings遍历，将数据赋值给tensor 样例代码：阅读全文

posted @ 2019-01-10 09:38 今夜无风阅读(7382) 评论(0) 推荐(1)

tensorflow 一维卷积 tf.layers.conv1()使用

摘要：在自然语言处理中，主要使用一维的卷积。 API inputs:　输入数据，如（?, 80, 300） filters: 滤波器的个数 kernel_size: 卷积核的大小，指定一个维度即可，即卷积核的高。宽是数据的维度，自动匹配。阅读全文

posted @ 2019-01-03 09:49 今夜无风阅读(4675) 评论(0) 推荐(0)

tensorflow 的tf.where详解

摘要：最近在用到数据筛选，观看代码中有tf.where()的用法，不是很常用，也不是很好理解。在这里记录一下 Return the elements, either from x or y, depending on the condition. 理解：where嘛，就是要根据条件找到你要的东西。 con 阅读全文

posted @ 2019-01-02 17:12 今夜无风阅读(5548) 评论(0) 推荐(0)

tensorflow 计算均值和方差

摘要：我们在处理矩阵数据时，需要用到数据的均值和方差，比如在batch normalization的时候。那么，tensorflow中计算均值和方差的函数是：tf.nn.moments(x, axes) x:　我们待处理的数据 axes：在哪一个维度上求解，是一个list，如axes=[0, 1, 2 阅读全文

posted @ 2019-01-02 11:44 今夜无风阅读(9653) 评论(0) 推荐(0)

注意力机制的本质

摘要：注意力机制本质：注意力机制的具体计算过程，可以归纳为两个过程。第一个过程：根据query和key计算权重系数第二个过程：根据权重系数对value进行加权求和阅读全文

posted @ 2018-12-29 15:23 今夜无风阅读(914) 评论(0) 推荐(0)

两层LSTM的使用

摘要：一层的lstm效果不是很好，使用两层的lstm，代码如下。阅读全文

posted @ 2018-12-29 14:25 今夜无风阅读(5256) 评论(0) 推荐(0)

深度学习中的batch的大小对学习效果的影响

摘要：Batch_size参数的作用：决定了下降的方向极端一： batch_size为全数据集(Full Batch Learning)：好处： 1.由全数据集确定的方向能够更好地代表样本总体，从而更准确地朝向极值所在的方向。 2.由于不同权重的梯度值差别巨大，因此选择一个全局的学习率很困难。Full 阅读全文

posted @ 2018-12-28 11:42 今夜无风阅读(7795) 评论(0) 推荐(1)

深度学习中网络设计的几点经验

摘要：1.CNN网络中的池化方式选择池化方式有两种：1）最大池化；2）平均池化在实验中我发现，最大池化要比平均池化慢很多，效果也不如平均池化好。所以，池化的方式我们尽量选择平均池化。 2.CNN卷积核的设计卷积的大小，遵守奇数设计原则，如【1,3,5,7】 3.CNN和RNN网络输出到全连接层数据s 阅读全文

posted @ 2018-12-28 09:52 今夜无风阅读(2080) 评论(0) 推荐(0)

深度学习中将类别标签映射到one_hot向量

摘要：有时我们的样本标签，都是标记从0开始直至到类别的个数。在模型训练的时候，这些标签需要变成one_hot向量，这样才能够跟softmax出来的概率做互熵损失，计算loss。那么，映射的方法如下： y：类型是list，样本的类别标签序列 n_class：类别的个数输出：阅读全文

posted @ 2018-12-27 09:06 今夜无风阅读(4119) 评论(0) 推荐(0)

python 过滤掉字符串中的回车符与换行符（\t\n）

摘要：我们在文本数据预处理前，要将数据统一整理成需要的格式，其中有回车（\t）或者（\n）符号，会对我们的数据保存有影响，那么就需要将其过滤掉。比较简单的方法，用replace()将这些符号替换为空，一定要一个一个的替换这样就删除了你想要删除的符号阅读全文

posted @ 2018-12-26 11:23 今夜无风阅读(9350) 评论(0) 推荐(0)

利用Python的collections包下Counter的类统计每个数据出现的个数

摘要：输出： {1: 3, 2: 2, 3: 1} 阅读全文

posted @ 2018-12-25 13:53 今夜无风阅读(1061) 评论(0) 推荐(0)

随笔分类 - NLP

公告