摘要: 一、pLSA模型 1、朴素贝叶斯的分析 (1)可以胜任许多文本分类问题。(2)无法解决语料中一词多义和多词一义的问题——它更像是词法分析,而非语义分析。(3)如果使用词向量作为文档的特征,一词多义和多词一义会造成计算文档间相似度的不准确性。(4)可以通过增加“主题”的方式,一定程度的解决上述问题:一 阅读全文
posted @ 2017-06-11 16:45 风萧易水寒 阅读(5014) 评论(0) 推荐(0) 编辑
摘要: 一、聚类的基础知识介绍 1.聚类的定义 聚类就是对大量未知标注的数据集,按数据的内在相似性将数据集划分为多个类别,使类别内的数据相似度较大而类别间的数据相似度较小,他是无监督的。 2.相似度/距离计算方法总结 闵可夫斯基距离Minkowski/欧式距离: 杰卡德相似系数(Jaccard): 余弦相似 阅读全文
posted @ 2017-06-01 10:16 风萧易水寒 阅读(1475) 评论(0) 推荐(0) 编辑
摘要: 1.固定学习率的梯度下降 y=x^4+2x ,初值取x=1.5,学习率使用0.01 运行结果如下: 迭代次数 学习率 x …… …… …… 283 0.010000 -0.793701284 0.010000 -0.793701285 0.010000 -0.793701286 0.010000 - 阅读全文
posted @ 2017-05-30 12:09 风萧易水寒 阅读(8077) 评论(1) 推荐(0) 编辑
摘要: 1.用vs编译cuda的sample时会提示找不到”d3dx9.h”、”d3dx10.h”、”d3dx11.h”头文件的错误,如果没有安装这个插件,在TensorFlow里执行run方法时会导致电脑死机 解决方案;可从这里下载DXSDK_Jun10.exe。 2.import tensorflow 阅读全文
posted @ 2017-05-22 12:16 风萧易水寒 阅读(443) 评论(0) 推荐(0) 编辑
摘要: 一、初识maven 1.maven是什么? 他是一个项目管理器,配置好pom配置文件后,maven会管理项目的依赖文件等,当项目用到外部jar包时,maven帮助我们去网上下载并打包发到Tomcat中。maven有一个仓库的概念,他会打下载的jar文件存储到这个仓库中,这个仓库默认在我的文档里,项目 阅读全文
posted @ 2017-05-18 15:47 风萧易水寒 阅读(842) 评论(0) 推荐(0) 编辑
摘要: 一、状态和模型 在CNN网络中的训练样本的数据为IID数据(独立同分布数据),所解决的问题也是分类问题或者回归问题或者是特征表达问题。但更多的数据是不满足IID的,如语言翻译,自动文本生成。它们是一个序列问题,包括时间序列和空间序列。这时就要用到RNN网络,RNN的结构图如下所示: 序列样本一般分为 阅读全文
posted @ 2017-05-12 18:17 风萧易水寒 阅读(10211) 评论(0) 推荐(0) 编辑
摘要: 方法一: 1.进入Ubuntu系统后打开终端 2.终端中输入以下命令 sudo gedit /boot/grub/grub.cfg 3.找到Windows的配置将其剪切到Ubuntu的前面 把下面 ### BEGIN /etc/grub.d/30_os-prober ###menuentry 'Wi 阅读全文
posted @ 2017-04-19 14:36 风萧易水寒 阅读(21193) 评论(0) 推荐(0) 编辑
摘要: 一、神经网络为什么比传统的分类器好 1.传统的分类器有 LR(逻辑斯特回归) 或者 linear SVM ,多用来做线性分割,假如所有的样本可以看做一个个点,如下图,有蓝色的点和绿色的点,传统的分类器就是要找到一条直线把这两类样本点分开。 对于非线性可分的样本,可以加一些kernel核函数或者特征的 阅读全文
posted @ 2017-04-18 22:08 风萧易水寒 阅读(51566) 评论(0) 推荐(5) 编辑
摘要: 一、梯度下降法 1.什么是梯度下降法 顺着梯度下滑,找到最陡的方向,迈一小步,然后再找当前位,置最陡的下山方向,再迈一小步… 通过比较以上两个图,可以会发现,由于初始值的不同,会得到两个不同的极小值,所以权重初始值的设定也是十分重要的,通常的把W全部设置为0很容易掉到局部最优解,一般可以按照高斯分布 阅读全文
posted @ 2017-04-16 16:06 风萧易水寒 阅读(24141) 评论(1) 推荐(1) 编辑
摘要: 深度学习说到底就是要调节网络中得权重,使网络的分类结果更接近于训练值。这个重复迭代的过程又是一个线性回归的问题。在这种可能会用到高数,线性代数,概率论中的知识。 一、数学基础提一提。 1.高数中得知识。 高数中最重要的就是微积分了,那在深度学习中出现最多的一个概念就是梯度。什么是梯度呢?要说导数,学 阅读全文
posted @ 2017-04-13 21:11 风萧易水寒 阅读(1143) 评论(0) 推荐(0) 编辑