随笔分类 - 机器学习
摘要:作者:冬瓜哥链接:https://www.zhihu.com/question/59184480/answer/166167659来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 显卡/GPU是具体干活的芯片,其从host端拿命令和数据。显卡驱动,分内核态和用户态两部分
阅读全文
摘要:一、由于实验室大家使用的CUDA、CUdnn不同,所以需要在同一台服务器安装多个版本,而且要不引起冲突,方法如下: 1、一般来说CUDA安装在 /usr/local 目录下(当然你可以通过“echo $PATH”命令查询你的CUDA安装目录,一般来说CUDA的文件路径都会被写入到系统环境),如下图
阅读全文
摘要:样本不平衡问题 样本不平衡问题 样本不平衡问题 样本不平衡问题 如在二分类中正负样本比例存在较大差距,导致模型的预测偏向某一类别。如果正样本占据1%,而负样本占据99%,那么模型只需要对所有样本输出预测为负样本,那么模型轻松可以达到99%的正确率。一般此时需使用其他度量标准来判断模型性能。比如召回率
阅读全文
摘要:推断(Inference),就是深度学习把从训练中学习到的能力应用到工作中去。 精心调整权值之后的神经网络基本上就是个笨重、巨大的数据库。为了充分利用训练的结果,完成现实社会的任务,我们需要的是一个能够保留学习到的能力,还能迅速应用到前所未见的数据上的,响应迅速的系统。这就是推断,根据真实世界中的少
阅读全文
摘要:3. Fast-R-CNN 基于R-CNN和SPP-Net思想,RBG提出了Fast-R-CNN算法。如果选用VGG16网络进行特征提取,在训练阶段,Fast-R-CNN的速度相比RCNN和SPP-Net可以分别提升9倍和3倍;在测试阶段,Fast-R-CNN的速度相比RCNN和SPP-Net可以分
阅读全文
摘要:4. Faster-R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 在之前介绍的Fast-R-CNN中,第一步需要先使用Selective Search方法提取图像中的proposals。基于CPU实现的
阅读全文
摘要:2. SPP-Net : Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition) 传统CNN和SPP-Net流程对比如下图所示(引自http://www.image-net.org/challeng
阅读全文
摘要:1. R-CNN:Rich feature hierarchies for accurate object detection and semantic segmentation 技术路线:selective search + CNN + SVMs Step1:候选框提取(selective sea
阅读全文
摘要:基于空间金字塔池化的卷积神经网络物体检测 原文地址:http://blog.csdn.net/hjimce/article/details/50187655 作者:hjimce 一、相关理论 本篇博文主要讲解大神何凯明2014年的paper:《Spatial Pyramid Pooling in D
阅读全文
摘要:版权声明:转载请注明出处,谢谢! https://blog.csdn.net/Quincuntial/article/details/59109447 1. Parameters solver.prototxt文件是用来告诉caffe如何训练网络的。solver.prototxt的各个参数的解释如下
阅读全文
摘要:版权声明:本文为博主原创文章,欢迎转载,注明地址。 https://blog.csdn.net/program_developer/article/details/79430119 一、LRN技术介绍: Local Response Normalization(LRN)技术主要是深度学习训练时的一种
阅读全文
摘要:版权声明:本文为博主原创文章,转载请注明出处。 https://blog.csdn.net/Cheese_pop/article/details/52024980 DATA crop:截取原图像中一个固定patch layers { name: "data" type: DATA top: "dat
阅读全文
摘要:1. Dropout简介 1.1 Dropout出现的原因 在机器学习的模型中,如果模型的参数太多,而训练样本又太少,训练出来的模型很容易产生过拟合的现象。在训练神经网络的时候经常会遇到过拟合的问题,过拟合具体表现在:模型在训练数据上损失函数较小,预测准确率较高;但是在测试数据上损失函数比较大,预测
阅读全文
摘要:1. SimHash与传统hash函数的区别 传统的Hash算法只负责将原始内容尽量均匀随机地映射为一个签名值,原理上仅相当于伪随机数产生算法。传统的hash算法产生的两个签名,如果原始内容在一定概率下是相等的;如果不相等,除了说明原始内容不相等外,不再提供任何信息,因为即使原始内容只相差一个字节,
阅读全文
摘要:1 介 绍 1.1 流式计算介绍 流式大数据计算主要有以下特征: 1)实时性。流式大数据不仅是实时产生的,也是要求实时给出反馈结果。系统要有快速响应能力,在短时间内体现出数据的价值,超过有效时间后数据的价值就会迅速降低。 2)突发性。数据的流入速率和顺序并不确定,甚至会有较大的差异。这要求系统要有较
阅读全文
摘要:1 指数平滑法 移动平均模型在解决时间序列问题上简单有效,但它们的计算比较难,因为不能通过之前的计算结果推算出加权移动平均值。此外,移动平均法不能很好的处理数据集边缘的数据变化,也不能应用于现有数据集的范围之外。因此,移动平均法的预测效果相对较差。 指数平滑法(exponential smoothi
阅读全文
摘要:原文连接 https://blog.csdn.net/guolindonggld/article/details/56966200 原文连接 https://blog.csdn.net/guolindonggld/article/details/56966200 原文连接 https://blog.
阅读全文
摘要:前言在跑通了官网的mnist和cifar10数据之后,笔者尝试着制作自己的数据集,并保存,读入,显示。 TensorFlow可以支持cifar10的数据格式, 也提供了标准的TFRecord 格式,而关于 tensorflow 读取数据, 官网提供了3中方法 1 Feeding: 在tensorfl
阅读全文
摘要:https://www.cnblogs.com/pinard/p/9220199.html 在机器学习用于产品的时候,我们经常会遇到跨平台的问题。比如我们用Python基于一系列的机器学习库训练了一个模型,但是有时候其他的产品和项目想把这个模型集成进去,但是这些产品很多只支持某些特定的生产环境比如J
阅读全文
摘要:支持连续变量和类别变量,类别变量就是某个属性有三个值,a,b,c,需要用Feature Transformers中的vectorindexer处理 上来是一堆参数 setMaxDepth:最大树深度 setMaxBins:最大装箱数,为了近似统计变量,比如变量有100个值,我只分成10段去做统计 s
阅读全文

浙公网安备 33010602011771号