随笔分类 - 机器学习
摘要:作者:孙九爷链接:https://www.zhihu.com/question/41765860/answer/101915528来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 变分推断其实就是一句话:用简单的分布q去近似复杂的分布p。首先,为什么要选择用变分推断?因
阅读全文
摘要:引入 监督学习的任务就是学习一个模型(或者得到一个目标函数),应用这一模型,对给定的输入预测相应的输出。这一模型的一般形式为一个决策函数Y=f(X),或者条件概率分布P(Y|X)。 监督学习方法又可以分为生成方法(generative approach)和判别方法(discriminative ap
阅读全文
摘要:1.再提逻辑回归 前面已经讲过了逻辑回归,这里不再细讲,只是简单的说一个函数,主要是方便大家更好的理解概率校准。 在逻辑回归中,用的最多的就是sigmod函数,这个函数的作用就是把无限大或者无限小的数据压缩到[0,1]之间,用来估计概率。图像大致为: 基本上是以0.5分界,0.5以上为1,0.5以下
阅读全文
摘要:https://blog.csdn.net/hustqb/article/details/77922031 评分参数定义模型评价规则 公共案例预定义值 根据度量函数定义你的评分策略 应用你自己的评分对象 使用多种度量指标 分类度量 从二分类到多分类多标签 精确度 Cohens kappa 混乱矩阵
阅读全文
摘要:方法与参数 LogisticRegression类的各项参数的含义 class sklearn.linear_model.LogisticRegression(penalty='l2', dual=False, tol=0.0001, C=1.0, fit_intercept=True, inter
阅读全文
摘要:核函数是一个相似度函数 SVM模型有两个非常重要的参数C与gamma。其中 C是惩罚系数,即对误差的宽容度。c越高,说明越不能容忍出现误差,容易过拟合。C越小,容易欠拟合。C过大或过小,泛化能力变差 gamma是选择RBF函数作为kernel后,该函数自带的一个参数。隐含地决定了数据映射到新的特征空
阅读全文
摘要:准: bias描述的是根据样本拟合出的模型的输出预测结果的期望与样本真实结果的差距,简单讲,就是在样本上拟合的好不好。要想在bias上表现好,low bias,就得复杂化模型,增加模型的参数,但这样容易过拟合 (overfitting),过拟合对应上图是high variance,点很分散。low
阅读全文
摘要:搭建普通的卷积CNN网络。 nan表示的是无穷或者是非数值,比如说你在tensorflow中使用一个数除以0,那么得到的结果就是nan。 在一个matrix中,如果其中的值都为nan很有可能是因为采用的cost function不合理导致的。 当使用tensorflow构建一个最简单的神经网络的时候
阅读全文
摘要:Returns the index with the largest value across axis of a tensor. input is a Tensor and axis describes which axis of the input Tensor to reduce across
阅读全文
摘要:In this step-by-step Keras tutorial, you’ll learn how to build a convolutional neural network in Python! In fact, we’ll be training a classifier for h
阅读全文
摘要:HMM的模型 图1 如上图所示,白色那一行描述由一个隐藏的马尔科夫链生成不可观测的状态随机序列,蓝紫色那一行是各个状态生成可观测的随机序列 话说,上面也是个贝叶斯网络,而贝叶斯网络中有这么一种,如下图: 代表:c确定时a和b独立。(c为实心圆代表:c已经被确定) 这时,如果把z1看成a,x1看成b,
阅读全文
摘要:定义与结构 受限玻尔兹曼机(RBM)由Geoff Hinton发明,是一种用于降维、分类、回归、协同过滤、特征学习和主题建模的算法。(如需通过实例了解RBM等神经网络的应用方法,请参阅应用案例)。 我们首先介绍受限玻尔兹曼机这类神经网络,因为它相对简单且具有重要的历史意义。下文将以示意图和通俗的语言
阅读全文
摘要:模型后处理 作者:Trent Hauck 译者:飞龙 协议:CC BY-NC-SA 4.0 5.1 K-fold 交叉验证 这个秘籍中,我们会创建交叉验证,它可能是最重要的模型后处理验证练习。我们会在这个秘籍中讨论 k-fold 交叉验证。有几种交叉验证的种类,每个都有不同的随机化模式。K-fold
阅读全文
摘要:preface:做实验少不了交叉验证,平时常用from sklearn.cross_validation import train_test_split,用train_test_split()函数将数据集分为训练集和测试集,但这样还不够。当需要调试参数的时候便要用到K-fold。scikit给我们提
阅读全文
摘要:本文结构: 什么是交叉验证法? 为什么用交叉验证法? 主要有哪些方法?优缺点? 各方法应用举例? 什么是交叉验证法? 它的基本思想就是将原始数据(dataset)进行分组,一部分做为训练集来训练模型,另一部分做为测试集来评价模型。 为什么用交叉验证法? 交叉验证用于评估模型的预测性能,尤其是训练好的
阅读全文
摘要:比方说,用100k条数据,有两个思路 1. 用这100k条数据做k-fold交叉验证,来调模型参数 2. 先随机划分出70k条数据做训练集用来根据交叉验证调参数,调好之后再用剩下的30k条数据做测试集 【答】 虽然这两个都没有错对之分,但是在数据量允许的情况下,更建议第2个思路。 对于思路1,如果用
阅读全文
摘要:原文链接 还记得 Prisma 吗?就是能把拍摄的照片转化为各种名画风格的修图软件,神经网络的深度学习后,想要波普还是梵高风的图片都不在话下。 现在,它的进化版本来了。这回是布拉格捷克理工大学的研究团队创造的算法,这种人工智能技术能将动态画面转化为不同的风格。在演示视频中,原本正常的一段自拍视频加入
阅读全文
摘要:编者注:澳大利亚机器学习专家、畅销书作者 Jason Brownlee,对机器学习领域的各类优质书籍进行了盘点,汇总成这份阅读指南。在所筛选的学习资源中,这堪称是迄今为止最全面、最完整、权威性比较高的一份 ML 书单,涵盖了最值得学习者、从业者、开发者认真研读的精品书目。这份指南适合多样背景的读者:
阅读全文
摘要:20世纪初意大利经济学家基尼,于1922年提出的定量测定收入分配差异程度的指标。它是根据洛伦茨曲线找出了判断分配平等程度的指标(如下图)。 设实际收入分配曲线和收入分配绝对平等曲线之间的面积为A,实际收入分配曲线右下方的面积为B。并以A除以A+B的商表示不平等程度。这个数值被称为基尼系数或称洛伦茨系
阅读全文
摘要:这篇文章翻译至http://www.svds.com/learning-imbalanced-classes/,作者简洁明了地阐述了非平衡数据及解决这类问题的常用方法。其实一些朴素的方法我们自己也能想到,并且也实际使用过一些,比如重采样、调整权值等。然而,我们并没有去做一些归纳。感谢作者帮我们归纳了
阅读全文

浙公网安备 33010602011771号