机器学习 - 随笔分类(第6页) - stardsd

元数据和测量尺度

摘要：修改元数据概述 “修改元数据”节点用于显示检测到的元数据或者输入的元数据信息，为后续的模型训练和应用做必要的准备。用户可以修改本节点的测量尺度（包括测量尺度、值）和角色，修改后的测量尺度和角色会被检测是否满足一致性要求。当测量尺度修改完成后，会根据类型来进行一致性检查。当角色修改完成后，会根阅读全文

posted @ 2018-10-30 15:13 stardsd 阅读(807) 评论(0) 推荐(0)

sklearn中SVM调参说明

摘要：写在前面之前只停留在理论上，没有实际沉下心去调参，实际去做了后，发现调参是个大工程（玄学）。于是这篇来总结一下sklearn中svm的参数说明以及调参经验。方便以后查询和回忆。常用核函数 1.linear核函数: K(xi,xj)=xTixjK(xi,xj)=xiTxj 2.polynomial 阅读全文

posted @ 2018-09-24 21:23 stardsd 阅读(12709) 评论(0) 推荐(2)

Variational Inference

摘要：作者：孙九爷链接：https://www.zhihu.com/question/41765860/answer/101915528来源：知乎著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。变分推断其实就是一句话：用简单的分布q去近似复杂的分布p。首先，为什么要选择用变分推断？因阅读全文

posted @ 2018-09-05 19:26 stardsd 阅读(526) 评论(0) 推荐(0)

生成模型（Generative Model）和判别模型（Discriminative Model）

摘要：引入监督学习的任务就是学习一个模型（或者得到一个目标函数）,应用这一模型，对给定的输入预测相应的输出。这一模型的一般形式为一个决策函数Y=f(X)，或者条件概率分布P(Y|X)。监督学习方法又可以分为生成方法(generative approach)和判别方法(discriminative ap 阅读全文

posted @ 2018-09-04 20:37 stardsd 阅读(16962) 评论(0) 推荐(1)

概率校准与Brier分数

摘要：1.再提逻辑回归前面已经讲过了逻辑回归，这里不再细讲，只是简单的说一个函数，主要是方便大家更好的理解概率校准。在逻辑回归中，用的最多的就是sigmod函数，这个函数的作用就是把无限大或者无限小的数据压缩到[0,1]之间，用来估计概率。图像大致为：基本上是以0.5分界，0.5以上为1，0.5以下阅读全文

posted @ 2018-09-03 21:27 stardsd 阅读(15030) 评论(0) 推荐(0)

模型评估——定量分析预测的质量

摘要：https://blog.csdn.net/hustqb/article/details/77922031 评分参数定义模型评价规则公共案例预定义值根据度量函数定义你的评分策略应用你自己的评分对象使用多种度量指标分类度量从二分类到多分类多标签精确度 Cohens kappa 混乱矩阵阅读全文

posted @ 2018-09-03 21:04 stardsd 阅读(6798) 评论(0) 推荐(1)

Sklearn实现逻辑回归

摘要：方法与参数 LogisticRegression类的各项参数的含义 class sklearn.linear_model.LogisticRegression(penalty='l2', dual=False, tol=0.0001, C=1.0, fit_intercept=True, inter 阅读全文

posted @ 2018-09-01 19:19 stardsd 阅读(32449) 评论(0) 推荐(0)

核函数

摘要：核函数是一个相似度函数 SVM模型有两个非常重要的参数C与gamma。其中 C是惩罚系数，即对误差的宽容度。c越高，说明越不能容忍出现误差,容易过拟合。C越小，容易欠拟合。C过大或过小，泛化能力变差 gamma是选择RBF函数作为kernel后，该函数自带的一个参数。隐含地决定了数据映射到新的特征空阅读全文

posted @ 2018-06-28 19:21 stardsd 阅读(3151) 评论(0) 推荐(0)

Bias(偏差)，Error(误差)，和Variance(方差)的区别和联系

摘要：准： bias描述的是根据样本拟合出的模型的输出预测结果的期望与样本真实结果的差距，简单讲，就是在样本上拟合的好不好。要想在bias上表现好，low bias，就得复杂化模型，增加模型的参数，但这样容易过拟合 (overfitting)，过拟合对应上图是high variance，点很分散。low 阅读全文

posted @ 2018-06-28 19:13 stardsd 阅读(8765) 评论(0) 推荐(2)

解决tensorflow在训练的时候权重是nan问题

摘要：搭建普通的卷积CNN网络。 nan表示的是无穷或者是非数值，比如说你在tensorflow中使用一个数除以0，那么得到的结果就是nan。在一个matrix中，如果其中的值都为nan很有可能是因为采用的cost function不合理导致的。当使用tensorflow构建一个最简单的神经网络的时候阅读全文

posted @ 2018-03-07 23:46 stardsd 阅读(4244) 评论(0) 推荐(0)

tf.argmax

摘要：Returns the index with the largest value across axis of a tensor. input is a Tensor and axis describes which axis of the input Tensor to reduce across 阅读全文

posted @ 2018-03-07 21:16 stardsd 阅读(1225) 评论(0) 推荐(0)

Keras教程

摘要：In this step-by-step Keras tutorial, you’ll learn how to build a convolutional neural network in Python! In fact, we’ll be training a classifier for h 阅读全文

posted @ 2018-03-05 20:08 stardsd 阅读(1209) 评论(0) 推荐(0)

隐马尔可夫(HMM)、前/后向算法、Viterbi算法

摘要：HMM的模型图1 如上图所示，白色那一行描述由一个隐藏的马尔科夫链生成不可观测的状态随机序列，蓝紫色那一行是各个状态生成可观测的随机序列话说，上面也是个贝叶斯网络，而贝叶斯网络中有这么一种，如下图：代表：c确定时a和b独立。(c为实心圆代表：c已经被确定) 这时，如果把z1看成a，x1看成b，阅读全文

posted @ 2018-02-26 19:39 stardsd 阅读(21688) 评论(0) 推荐(2)

受限玻尔兹曼机基础教程

摘要：定义与结构受限玻尔兹曼机（RBM）由Geoff Hinton发明，是一种用于降维、分类、回归、协同过滤、特征学习和主题建模的算法。（如需通过实例了解RBM等神经网络的应用方法，请参阅应用案例)。我们首先介绍受限玻尔兹曼机这类神经网络，因为它相对简单且具有重要的历史意义。下文将以示意图和通俗的语言阅读全文

posted @ 2018-02-24 23:41 stardsd 阅读(2316) 评论(0) 推荐(0)

模型后处理

摘要：模型后处理作者：Trent Hauck 译者：飞龙协议：CC BY-NC-SA 4.0 5.1 K-fold 交叉验证这个秘籍中，我们会创建交叉验证，它可能是最重要的模型后处理验证练习。我们会在这个秘籍中讨论 k-fold 交叉验证。有几种交叉验证的种类，每个都有不同的随机化模式。K-fold 阅读全文

posted @ 2018-01-30 23:37 stardsd 阅读(1348) 评论(0) 推荐(0)

cross validation笔记

摘要：preface：做实验少不了交叉验证，平时常用from sklearn.cross_validation import train_test_split，用train_test_split()函数将数据集分为训练集和测试集，但这样还不够。当需要调试参数的时候便要用到K-fold。scikit给我们提阅读全文

posted @ 2018-01-30 23:37 stardsd 阅读(820) 评论(0) 推荐(0)

交叉验证

摘要：本文结构：什么是交叉验证法？为什么用交叉验证法？主要有哪些方法？优缺点？各方法应用举例？什么是交叉验证法？它的基本思想就是将原始数据（dataset）进行分组，一部分做为训练集来训练模型，另一部分做为测试集来评价模型。为什么用交叉验证法？交叉验证用于评估模型的预测性能，尤其是训练好的阅读全文

posted @ 2018-01-29 20:54 stardsd 阅读(11613) 评论(0) 推荐(0)

如果使用交叉验证，是否还需要单独分出测试集？

摘要：比方说，用100k条数据，有两个思路 1. 用这100k条数据做k-fold交叉验证，来调模型参数 2. 先随机划分出70k条数据做训练集用来根据交叉验证调参数，调好之后再用剩下的30k条数据做测试集【答】虽然这两个都没有错对之分，但是在数据量允许的情况下，更建议第2个思路。对于思路1，如果用阅读全文

posted @ 2018-01-29 16:48 stardsd 阅读(8239) 评论(2) 推荐(1)

布拉格捷克理工大学研究团队：Prisma进化版

摘要：原文链接还记得 Prisma 吗？就是能把拍摄的照片转化为各种名画风格的修图软件，神经网络的深度学习后，想要波普还是梵高风的图片都不在话下。现在，它的进化版本来了。这回是布拉格捷克理工大学的研究团队创造的算法，这种人工智能技术能将动态画面转化为不同的风格。在演示视频中，原本正常的一段自拍视频加入阅读全文

posted @ 2017-05-29 16:34 stardsd 阅读(404) 评论(0) 推荐(0)

机器学习书单（外文版）

摘要：编者注：澳大利亚机器学习专家、畅销书作者 Jason Brownlee，对机器学习领域的各类优质书籍进行了盘点，汇总成这份阅读指南。在所筛选的学习资源中，这堪称是迄今为止最全面、最完整、权威性比较高的一份 ML 书单，涵盖了最值得学习者、从业者、开发者认真研读的精品书目。这份指南适合多样背景的读者：阅读全文

posted @ 2017-01-30 23:51 stardsd 阅读(5044) 评论(0) 推荐(2)

赏月斋

慎终如始宁静致远

随笔分类 - 机器学习

公告

赏月斋

慎终如始 宁静致远

随笔分类 - 机器学习

公告

慎终如始宁静致远