随笔分类 - Python
摘要:PS:因为没有找到实际应用的场景,所以两个示例直接采用了官网的示例。以后遇到实际的应用场景了,再替换成实际的例子。 1.算法简介 双聚类简单来说就是在数据矩阵A中寻找一个满足条件矩阵B1的子矩阵A1,而B1是条件矩阵B的一个子矩阵. 2.算法常用的计算模型 目前定义双聚类算法有四种比较广泛的方式:(
        阅读全文
            
摘要:说明:这篇文章需要有一些相关的基础知识,否则看起来可能比较吃力。 1.卷积与神经元 1.1 什么是卷积? 简单来说,卷积(或内积)就是一种先把对应位置相乘然后再把结果相加的运算。(具体含义或者数学公式可以查阅相关资料) 如下图就表示卷积的运算过程: (图1) 卷积运算一个重要的特点就是,通过卷积运算
        阅读全文
            
摘要:1.关于Keras 1)简介 Keras是由纯python编写的基于theano/tensorflow的深度学习框架。 Keras是一个高层神经网络API,支持快速实验,能够把你的idea迅速转换为结果,如果有如下需求,可以优先选择Keras: a)简易和快速的原型设计(keras具有高度模块化,极
        阅读全文
            
摘要:1.特征选择 特征选择是降维的一种方法,即选择对预测结果相关度高的特征或者消除相似度高的特征,以提高估计函数的准确率或者提高多维度数据集上的性能。 2.删除低方差特征 1)思路:设置一个阀值,对每个特征求方差,如果所求方差低于这个阀值,则删除此特征。默认情况下会删除0方差。 2)核心函数 sklea
        阅读全文
            
摘要:1.梯度下降 1)什么是梯度下降? 因为梯度下降是一种思想,没有严格的定义,所以用一个比喻来解释什么是梯度下降。 简单来说,梯度下降就是从山顶找一条最短的路走到山脚最低的地方。但是因为选择方向的原因,我们找到的的最低点可能不是真正的最低点。如图所示,黑线标注的路线所指的方向并不是真正的地方。 既然是
        阅读全文
            
摘要:1.再提逻辑回归 前面已经讲过了逻辑回归,这里不再细讲,只是简单的说一个函数,主要是方便大家更好的理解概率校准。 在逻辑回归中,用的最多的就是sigmod函数,这个函数的作用就是把无限大或者无限小的数据压缩到[0,1]之间,用来估计概率。图像大致为: 基本上是以0.5分界,0.5以上为1,0.5以下
        阅读全文
            
摘要:1.数学定义 保序回归是回归算法的一种,基本思想是:给定一个有限的实数集合,训练一个模型来最小化下列方程: 并且满足下列约束条件: 2.算法过程说明 从该序列的首元素往后观察,一旦出现乱序现象停止该轮观察,从该乱序元素开始逐个吸收元素组成一个序列,直到该序列所有元素的平均值小于或等于下一个待吸收的元
        阅读全文
            
摘要:1.概述 线性判别式分析(Linear Discriminant Analysis),简称为LDA。也称为Fisher线性判别(Fisher Linear Discriminant,FLD),是模式识别的经典算法,在1996年由Belhumeur引入模式识别和人工智能领域。 基本思想是将高维的模式样
        阅读全文
            
摘要:考虑到学习知识的顺序及效率问题,所以后续的几种聚类方法不再详细讲解原理,也不再写python实现的源代码,只介绍下算法的基本思路,使大家对每种算法有个直观的印象,从而可以更好的理解函数中参数的意义及作用,而重点是放在如何使用及使用的场景。 (题外话: 今天看到一篇博文:刚接触机器学习这一个月我都做了
        阅读全文
            
摘要:1.算法简介 AP(Affinity Propagation)通常被翻译为近邻传播算法或者亲和力传播算法,是在2007年的Science杂志上提出的一种新的聚类算法。AP算法的基本思想是将全部数据点都当作潜在的聚类中心(称之为exemplar),然后数据点两两之间连线构成一个网络(相似度矩阵),再通
        阅读全文
            
摘要:1.简介 K-means算法是最为经典的基于划分的聚类方法,是十大经典数据挖掘算法之一。K-means算法的基本思想是:以空间中k个点为中心进行聚类,对最靠近他们的对象归类。通过迭代的方法,逐次更新各聚类中心的值,直至得到最好的聚类结果。 2. 算法大致流程为: 1)随机选取k个点作为种子点(这k个
        阅读全文
            
摘要:1.简介(只是简单介绍下理论内容帮助理解下面的代码,如果自己写代码实现此理论不够) 1) BP神经网络是一种多层网络算法,其核心是反向传播误差,即: 使用梯度下降法(或其他算法),通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。 BP神经网络模型拓扑结构包括输入层(input)、隐藏
        阅读全文
            
摘要:两个软件包中关于最小二乘法和多项式回归的一个使用对比及总结
        阅读全文
            
摘要:1.前言 今天大致看了下自动化运维的东西,里面介绍到了psutil模块,其封装了linux 下的大部分shell命令,用起来比较方便。但是基本都是介绍在本地如何使用,而实际情况大家很少这样使用,一般都是在一台监控机器上远程读取目标服务器的信息。拓扑大致如下: 读取信息的方式一般分两种: 1)推式:在
        阅读全文
            
摘要:先从一本书说起吧 《机器学习实战》 作者在书中讲到逻辑回归的时候,用简短的语言介绍了一下理论之后,就给出了一段代码。然而就是这段代码把我带进了误区,也许不能叫误区,而是因为我自己的水平不够。后来在查阅资料的时候,发现有人也因为这个问题纠结了好久。也许这本书是写给一些有经验的人员看的,不是特别适合作为
        阅读全文
            
摘要:声明:本文是站在回归分析角度讲的,分类的理解可能跟这有点不一样。 1.前言 随机森林也是集成方法的一种,是对Bagging算法的改进。 随机森林主要有两步组成: 1)有放回的随机抽取样本数据,形成新的样本集。这部分和Bagging算法一样,但是有两点需要注意: a)新的样本集的大小和原始样本集的大小
        阅读全文
            
摘要:以二元决策树为基学习器实现梯度提升算法
        阅读全文
            
摘要:详细介绍了使用二元决策树进行回归分析的方法
        阅读全文
            
摘要:一个较为简单的集中巡检的脚本
        阅读全文
            
                    
                
浙公网安备 33010602011771号