摘要: 转自公众号《数据科学家联盟》,作者饼干 一、逻辑回归: 逻辑回归假设数据服从伯努利分布,通过极大似然函数的方法,运用梯度下降来求解参数,来达到将数据二分类的目的。 逻辑回归是一个非线性模型,但是是其背后是以线性回归为理论支撑的。 提出一个与线性模型 长相类似但不同的新公式:假设特征X所对应的y值是在 阅读全文
posted @ 2019-12-15 21:09 yancheng111 阅读(449) 评论(0) 推荐(0)
摘要: 梯度下降:实现梯度下降、线性回归中的梯度下降 随机梯度下降:相关代码即调用 本文参考:公众号《数据科学家联盟》文章 转自:https://www.cnblogs.com/huangyc/p/9801261.html#_label1_0 一、概念 梯度下降(Gradient Descent, GD)不 阅读全文
posted @ 2019-12-08 11:06 yancheng111 阅读(622) 评论(0) 推荐(0)
摘要: 本文参考公共号《数据科学家联盟》饼干文章。 一、简单线性回归:简单线性回归及最小二乘法的数据推导 所谓简单,是指只有一个样本特征,即只有一个自变量;所谓线性,是指方程是线性的;所谓回归,是指用方程来模拟变量之间是如何关联的。 简单线性回归,其思想简单,实现容易(与其背后强大的数学性质相关。同时也是许 阅读全文
posted @ 2019-11-30 22:09 yancheng111 阅读(604) 评论(0) 推荐(0)
摘要: 本文参考《数据科学家联盟》饼干文章。 一、无量纲化:最值归一化、均值方差归一化及sklearn中的Scaler 在量纲不同的情况下,不能反映样本中每一个特征的重要程度时,将需要使用归一化方法。 一般来说解决方法为把所有的数据都映射到同一个尺度(量纲)上。 1、常用的数据归一化有两种: 最值归一化(n 阅读全文
posted @ 2019-11-30 21:53 yancheng111 阅读(528) 评论(0) 推荐(0)
摘要: 目录: 一、数据拆分:训练数据集&测试数据集 二、评价回归结果:分类准确度、混淆矩阵、精准率、召回率、F1、ROC等 三、评价回归结果:MSE、RMSE、MAE、RSquared 一、数据拆分:训练数据集&测试数据集 顾名思义,训练数据集即为用于训练模型的子集。测试数据集即为 用于测试训练后模型的子 阅读全文
posted @ 2019-11-17 22:52 yancheng111 阅读(594) 评论(0) 推荐(0)
摘要: 该篇笔记由木东居士提供学习小组、资料 描述性统计的概念很好理解,在日常工作中我们也经常会遇到需要使用描述性统计来表述的问题。以下,我们将使用Python实现一系列的描述性统计内容。 有关python环境的安装就次略过。 本次数据集由数据科学家联盟提供,https://pan.baidu.com/s/ 阅读全文
posted @ 2019-11-15 17:19 yancheng111 阅读(795) 评论(0) 推荐(0)
摘要: 一、knn的原理 K-近邻算法采用测量不同特征值之间的距离方法进行分类。 问题是求某点的最近 K 个点。求两点间距离公式,此外还可能需要增加权重 优点:精度高、对异常值不敏感、无数据输入假定。 缺点:时间复杂度高、空间复杂度高。 1、当样本不平衡时,比如一个类的样本容量很大,其他类的样本容量很小,输 阅读全文
posted @ 2019-11-10 14:48 yancheng111 阅读(523) 评论(0) 推荐(0)
摘要: 目录: 一、数据预处理: 数据审核 筛选 排序 二、品质数据的整理与展示: 分类数据的整理与展示 顺序数据的分类与展示 三、数值型数据的整理与展示: 数据分组 数据展示 一、数据预处理: 数据的预处理的涵盖范围很广泛,涉及到数据相关行业的工作内容都离不开预处理,不管是做机器学习还是需要做业务相关分析 阅读全文
posted @ 2019-11-10 11:12 yancheng111 阅读(1474) 评论(0) 推荐(0)
摘要: 目录:(摘自百度百科) 一、基本概念 二、类型: 1、单因素方差分析 2、双因素方差分析 3、协方差分析 一、基本概念 方差分析又称“变异数分析”或“F检验”,用于两个及两个以上样本均数差别的显著性检验。 方差分析的基本原理是认为不同处理组的均数间的差别基本来源有两个: (1) 实验条件,即不同的处 阅读全文
posted @ 2019-09-21 21:06 yancheng111 阅读(2951) 评论(0) 推荐(0)
摘要: 目录:(来源:百度百科等) 一、一元线性回归 二、多元线性回归 一、一元线性回归 一元线性回归是分析只有一个自变量(自变量x和因变量y)线性相关关系的方法。一个经济指标的数值往往受许多因素影响,若其中只有一个因素是主要的,起决定性作用,则可用一元线性回归进行预测分析。回归分析是研究某一变量(因变量) 阅读全文
posted @ 2019-09-15 20:27 yancheng111 阅读(2756) 评论(0) 推荐(0)