摘要: 一、SVM算法原理及数学推导 1、支撑向量机,SVM(Support Vector Machine),其实就是一个线性分类器。在最初接到这个算法时,我们可能会一头雾水:这个名词好奇怪[问号脸],怎么“支持”?什么“向量”,哪来的“机”? 本篇文章从“不适定问题”开始介绍SVM的思想,通过支撑向量与最 阅读全文
posted @ 2020-05-03 17:45 yancheng111 阅读(290) 评论(0) 推荐(0) 编辑
摘要: 本文转自公众号《数据科学家联盟》 一、主成分分析法的思想及其原理 1、PCA(Principal Component Analysis),即主成分分析方法,是一种使用最广泛的数据降维算法(非监督的机器学习方法)。 其最主要的用途在于“降维”,通过析取主成分显出的最大的个别差异,发现更便于人类理解的特 阅读全文
posted @ 2020-05-03 17:40 yancheng111 阅读(521) 评论(0) 推荐(0) 编辑
摘要: 本文转自公众号《数据科学家联盟》,作者:饼干 一、偏差方差 1、偏差和方差的定义如下: 偏差(bias):偏差衡量了模型的预测值与实际值之间的偏离关系。例如某模型的准确度为96%,则说明是低偏差;反之,如果准确度只有70%,则说明是高偏差。 方差(variance):方差描述的是训练数据在不同迭代阶 阅读全文
posted @ 2020-04-12 16:17 yancheng111 阅读(283) 评论(0) 推荐(0) 编辑
摘要: Q: 03年到19年第一季度分季度的数据,13年之前只有传统汽车的销量,13年之后是传统汽车+新能源汽车的销量,需要预测未来三期传统汽车的销量~ps:传统汽车的销量会受到新能源汽车的影响. import pandas as pd import matplotlib.pyplot as plt dat 阅读全文
posted @ 2020-03-08 10:55 yancheng111 阅读(430) 评论(0) 推荐(0) 编辑
摘要: 时间序列是按时间顺序的一组数字序列。 时间序列的特点: 现实的、真实的一组数据,而不是数理统计中做实验得到的。既然是真实的,它就是反映某一现象的统计指标,因而,时间序列背后是某一现象的变化规律。 动态数据。 时间序列建模基本步骤是: 用观测、调查、统计、抽样等方法取得被观测系统时间序列动态数据。 根 阅读全文
posted @ 2020-03-01 15:58 yancheng111 阅读(737) 评论(0) 推荐(0) 编辑
摘要: 一、案例: 有A、B、C、D四个地区,不同地区的销售量不一样,现抽取了不同时间段内每个地区的销售量,试解决: 1、每个地区间的销售量是否相同? 2、不同月份的销售量是否相同? 3、不同时间与地区的销售量是否相同? 二、数据: 问题1: 用单因素方差分析,先假设,再构造统计量,最后进行决策 (1)假设 阅读全文
posted @ 2020-02-23 22:38 yancheng111 阅读(526) 评论(0) 推荐(0) 编辑
摘要: import numpy as np import pandas as pd import matplotlib.pyplot as plt plt.rcParams['font.sans-serif'] = ['stxiHei']from sklearn.model_selection impor 阅读全文
posted @ 2020-02-09 16:32 yancheng111 阅读(477) 评论(0) 推荐(0) 编辑
摘要: 转自:作者:LY豪链接:https://www.jianshu.com/p/caef1926adf7 聚类 聚类试图将数据集中的样本划分为若干个通常是不相交的子集,每个子集成为一个“簇”。通过这样的划分,每个簇可能对应于一些潜在的概念(也就是类别),如“浅色瓜” “深色瓜”,“有籽瓜” “无籽瓜”, 阅读全文
posted @ 2019-12-28 13:27 yancheng111 阅读(1490) 评论(0) 推荐(0) 编辑
摘要: 一、关于体温、性别、心率的临床数据对男性体温抽样计算下95%置信区间总体均值范围。转自:https://www.jianshu.com/p/a3efca8371eb import pandas as pd import numpy as np import seaborn as sns import 阅读全文
posted @ 2019-12-28 13:08 yancheng111 阅读(10966) 评论(0) 推荐(0) 编辑
摘要: 一、决策树:转自公众号《数据科学家联盟》 1、决策树 决策树是一个非常有意思的模型,它的建模思路是尽可能模拟人做决策的过程。因此决策树几乎没有任何抽象,完全通过生成决策规则来解决分类和回归问题。因为它的运行机制能很直接地被翻译成人类语言,即使对建模领域完全不了解的非技术人员也能很好地理解它。因此在学 阅读全文
posted @ 2019-12-22 18:10 yancheng111 阅读(1113) 评论(0) 推荐(0) 编辑