matplotlib-3.2.1
摘要:一.简介 1.https://matplotlib.org/ 2.matplotlib中的图 (1)figure:(呈现出来的)整个窗口(画板):可以分为几块(subplot),可以包含一些画布,至少有一个画布用于作图, (2)axes:具有数据空间的图像区域(画布):一个画布只能对应一个窗口,一个
阅读全文
posted @
2020-06-15 17:35
温润有方
阅读(415)
推荐(0)
pandas-1.0.3
摘要:一.简介 1.Python Data Analysis Library 或 pandas 是基于NumPy 的一种工具,主要用于数据处理(数据整理,操作,存储,读取等)和数据分析 2.http://pandas.pydata.org/和https://pandas.pydata.org/docs/p
阅读全文
posted @
2020-06-06 22:29
温润有方
阅读(489)
推荐(0)
numpy-1.18.4
摘要:一.简介 1.主要用于科学计算,主要特点是ndarray数组 2.http://www.numpy.org/ 3.https://numpy.org/doc/1.18/numpy-ref.pdf 二.ndarray类 1.简介:n维数组 (1)相当于python中的容器对象(比如列表),执行效率更高
阅读全文
posted @
2020-05-28 15:12
温润有方
阅读(633)
推荐(0)
降维
摘要:一.相关知识 1.向量空间(线性空间):向量张成的空间(简单来说,就是一些向量及其线性组合组成的集合,而且这个集中定义了一些代数运算,张:向量的线性组合) 2.维度:Rn表示n维实数集的向量空间,n表示向量的维度,也就是需要描述一个向量(或者说是一个数学对象)所需要的参数个数,R表示每个参数是在实数
阅读全文
posted @
2020-05-10 22:02
温润有方
阅读(1791)
推荐(0)
无监督学习-聚类
摘要:一.基本概念 1.无监督学习:数据无标签或者说是未知的,目标是通过对无标记数据的学习来揭示数据的内在性质和规律。主要研究方向有聚类,主要方法有降维 二.聚类 1.聚类:将数据样本划分为若干个通常是不相交的子集,这样每个子集就是一簇或者说是一类,每一类代表类中数据的某些规律,而且这个规律不在其他类中适
阅读全文
posted @
2020-05-10 14:52
温润有方
阅读(1474)
推荐(0)
集成学习
摘要:一.相关概念 1.集成思想:我们的目标是探寻数据的规律,试图找到一个模型,通过学习数据来增强模型表现数据真实规律的性能,但是,我们是不知道数据真实规律对应的模型的,我们只是假设一个能够表现数据的模型,然后通过训练数据来改善它,即使到最后,这个模型也不能完完全全表现数据,不能表现的部分也就是误差,因此
阅读全文
posted @
2020-05-09 17:03
温润有方
阅读(261)
推荐(0)
人工神经网络
摘要:一.相关知识 1.背景:从一颗受精卵成长为一个复杂的多细胞生物,神经系统在生物的成长中起着主导作用,神经系统分为中枢神经系统和周围神经系统两大部分主要组成。其中中枢系统主要分布在脑和脊髓中,分布在脑部的神经系统主要起传递、储存和加工信息,产生各种心理活动,支配与控制生物行为的作用。我们把人的这种特性
阅读全文
posted @
2020-05-08 00:16
温润有方
阅读(1469)
推荐(0)
贝叶斯分类
摘要:一.背景 1.概率:在多元下,(1)联合概率:两个事件同时发生的概率P(A,B) ,(2)条件概率:在某一事件A条件下,另一事件B发生的概率P(B|A),(3)边缘概率:某一事件发生的概率P(A); 2.独立事件:两个没有任何关系的事件互为独立事件,此时两个事件的联合概率为两者概率相乘P(A,B)=
阅读全文
posted @
2020-04-18 21:13
温润有方
阅读(1049)
推荐(0)
决策树以及拓展
摘要:一.决策树(判定树) 1.依据树结构进行决策,目的是产生一棵泛化能力强的判定树,其中叶子结点为决策结果,其他节点对应一个属性测试,根节点包含所有样本,从根节点到叶子结点的路径表示判定的决策路径。 2.首先我们给定一个训练样本集,以及他们的属性集(特征集),然后由根结点开始,每个节点代表一个属性测试,
阅读全文
posted @
2020-04-18 20:28
温润有方
阅读(793)
推荐(0)
SVM
摘要:一.SVM 1.SVM(Support Vector Machines)是一种监督学习中的二分类器,目标是在样本空间内找到一个超平面对数据集进行分类,关键点在于怎样确定这个超平面。 2.训练好的模型的算法复杂度是由支持向量的个数决定的,而不是由数据的维度决定的。所以 SVM 不太容易产生 overf
阅读全文
posted @
2020-04-14 17:36
温润有方
阅读(549)
推荐(0)
关于模型
摘要:模型是对数据的学习,必不可少 一.基本概念 1.模型也被称为学习器(假设/算法),是指能从已有的数据中学习到所需知识的数学模型。 2.相关概念 (1)归纳偏好(inductive bias):机器学习算法在学习过程中对某种类型假设的偏好,比如:存在多个模型能反映训练样本,但是它们对于新的样本却有不同
阅读全文
posted @
2020-04-01 20:52
温润有方
阅读(1086)
推荐(0)
关于数据
摘要:数据是一切的根本。 一.获取数据 1.我们实质是获取所需信息,再把这些信息转为可以字面表示的数据 2.可以使用爬虫scrapy获取数据,但是更一般的是自家数据库中的数据 3.可以获得公用数据集:http://www.kaggle.com/datasets等网站,也可以自己收集数据 4.人工合成数据:
阅读全文
posted @
2020-03-25 19:42
温润有方
阅读(757)
推荐(0)
机器学习一般流程
摘要:预备:把实际问题转化为机器学习问题,即能够从现有的数据中学的某种规律,从而解决实际问题(预测或分类) 机器学习是数据和模型的结合。 一.获取数据:人工合成、爬虫、数据库、公开数据集、收集数据... 二.数据预处理: 1.数据清洗:缺失数据、重复数据、一致性检验 2.数据转成数字:经验、一般映射 3.
阅读全文
posted @
2020-02-20 15:05
温润有方
阅读(1966)
推荐(0)
线性模型
摘要:一.线性模型(linear model) 其中w直观表达了各属性在预测中的重要性 二.线性回归模型 1.线性回归,下面 x 的第一个下标表示第几个样例,第二个下标表示该样例的第几个特征,也有上下标的写法,上标表示第几个样例,下标表示第几个特征 2.一元线性回归:仅考虑一个特征,即输入属性的数目只有一
阅读全文
posted @
2018-09-04 21:48
温润有方
阅读(2017)
推荐(1)
机器学习简介
摘要:一.机器学习(machine learning) 1.它致力于研究如何通过计算的手段,利用经验来改善系统自身的性能 2.研究的主要内容是学习算法(learning algorithm)(在计算机上从数据中产生模型(model)或者说学习器(learner)的算法) 3.简而言之,机器学习:根据已有的
阅读全文
posted @
2018-08-06 15:47
温润有方
阅读(630)
推荐(0)