03 2018 档案
模型评估与选择
摘要:机器学习算法完整版见fenghaootong-github 模型评估与选择 经验误差与过拟合 评估方法 性能度量 比较检验 偏差与方差 经验误差与过拟合 误差率:分类错误的样本数占样本总数的比例 精度:1 - 错误率 误差:学习器的实际预测输出与样本的真实输出之间的差异 过拟合:训练样本学的太好,就 阅读全文
posted @ 2018-03-08 11:01 一小白 阅读(636) 评论(0) 推荐(0)
强化学习
摘要:机器学习算法完整版见fenghaootong-github 强化学习原理(RL)RL与有监督学习、无监督学习的比较:有监督的学习是从一个已经标记的训练集中进行学习,训练集中每一个样本的特征可以视为是对该situation的描述,而其label可以视为是应该执... 阅读全文
posted @ 2018-03-08 10:58 一小白 阅读(227) 评论(0) 推荐(0)
强化学习实例
摘要:机器学习算法完整版见fenghaootong-github 强化学习应用实例导入模块 # -*- coding: utf-8 -*-import numpy as npimport pandas as pdimport time设置参数 #产生伪随机数列np... 阅读全文
posted @ 2018-03-08 10:57 一小白 阅读(684) 评论(0) 推荐(0)
KNN算法
摘要:机器学习算法完整版见fenghaootong-github KNN算法 kNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。 阅读全文
posted @ 2018-03-08 10:54 一小白 阅读(183) 评论(0) 推荐(0)
KNN算法实例
摘要:机器学习算法完整版见fenghaootong-github MINST for KNN 数据集描述 数据文件train.csv和test.csv包含从零到九的手绘数字的灰度图像。 每个图像是高28个像素,宽28个像素,总共784像素,每个像素都有一个与之相关的像素值,用来表示像素的亮度,数字越高亮度 阅读全文
posted @ 2018-03-08 10:52 一小白 阅读(322) 评论(0) 推荐(0)
RNN算法
摘要:机器学习算法完整版见fenghaootong-github 循环神经网络原理(RNN) RNN是在自然语言处理领域中最先被用起来的 语言模型就是这样的东西:给定一个一句话前面的部分,预测接下来最有可能的一个词是什么。 简单的循环神经网络由输入层、一个隐藏层和一个输出层组成: x是一个向量,它表示输入 阅读全文
posted @ 2018-03-08 10:50 一小白 阅读(1024) 评论(0) 推荐(0)
RNN实例
摘要:机器学习算法完整版见fenghaootong-github 航空公司客运流量预测 数据集 数据集有两列,分别是时间和客运流量,用到的主要是客运流量 导入模块 导入数据 passengers time 1949-01 112 1949-02 118 1949-03 132 1949-04 129 19 阅读全文
posted @ 2018-03-08 10:45 一小白 阅读(458) 评论(0) 推荐(0)
cnn算法
摘要:机器学习算法完整版见fenghaootong-github 卷积神经网络原理(CNN) 卷积神经网络CNN的结构一般包含这几个层: 输入层:用于数据的输入 卷积层:使用卷积核进行特征提取和特征映射 激励层:由于卷积也是一种线性运算,因此需要增加非线性映射 池化层:进行下采样,对特征图稀疏处理,减少数 阅读全文
posted @ 2018-03-08 10:39 一小白 阅读(1207) 评论(0) 推荐(0)
CNN实例
摘要:机器学习算法完整版见fenghaootong-github MINST 1 Data 1.1 get data use panadas to read data from .csv file split dataset into training and validation datasets 1. 阅读全文
posted @ 2018-03-08 10:35 一小白 阅读(430) 评论(0) 推荐(0)
神经网络算法
摘要:机器学习算法完整版见fenghaootong-github 神经网络原理 感知机学习算法 神经网络 从感知机到神经网络 多层前馈神经网络 bp算法 从感知机到神经网络 多层前馈神经网络 bp算法 感知机学习算法 感知机(perceptron)是二分类的线性分类模型,属于监督学习算法。输入为实例的特征 阅读全文
posted @ 2018-03-08 10:29 一小白 阅读(2391) 评论(0) 推荐(0)
神经网络实例
摘要:机器学习算法完整版见fenghaootong-github 皮马印第安人糖尿病 数据集 是对皮马印第安人糖尿病分类 代码 数据 模型 编译模型 训练模型 评估模型 预测 阅读全文
posted @ 2018-03-08 10:26 一小白 阅读(639) 评论(0) 推荐(0)
SVM
摘要:机器学习算法完整版见fenghaootong-githubSVMLinear Support Vector MachineDual Support Vector MachineKernel Support Vector MachineSoft-Margin ... 阅读全文
posted @ 2018-03-07 15:51 一小白 阅读(379) 评论(0) 推荐(0)
SVM算法实例
摘要:机器学习算法完整版见fenghaootong-githubMINST for SVM导入模块 from sklearn import svmimport pandas as pdimport time导入数据 df = pd.read_csv('../DAT... 阅读全文
posted @ 2018-03-07 15:48 一小白 阅读(429) 评论(0) 推荐(0)
随机森林算法
摘要:机器学习算法完整版见fenghaootong-github随机森林(Random Forests)鉴于决策树容易过拟合的缺点,随机森林采用多个决策树的投票机制来改善决策树 我们假设随机森林使用了m棵决策树,那么就需要产生m个一定数量的样本集来训练每一棵树,如... 阅读全文
posted @ 2018-03-07 15:44 一小白 阅读(225) 评论(0) 推荐(0)
随机森林实例
摘要:机器学习算法完整版见fenghaootong-githubTitanic预测哪些乘客会幸存下来数据集数据特征: Survived:是否存活(0代表否,1代表是) Pclass:社会阶级(1代表上层阶级,2代表中层阶级,3代表底层阶级)Name:船上乘客的名... 阅读全文
posted @ 2018-03-07 15:40 一小白 阅读(513) 评论(0) 推荐(0)
决策树算法
摘要:机器学习算法完整版见fenghaootong-github决策树(Decision Trees)构建决策树三个步骤:特征选择决策数生成决策数剪枝特征选择熵(entropy) 熵是表示随机变量不确定性的度量。设X是一个取有限个值的离散随机变量,其概率分布为P... 阅读全文
posted @ 2018-03-07 15:14 一小白 阅读(452) 评论(0) 推荐(0)
决策树算法实例
摘要:机器学习算法完整版见fenghaootong-githubTitanic预测哪些乘客会幸存下来数据集数据特征: Survived:是否存活(0代表否,1代表是) Pclass:社会阶级(1代表上层阶级,2代表中层阶级,3代表底层阶级)Name:船上乘客的名... 阅读全文
posted @ 2018-03-07 15:11 一小白 阅读(553) 评论(0) 推荐(0)
贝叶斯算法
摘要:机器学习算法完整版见fenghaootong-github 贝叶斯(Bayesian Techniques)朴素贝叶斯高斯贝叶斯分类器多项式贝叶斯分类器伯努利贝叶斯分类器贝叶斯定理:P(Bi|A)=P(A|Bi)P(B)∑j=1nP(A|B... 阅读全文
posted @ 2018-03-07 14:44 一小白 阅读(281) 评论(0) 推荐(0)
垃圾邮件处理
摘要:机器学习算法完整版见fenghaootong-github 垃圾邮件分类在DATA/email/spam文件夹中有25封垃圾邮件,在DATA/email/ham中有25封正常邮件,将其进行垃圾邮件分类。导入需要的库 from numpy import *... 阅读全文
posted @ 2018-03-07 14:43 一小白 阅读(207) 评论(0) 推荐(0)
贝叶斯实例
摘要:机器学习算法完整版见fenghaootong-github 贝叶斯解决手写体数据集描述数据文件train.csv和test.csv包含从零到九的手绘数字的灰度图像。每个图像是高28个像素,宽28个像素,总共784像素,每个像素都有一个与之相关的像素值,用... 阅读全文
posted @ 2018-03-07 14:36 一小白 阅读(353) 评论(0) 推荐(0)
逻辑回归(Logistic+Regression)经典实例
摘要:机器学习算法完整版见fenghaootong-github 房价预测数据集描述数据共有81个特征 SalePrice - the property’s sale price in dollars. This is the target variabl... 阅读全文
posted @ 2018-03-07 14:23 一小白 阅读(1256) 评论(0) 推荐(0)
逻辑回归(Logistic+Regression)
摘要:机器学习算法完整版见fenghaootong-github 逻辑回归(Logistic Regression)Regression问题的常规步骤为: 寻找h函数(即hypothesis);构造J函数(损失函数);想办法使得J函数最小并求得回归参数(θ... 阅读全文
posted @ 2018-03-07 14:21 一小白 阅读(196) 评论(0) 推荐(0)
DataExploration
摘要:机器学习算法完整版见fenghaootong-github DataExplorationWe know the data is very important in data science,but it is time-consuming.impor... 阅读全文
posted @ 2018-03-07 14:20 一小白 阅读(172) 评论(0) 推荐(0)
KNN算法经典实例
摘要:机器学习算法完整版见fenghaootong-github MINST for KNN数据集描述数据文件train.csv和test.csv包含从零到九的手绘数字的灰度图像。每个图像是高28个像素,宽28个像素,总共784像素,每个像素都有一个与之相关... 阅读全文
posted @ 2018-03-07 14:18 一小白 阅读(871) 评论(0) 推荐(0)
KNN算法
摘要:机器学习算法完整版见fenghaootong-github KNN算法kNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一个... 阅读全文
posted @ 2018-03-07 14:17 一小白 阅读(198) 评论(0) 推荐(0)