随笔分类 -  A---机器学习笔记

摘要:1. 线性代数中矩阵乘法: np.dot() 1. 线性代数中矩阵乘法: np.dot() 1. 线性代数中矩阵乘法: np.dot() import numpy as np ​ # 2 x 3 matrix1 = np.array([[1, 2, 3], [4, 5, 6]]) ​ # 3 x 2 阅读全文
posted @ 2019-01-23 15:18 douzujun 阅读(1993) 评论(0) 推荐(0)
摘要:import matplotlib.pyplot as plt import numpy as np import sklearn import sklearn.datasets import sklearn.linear_model def plot_decision_boundary(model, X, y): # Set min and max values and give i... 阅读全文
posted @ 2019-01-19 17:57 douzujun 阅读(4804) 评论(0) 推荐(0)
摘要:contour和contourf 绘制三维图 其中前两个参数x和y:两个等长一维数组 第三个参数z: 二维数组(表示平面点xi, yi映射的函数值)。 由于contourf可以填充等高线之间的空隙颜色,呈现出区域的分划状,所以很多分类机器学习模型的可视化常会借助其展现。 参考:https://blo 阅读全文
posted @ 2019-01-19 17:37 douzujun 阅读(6040) 评论(0) 推荐(0)
摘要:np.c_给numpy数组添加列 np.r_给numpy数组添加行 ravel(): 将多维数组降成一维, 返回的是视图 阅读全文
posted @ 2019-01-19 15:33 douzujun 阅读(531) 评论(0) 推荐(0)
摘要:Planar data classification with one hidden layer 你会学习到如何: 用单隐层实现一个二分类神经网络 使用一个非线性激励函数,如 tanh 计算交叉熵的损失值 实现前向传播和后向传播 1 - Packages(导入包) 需要导入的包: numpy:Pyt 阅读全文
posted @ 2019-01-18 21:25 douzujun 阅读(1945) 评论(0) 推荐(1)
摘要:3.1 神经网络概述(Neural Network Overview ) (神经网络中,我们要反复计算a和z,最终得到最后的loss function) 3.2 神经网络的表示(Neural Network Representation) 3.3 计算一个神经网络的输出(Computing a Ne 阅读全文
posted @ 2019-01-17 14:40 douzujun 阅读(1666) 评论(1) 推荐(0)
摘要:scipy.misc.imresize 不同于普通的reshape, imresize不是单纯的改变图像矩阵的维度,而是能将图片重采样为指定像素,这样给深度学习中训练图像数据带来方便。 import numpy as np import matplotlib.pyplot as plt import 阅读全文
posted @ 2019-01-17 00:38 douzujun 阅读(10154) 评论(0) 推荐(0)
摘要:Logistic Regression with a Neural Network mindset You will learn to: Build the general architecture of a learning algorithm, including: Initializing p 阅读全文
posted @ 2019-01-14 15:42 douzujun 阅读(4308) 评论(0) 推荐(0)
摘要:总结 一、处理数据 1.1 向量化(vectorization) (height, width, 3) > 展开shape为(heigh*width*3, m)的向量 1.2 特征归一化(Normalization) 一般数据,使用标准化(Standardlization), z(i) = (x(i 阅读全文
posted @ 2019-01-10 16:44 douzujun 阅读(2482) 评论(0) 推荐(0)
摘要:此篇文章为转载:https://mp.weixin.qq.com/s/Mc8yYkDTj7I2KYGALceHfw 侵删! 一、序 不管你在数据科学的哪一个方向研究,可能数据不平衡(imbalanced data)都是一个常见的问题。很多人总是会强调极端状况下的数据不平衡,如医疗数据,犯罪数据等。但 阅读全文
posted @ 2018-06-09 18:35 douzujun
摘要:注:此篇博客为转载,尊重原创。原文链接地址为:http://blog.csdn.net/longxinchen_ml/article/details/50749614 作者: 龙心尘 && 寒小阳 时间:2016年2月。 出处:http://blog.csdn.net/longxinchen_ml/ 阅读全文
posted @ 2018-06-05 12:59 douzujun
摘要:以下均为自己看视频做的笔记,自用,侵删! K最近邻(k-Nearest Neighbor,KNN)分类算法,该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。 K-近邻算法步骤: 对于未知类别属性数据集中的点: 计算已知 阅读全文
posted @ 2018-05-14 14:31 douzujun 阅读(7789) 评论(0) 推荐(0)
摘要:以下均为自己看视频做的笔记,自用,侵删! 还参考了:http://www.ai-start.com/ml2014/ 在监督学习中,许多学习算法的性能都非常类似,因此,重要的不是你该选择使用学习算法A还是学习算法B,而更重要的是,应用这些算法时,所创建的大量数据在应用这些算法时,表现情况通常依赖于你的 阅读全文
posted @ 2018-04-27 20:13 douzujun 阅读(2491) 评论(0) 推荐(1)
摘要:垃圾邮件过滤实例 阅读全文
posted @ 2018-02-22 00:38 douzujun 阅读(481) 评论(0) 推荐(0)
摘要:以下均为自己看视频做的笔记,自用,侵删! (p(h): 先验概率) 贝叶斯拼写检查器实现 In [1]: import re, collections def words(text): return re.findall('[a-z]+', text.lower()) def train(featu 阅读全文
posted @ 2018-02-21 23:45 douzujun 阅读(1423) 评论(2) 推荐(0)
摘要:主动学习: 主动学习的过程:需要分类器与标记专家进行交互。一个典型的过程: (1)基于少量已标记样本构建模型 (2)从未标记样本中选出信息量最大的样本,交给专家进行标记 (3)将这些样本与之前样本进行融合,并构建模型 (4)重复执行步骤(2)和步骤(3),直到stopping criterion(不 阅读全文
posted @ 2018-02-03 22:14 douzujun 阅读(476) 评论(0) 推荐(0)
摘要:以下均为自己看视频做的笔记,自用,侵删! 还参考了:http://www.ai-start.com/ml2014/ In [8]: %matplotlib inline import pandas as pd import matplotlib.pylab as plt iris_data = pd 阅读全文
posted @ 2018-01-30 19:50 douzujun 阅读(3106) 评论(0) 推荐(0)
摘要:随机:数据采样随机,特征选择随机 (数据采样,有放回) 阅读全文
posted @ 2018-01-30 19:39 douzujun 阅读(637) 评论(0) 推荐(0)
摘要:以下均为自己看视频做的笔记,自用,侵删! 还参考了:http://www.ai-start.com/ml2014/ 决策树的训练与测试 如何切分特征(选择节点) 衡量标准-熵 信息增益 决策树构造实例 信息增益:表示特征X使得类Y的不确定性减小的程度。(分类后的专一性,希望分类后的结果是同类在一起) 阅读全文
posted @ 2018-01-29 16:34 douzujun 阅读(402) 评论(0) 推荐(0)
摘要:逻辑回归(Logistic regression) 以下均为自己看视频做的笔记,自用,侵删! 还参考了:http://www.ai-start.com/ml2014/ 用梯度下降求解逻辑回归 Logistic Regression The data The data The data The dat 阅读全文
posted @ 2018-01-28 13:32 douzujun 阅读(8438) 评论(6) 推荐(1)