随笔分类 - 机器学习
摘要:2018-12-05 22:09:03 先定义几个参数 输入图片大小 W×W Filter大小 F×F 步长 S padding的像素数 P 于是我们可以得出: N = (W − F + 2P) / S + 1 输出图片大小为 N×N。
阅读全文
摘要:2018-12-05 20:28:15 在机器学习领域有一个很重要的假设,即独立同分布假设,也就是说训练集和测试集是满足相同分布的,这是通过训练数据获得的模型能够在测试集获得好的效果的一个基本保障。而BatchNorm就是在深度神经网络训练过程中使得每一层神经网络的输入保持相同分布。 为什么深度神经
阅读全文
摘要:2018-12-04 14:34:25 使用python Tqdm进度条库让你的python进度可视化 Tqdm在阿拉伯语表示进步,在西班牙语中表示我非常爱你。是一个快速,可扩展的Python进度条,可以在Python长循环中添加一个进度提示信息,用户只需要封装任意的迭代器tqdm(iterator
阅读全文
摘要:2018-12-04 14:05:49 Visdom是Facebook专门为PyTorch开发的一款可视化工具,其开源于2017年3月。Visdom十分轻量级,但却支持非常丰富的功能,能胜任大多数的科学运算可视化任务。其可视化界面如图所示。 Visdom可以创造、组织和共享多种数据的可视化,包括数值
阅读全文
摘要:2017-12-31 19:08:37 k-平均算法源于信号处理中的一种向量量化方法,现在则更多地作为一种聚类分析方法流行于数据挖掘领域。k-means的目的是:把样本划分到k个聚类中,使得每个点都属于离他最近的均值(此即聚类中心)对应的聚类,以之作为聚类的标准。 这个问题在计算上是困难的(NP困难
阅读全文
摘要:2017-12-18 23:42:33 一、什么是深度学习 深度学习(deep neural network)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 --Wiki 在人工智能领域,有一个方法叫机器学习。在机器学习这个方法里,有一类算法
阅读全文
摘要:2017-12-17 19:12:10 一、Evolutionary Algorithm 进化算法,也被成为是演化算法(evolutionary algorithms,简称EAs),它不是一个具体的算法,而是一个“算法簇”。进化算法的产生的灵感借鉴了大自然中生物的进化操作,它一般包括基因编码,种群初
阅读全文
摘要:2017-12-17 13:08:50 SVM所做的工作简言之就是找到一个超平面将两组数据分开,并且这个超平面的Margin要最大。 一、线性SVM 所谓线性SVM是指一组数据是线性可分的,也就是说存在一个超平面可以将数据进行二分。 任何超平面都可以写作满足下面方程的点集 : x → {\displ
阅读全文
摘要:2017-12-15 19:43:07 决策树算法是每次按一个特征进行分类直到分完。 每次选择分类的特征很重要,我们希望的情况是,前几次分类就能将总体分得七七八八,最后再进行一些细枝末节的分类。 首先先举个例子来直观的了解一下决策树算法。 小王是一家著名高尔夫俱乐部的经理。但是他被雇员数量问题搞得心
阅读全文
摘要:2017-12-15 19:08:50 朴素贝叶斯分类器是一种典型的监督学习的算法,其英文是Naive Bayes。所谓Naive,就是天真的意思,当然这里翻译为朴素显得更学术化。 其核心思想就是利用贝叶斯公式来计算各个类别的概率,最后从中选择概率最大的那个作为最终的结果。 贝叶斯公式: 朴素贝叶斯
阅读全文
摘要:2017-12-04 15:20:07 所谓推荐算法就是利用用户的一些行为,通过一些数学算法,推测出用户可能喜欢的东西。 推荐算法主要有两种: 基于内容: 原理是用户喜欢和自己关注过的Item在内容上类似的Item,比如你看了哈利波特I,基于内容的推荐算法发现哈利波特II-VI,与你以前观看的在内容
阅读全文
摘要:2017-12-04 16:31:10 数据预处理(data preprocessing)是指在主要的处理以前对数据进行的一些处理。 比如缺项,噪声(工资=-100),不匹配(年龄和出生日期不匹配),冗余等等。 一、数据清洗 1)缺少数据 可能的原因有设备故障,数据没有提供,N/A不适用。 缺少数据
阅读全文
摘要:2017-12-02 14:27:18 一、术语 Items:项,简记I Transaction:所有项的一个非空子集,简记T Dataset:Transaction的一个集合,简记D 关联规则: 一个Dataset的例子: 我们的目的就是找到类似买了面包->黄油这样的关联关系。 二、支持度与置信度
阅读全文
摘要:2017-07-21 15:22:05 Matplotlib库是一个优秀的python的数据可视化的第三方类库,其中的pyplot支持了类似matlab的图像输出操作。matplotlib.pyplot是绘制各类可视化图形的命令子库,相当于快捷方式。 一、matplotlib.pyplot子库 x
阅读全文
摘要:2017-07-20 15:18:25 k近邻(k-Nearest Neighbour, 简称kNN)学习是一种常用的监督学习方法,其工作机制非常简单,对某个给定的测试样本,基于某种距离度量找出训练集中与其最靠近的k个训练样本,然后基于这k个‘邻居’的信息进行预测。一般来说,在分类中采用‘投票法’,
阅读全文
摘要:2017-06-28 13:56:25 Numpy 提供了一个强大的N维数组对象ndarray,提供了线性代数,傅里叶变换和随机数生成等的基本功能,可以说Numpy是Scipy,Pandas等科学计算库的基础。 使用前需要引入numpy包,一般会给他起个别名为np。 一、ndarray的元素类型 n
阅读全文
摘要:2017-06-25 20:53:07 一、机器学习的定义 Tom Mitchell:机器学习是对能通过经验自动改进的计算机算法的研究。机器学习可以彰显数据背后真正的含义。 二、机器学习的分类 (1)监督学习 supervised learning 所谓监督学习,就是指在学习过程中会有一组标准答案提
阅读全文

浙公网安备 33010602011771号