随笔分类 -  Machine Learning

摘要:"代码下载:github" PASCAL VOC数据集 PASCAL VOC为图像识别和分类提供了一整套标准化的优秀的数据集,从2005年到2012年每年都会举行一场图像识别challenge 默认为20类物体 1 数据集结构 ①JPEGImages JPEGImages文件夹中包含了PASCAL 阅读全文
posted @ 2020-02-16 13:38 Neo007 阅读(1172) 评论(0) 推荐(0)
摘要:@(131 Machine Learning | 机器学习) PCA是一种特征选择方法,可将一组相关变量转变成一组基础正交变量 25 PCA的回顾和定义 Demo: when to use PCA 1. latent features driving the patterns in the data 阅读全文
posted @ 2018-07-18 19:09 Neo007 阅读(244) 评论(0) 推荐(0)
摘要:@(131 Machine Learning | 机器学习) 1 Feature Scaling transforms features to have range [0,1] according to the formula $x' = \frac{x x_{min}}{x_{max} x_{mi 阅读全文
posted @ 2018-06-21 09:20 Neo007 阅读(240) 评论(0) 推荐(0)
摘要:@(131 Machine Learning | 机器学习) 零、 Goal 1. How Unsupervised Learning fills in that model gap from the original Machine Learning work flow 2.How to comp 阅读全文
posted @ 2018-06-20 09:45 Neo007 阅读(888) 评论(0) 推荐(0)
摘要:监督学习: 为CharityML寻找捐献者 监督学习: 为CharityML寻找捐献者 监督学习: 为CharityML寻找捐献者 开始 在这个项目中,你将使用1994年美国人口普查收集的数据,选用几个监督学习算法以准确地建模被调查者的收入。然后,你将根据初步结果从中选择出最佳的候选算法,并进一步优 阅读全文
posted @ 2018-06-07 21:05 Neo007 阅读(1401) 评论(0) 推荐(0)
摘要:@(131 Machine Learning | 机器学习) Demo 直观来说就是有多少个状态就有多少比特,而且只有一个比特为1,其他全为0的一种码制 {sex:{male, female}}​ 得到独热码为{100}男性 ,{010}女性 Dummy Variable 虚拟变量的含义 虚拟变量又 阅读全文
posted @ 2018-05-21 10:42 Neo007 阅读(1231) 评论(0) 推荐(0)
摘要:Support Vector Machines 引言 内核方法是模式分析中非常有用的算法,其中最著名的一个是支持向量机SVM 工程师在于合理使用你所拥有的toolkit 相关代码 "sklearn SVM" 本文要点 1.Please explain Support Vector Machines 阅读全文
posted @ 2018-02-24 21:01 Neo007 阅读(598) 评论(0) 推荐(0)
摘要:零、 Introduction 1.learn over a subset of data choose the subset uniformally randomly (均匀随机地选择子集) apply some learning algorithm 解决第一个问题 :Boosting 算法 不再 阅读全文
posted @ 2018-02-22 20:39 Neo007 阅读(3705) 评论(0) 推荐(0)
摘要:| KNN | K Means | | | : : | | 1.分类算法 | 聚类算法| | 2.监督学习 | 非监督学习 | | 3.数据类型:喂给它的数据集是带label的数据,已经是完全正确的数据 |喂给它的数据集是无label的数据,是杂乱无章的,经过聚类后才变得有点顺序,先无序,后有序 | 阅读全文
posted @ 2018-02-08 23:21 Neo007 阅读(279) 评论(0) 推荐(0)
摘要:预约助教问题: 1.计算1 NN,k nn和linear regression这三个算法训练和查询的时间复杂度和空间复杂度? 一、 WHy 最简单最初级的分类器是将全部的训练数据所对应的类别都记录下来,当测试对象的属性和某个训练对象的属性完全匹配时,便可以对其进行分类。但是怎么可能所有测试对象都会找 阅读全文
posted @ 2018-02-08 22:18 Neo007 阅读(2152) 评论(0) 推荐(0)
摘要:python There are two functions to finish: First, in activate(), write the sigmoid activation function. Second, in update(), write the gradient descent 阅读全文
posted @ 2018-01-18 11:43 Neo007 阅读(2378) 评论(0) 推荐(0)
摘要:一、Introduction Perceptron can represent AND,OR,NOT 用初中的线性规划问题理解 异或的里程碑意义 想学的通透,先学历史! 据说在人工神经网络(artificial neural network, ANN)发展初期,由于无法实现对多层神经网络(包括异或逻 阅读全文
posted @ 2018-01-17 21:18 Neo007 阅读(7173) 评论(0) 推荐(0)
摘要:根据周志华老师的讲法,这里 logistic 是对数几率的意思,所以正确的翻译方法应该叫 对数几率回归, 所以不要以为这个东西叫 逻辑回归,逻辑回归是错误的翻译。 阅读全文
posted @ 2018-01-17 11:05 Neo007 阅读(408) 评论(0) 推荐(0)
摘要:我很好奇这个问题,于是搜了一下。我发现 Regression 这个词 本意里有“衰退”的意思。 词根词缀: re 回 , 向后 + gress 步 , 级 + ion 名词词尾 即Regression 本意为 衰退,退步 实际上是生物统计学家高尔顿研究父母身高和子女身高时发现 “即使父母的身高都‘极 阅读全文
posted @ 2018-01-17 10:08 Neo007 阅读(734) 评论(0) 推荐(1)
摘要:一、什么是回归? 孩子的身高是否与父母有关? 实际上,父母和孩子的身高是受到回归效应影响的。在时间纵轴上受影响、具有随机性的事物,无不遵循这一规律。 只要数据足够大,人类的身高或者智商,都有趋于平均值的回归性。 1.1 回归与函数逼近 function approximation or regres 阅读全文
posted @ 2018-01-13 11:49 Neo007 阅读(572) 评论(0) 推荐(0)
摘要:三段论 Why What How 为什么用交叉验证法? 什么是交叉验证法? 主要有哪些方法? Python代码实例(sklearn) 一、为什么用交叉验证? The Goal is always to Generalize(泛化) Test Set 对于未知未来世界的假设,构建模型时绝对不可以动,否 阅读全文
posted @ 2018-01-13 11:27 Neo007 阅读(1262) 评论(0) 推荐(0)
摘要:决策树之ID3算法 Content 1.ID3概念 2.信息熵 3.信息增益 Information Gain 4. ID3 bias 5. Python算法实现(待定) 一、ID3概念 ID3算法最早是由罗斯昆(J. Ross Quinlan)于1975年在悉尼大学提出的一种分类预测算法,算法的核 阅读全文
posted @ 2018-01-10 11:59 Neo007 阅读(947) 评论(0) 推荐(0)
摘要:Content 1.decision tree representation 2.ID3:a top down learning algorithm 3.expressiveness of data 可表达性 4.bias of ID3 偏差 5.best attributes 最佳属性 Gain( 阅读全文
posted @ 2018-01-10 10:32 Neo007 阅读(648) 评论(0) 推荐(0)
摘要:一、分类与回归的区别 两类监督学习 Classification Regression 分类和回归的区别在于输出变量的类型(而非输入变量)。 定性输出称为分类,或者说是离散变量预测(discrete)eg. X—— true or false; 定量输出称为回归,或者说是连续变量预测(continu 阅读全文
posted @ 2018-01-09 16:43 Neo007 阅读(435) 评论(0) 推荐(0)
摘要:Supervised Learning Unsupervised Learning Reinforced Learning Goal: How to apply these methods How to evaluate each methods What is Machine Learning? 阅读全文
posted @ 2018-01-08 14:33 Neo007 阅读(1893) 评论(0) 推荐(0)