摘要: 1 案例介绍泰坎尼克号遇难。已知部分船员的个人信息和是否幸存,来预测其他船上人的存活情况。1.1 数据分析我们所要做的第一步是观察和分析数据,这里使用Pandas 进行处理。可以判断一共有12列,第一列是ID,第二列是分类标签,因此是十个特征,一个二分类标签。多个特征含有空值。Age列空值很多,且是... 阅读全文
posted @ 2015-10-18 15:30 走那条小路 阅读(1201) 评论(0) 推荐(0) 编辑
摘要: 分类算法一 SVCclass sklearn.svm.SVC(C=1.0, kernel='rbf', degree=3, gamma=0.0, coef0=0.0, shrinking=True, probability=False, tol=0.001, cache_size=200, clas... 阅读全文
posted @ 2015-10-17 17:59 走那条小路 阅读(2836) 评论(0) 推荐(0) 编辑
摘要: 在本文后续部分,我将使用下面这样的pandas 引入约定import pandas as pdimport numpy as npfrom pandas import Series,DataFrame创建对象1.可以通过传递一个list对象来创建Series对象2、可以通过传递一个numpy arr... 阅读全文
posted @ 2015-10-12 11:23 走那条小路 阅读(663) 评论(0) 推荐(0) 编辑
摘要: 在机器学习的算法学习中,不但要有理论的学习,对其算法的实践同样是重要的一环。基于此,找到合适的数据集十分必要。以下是我个人在学习中找到的数据集,在未来的学习中会持续更新:加州大学欧文分校的机器学习数据库(www.ics.uci.edu/~mlearn)搜狗实验室文本分类数据 http://www.s... 阅读全文
posted @ 2015-10-08 11:28 走那条小路 阅读(327) 评论(0) 推荐(0) 编辑
摘要: 感知机是二类分类的线性分类模型,其输入为实例的特征向量,输出为实例的类别,取+1,-1。感知机学习旨在求出将训练数据进行线性划分的分离超平面。具体介绍如下:感知机模型感知机学习策略感知机学习算法1 感知机模型输入空间(特征空间)是Rn输出空间是{+1,-1}由输入空间到输出空间的函数 f(x)=si... 阅读全文
posted @ 2015-09-22 20:40 走那条小路 阅读(207) 评论(0) 推荐(0) 编辑
摘要: 决策树原理首先我们有一个用于训练的群组,前n列是属性,最后一列是标签;我们对决策树的划分是基于群组的混乱程度来划分的,也即是每次寻找一个属性,对该属性分为两组,使得他们的群组混乱程度降低。本文通过以下几个方面来讲解:定义树节点划分群组混乱程度的表示方式构造树决策树的显示对测试样本分类剪枝处理缺失数据... 阅读全文
posted @ 2015-09-20 22:02 走那条小路 阅读(677) 评论(0) 推荐(0) 编辑
摘要: 一机器学习是什么?通过对资料的处理来达到某种技巧,即一种改善某一方面性能的能力。如果要求辨识一棵树?传统程序设计是先定义一颗树,然后再来辨别。但实际上人的学习不是这样的,而是通过对大量的树的观察,而内在的演化成的一种分辨的能力。机器学习的可能应用场景:对环境不太具体了解;(送一个机器到一个未知的环境... 阅读全文
posted @ 2015-09-15 20:45 走那条小路 阅读(228) 评论(0) 推荐(0) 编辑
摘要: 各分类算法:KNNfrom sklearn.neighbors import KNeighborsClassifierimport numpy as npdef KNN(X,y,XX):#X,y 分别为训练数据集的数据和标签,XX为测试数据 model = KNeighborsClassifi... 阅读全文
posted @ 2015-08-23 15:58 走那条小路 阅读(2000) 评论(0) 推荐(0) 编辑
摘要: 聚类算法总结一 ‘层次’方法层次方法创建给定数据对象集的层次分解。根据层次的分解的形成方式,层次的方法又可以分为凝聚和分裂方法。凝聚法:自底向上。开始将每个对象形成单独的组,然后层次合并相似的组,直到所有的组合合并成一个或者满足某个终止条件。分裂法:自顶向下。开始将所有对象置于一个簇中,每次迭代,簇... 阅读全文
posted @ 2015-08-20 20:39 走那条小路 阅读(450) 评论(0) 推荐(0) 编辑
摘要: 一 数据预处理训练数据集和验证数据集分别为train.csv和test.csv。数据集下载地址:http://pan.baidu.com/s/1eQyIvZG要分别对训练数据集和验证数据集进行分析,分析其内部数据的特征,下面分别对两个数据集进行处理:1.1 训练数据集处理train.csv 里面结构... 阅读全文
posted @ 2015-08-17 17:20 走那条小路 阅读(5359) 评论(0) 推荐(0) 编辑