摘要: 3.3缺失值处理R中缺失值以NA表示,判断数据是否存在缺失值的函数有两个,最基本的函数是is.na()它可以应用于向量、数据框等多种对象,返回逻辑值。> attach(data)The following objects are masked fromdata (pos = 3):city, pri... 阅读全文
posted @ 2015-05-15 21:22 机器学习算法与Python 阅读(3368) 评论(0) 推荐(0)
摘要: 2.1序列概览列表和元组的主要区别在于,列表可以修改,元组则不能。也就是说如果要根据要求来添加元素,那么列表可能会更好用;而出于某些原因,序列不能修改的时候,使用元组则更为合适。使用后者的理由通常是技术性的,它与Python内部的运作方式有关。这也是内建函数可能返回元组的原因。一般来说,在几乎所有的... 阅读全文
posted @ 2015-05-14 09:32 机器学习算法与Python 阅读(534) 评论(0) 推荐(0)
摘要: 1.1数据分析概述1.1.1数据分析的原则(1)数据分析是为了验证假设的问题,需要提供必要的数据验证。在数据分析中,分析模型构建完成后,需要利用测试数据验证模型的正确性。(2)数据分析是为了挖掘更多的问题,并找到深层次的原因。(3)不能为了做数据分析而做数据分析。1.1.2数据分析的步骤(1)探索性... 阅读全文
posted @ 2015-05-14 09:28 机器学习算法与Python 阅读(1933) 评论(2) 推荐(1)
摘要: 一、playwith包简介playwith包提供了一个GTK+图形用户界面(GUI),使得用户可以编辑R图形并与其交互。playwith()函数允许用户识别和标注点、查看一个观测所有的变量值、缩放和旋转图形、添加标注(文本、箭头、线条、矩形、标题和标签)、修改视觉元素(颜色、文本大小等)、应用先前存... 阅读全文
posted @ 2015-05-12 14:39 机器学习算法与Python 阅读(1384) 评论(0) 推荐(0)
摘要: 16.2.4 图形参数在lattice图形中,lattice函数默认的图形参数包含在一个很大的列表对象中,你可通过trellis.par.get()函数来获取,并用trellis.par.set()函数来修改。show.settings()函数可展示当前的图形参数设置情况。查看当前的默认设置,并将它... 阅读全文
posted @ 2015-05-11 23:08 机器学习算法与Python 阅读(1723) 评论(0) 推荐(2)
摘要: 16.1 R 中的四种图形系统基础图形函数可自动调用,而grid和lattice函数的调用必须要加载相应的包(如library(lattice))。要调用ggplot2函数需下载并安装该包(install.packages("ggplot2")),第一次使用前还要进行加载(library(ggplo... 阅读全文
posted @ 2015-05-11 08:52 机器学习算法与Python 阅读(1122) 评论(0) 推荐(1)
摘要: 处理缺失数据的高级方法15.1 处理缺失值的步骤一个完整的处理方法通常包含以下几个步骤:(1) 识别缺失数据;(2) 检查导致数据缺失的原因;(3) 删除包含缺失值的实例或用合理的数值代替(插补)缺失值。缺失数据的分类:(1) 完全随机缺失:若某变量的缺失数据与其他任何观测或未观测变量都不相关,则数... 阅读全文
posted @ 2015-05-07 23:04 机器学习算法与Python 阅读(1393) 评论(1) 推荐(1)
摘要: 第十四章:主成分和因子分析本章内容主成分分析探索性因子分析其他潜变量模型主成分分析(PCA)是一种数据降维技巧,它能将大量相关变量转化为一组很少的不相关变量,这些无关变量称为主成分。探索性因子分析(EFA)是一系列用来发现一组变量的潜在结构的方法。它通过寻找一组更小的、潜在的或隐藏的结构来解释已观测... 阅读全文
posted @ 2015-05-06 22:12 机器学习算法与Python 阅读(5331) 评论(0) 推荐(3)
摘要: 调试第一种方法简单直接粗暴有效,就是用print把可能有问题的变量打印出来看看:>>> def foo(s):n= int(s)print '>>> n = %d' % nreturn 10 / n>>> def main():foo('0')>>> main()>>> n = 0Traceback... 阅读全文
posted @ 2015-05-06 11:31 机器学习算法与Python 阅读(2168) 评论(0) 推荐(0)
摘要: 12.4 置换检验点评除coin和lmPerm包外,R还提供了其他可做置换检验的包。perm包能实现coin包中的部分功能,因此可作为coin包所得结果的验证。corrperm包提供了有重复测量的相关性的置换检验。logregperm包提供了Logistic回归的置换检验。另外一个非常重要的包是gl... 阅读全文
posted @ 2015-05-04 23:30 机器学习算法与Python 阅读(2801) 评论(0) 推荐(1)