摘要: 转自:Python多进程编程 阅读目录 1. Process 2. Lock 3. Semaphore 4. Event 5. Queue 6. Pipe 7. Pool 序. multiprocessingpython中的多线程其实并不是真正的多线程,如果想要充分地使用多核CPU的资源,在pyth 阅读全文
posted @ 2016-11-21 17:38 Little_Rookie 阅读(918) 评论(0) 推荐(0) 编辑
摘要: R语言基础:数组和列表 数组(array) 一维数据是向量,二维数据是矩阵,数组是向量和矩阵的直接推广,是由三维或三维以上的数据构成的. 数组函数是array(),语法是:array(dadta, dim),其中data必须是同一类型的数据,dim是各维的长度组成的向量。 1、产生一个三维和四维数组 阅读全文
posted @ 2016-11-21 16:07 Little_Rookie 阅读(23383) 评论(0) 推荐(0) 编辑
摘要: 1.数据错误: 错误类型– 脏数据或错误数据• 比如, Age = -2003– 数据不正确• ‘0’ 代表真实的0,还是代表缺失– 数据不一致• 比如收入单位是万元,利润单位是元,或者一个单位是美元,一个是人民币– 数据重复 2.缺失值处理: 处理原则–缺失值少于20%•连续变量使用均值或中位数填 阅读全文
posted @ 2016-11-21 15:27 Little_Rookie 阅读(22571) 评论(2) 推荐(2) 编辑
摘要: 转自:http://shujuren.org/article/45.html 在数据分析过程中最头疼的应该是如何应付脏数据,脏数据的存在将会对后期的建模、挖掘等工作造成严重的错误,所以必须谨慎的处理那些脏数据。 脏数据的存在形式主要有如下几种情况: 1)缺失值 2)异常值 3)数据的不一致性 下面就 阅读全文
posted @ 2016-11-21 13:59 Little_Rookie 阅读(3786) 评论(1) 推荐(0) 编辑