上一页 1 ··· 41 42 43 44 45 46 47 48 49 ··· 54 下一页
摘要: 来自:https://blog.csdn.net/lanchunhui/article/details/49493633 阅读全文
posted @ 2018-06-07 15:57 做梦当财神 阅读(195) 评论(0) 推荐(0)
摘要: 来自:https://www.cnblogs.com/yesuuu/p/6100714.html 阅读全文
posted @ 2018-06-06 16:06 做梦当财神 阅读(262) 评论(0) 推荐(0)
摘要: 来自:https://www.cnblogs.com/cymwill/p/7577369.html 阅读全文
posted @ 2018-06-05 22:28 做梦当财神 阅读(219) 评论(0) 推荐(0)
摘要: 来自:https://blog.csdn.net/liuyanfeier/article/details/62422742 来自:https://www.cnblogs.com/baby123/p/6477429.html 阅读全文
posted @ 2018-05-27 16:59 做梦当财神 阅读(397) 评论(0) 推荐(0)
摘要: DataFrame.drop(labels=None, axis=0, index=None, columns=None, level=None, inplace=False, errors='raise') 参数: labels:要删除行、列的名字。 axis:默认为0,指删除行;axis=1指删 阅读全文
posted @ 2018-05-01 21:52 做梦当财神 阅读(609) 评论(0) 推荐(0)
摘要: 来自:https://blog.csdn.net/xw_classmate/article/details/51333646 来自:https://blog.csdn.net/chenKFKevin/article/details/62049060 来自:https://blog.csdn.net/ 阅读全文
posted @ 2018-05-01 20:37 做梦当财神 阅读(1399) 评论(0) 推荐(0)
摘要: 来自:https://blog.csdn.net/csdn15698845876/article/details/73380803 np.vstack:按垂直方向(行顺序)堆叠数组构成一个新的数组 np.hstack:按水平方向(列顺序)堆叠数组构成一个新的数组 阅读全文
posted @ 2018-04-26 21:04 做梦当财神 阅读(925) 评论(0) 推荐(0)
摘要: 判断重复数据的判断方法:df.duplicated(),该方法中两个主要的参数是subset和keep: subset:要判断重复值的列,可以指定特定列或多个列。默认使用全部列。 keep:当重复时不标记为True的规则,可设置为第一个、最后一个和全部标记为True(False)。默认为第一个,即第 阅读全文
posted @ 2018-04-20 19:54 做梦当财神 阅读(366) 评论(0) 推荐(0)
摘要: 异常值也称离群点,异常值分析也称离群点分析。 1. 简单统计量分析 最常用的是最大值和最小值,超出合理范围为异常。如客户年龄为199岁,该值为异常。 2. 3σ原则 (1)、如果数据服从正态分布,在3σ原则下,异常值被定义为与平均值偏差超过3倍标准差的值。 在正态分布情况下,距离平均值3α之外的值出 阅读全文
posted @ 2018-04-20 10:46 做梦当财神 阅读(3371) 评论(0) 推荐(0)
摘要: 1. 数据缺失分为两种:行记录缺失,列记录缺失。 2. 不同的数据存储和环境对缺失值的表示也不同。例如:数据库中是Null,Python是None,Pandas或Numpy是NaN。 3. 对缺失值的处理通常4种方法: (1). 丢弃 下面两种场景不宜采用该方法: 不完整数据比例较大,超过10% 缺 阅读全文
posted @ 2018-04-18 16:48 做梦当财神 阅读(1093) 评论(0) 推荐(0)
上一页 1 ··· 41 42 43 44 45 46 47 48 49 ··· 54 下一页