11 2018 档案
摘要:1、缺失值处理:删除、插补、不处理 2、离群点分析:简单统计量分析、3σ原则(数据服从正态分布)、箱型图(最好用) 离群点(异常值)定义为小于QL-1.5IQR或大于Qu+1.5IQR 3、贡献度分析(帕累托分析,20/80定律) 4、相关性分析(以餐饮数据为例) 导入数据 求相关系数的三种方式 5
阅读全文
摘要:《Python数据分析与挖掘实战》的数据和代码,可从“泰迪杯”竞赛网站(http://www.tipdm.org/tj/661.jhtml)下载获得 1、Python数据结构 2、Numpy数组 3、Scipy矩阵 4、Matplotlib可视化 5、Pandas数据分析和探索 Pandas基本数据
阅读全文
摘要:程序清单11.4~11.6(运算符重载——添加加法运算符) 程序清单11.7~11.9 只贴出与上面代码不同的地方 程序清单11.10~11.12(友元) 只贴出与上面代码不同的地方 程序清单11.13~11.15(Vector实现矢量操作:模拟随机漫步) 未完……
阅读全文