摘要:帕累托分析,即贡献度分析,在所有因素中找寻对结果起关键性或决定性作用的少部分因素。 有一常见的法则————二八定律,各行各业都在诠释着该法则的深刻含义: 例如: 1 公司的80%利润来自于20%的畅销产品,而其他80%的产品只产生了20%的利润; 2 世界上大约80%的资源是由世界上20%的人口所耗 阅读全文
posted @ 2020-03-13 15:05 python之家 阅读 (24) 评论 (0) 编辑
摘要:word是经常使用到的文档编辑器,也是容众多文档设置功能为一体的大体量软件,本文将简要介绍在word中生成目录的功能。 如果Word文档中内容较多,为了方便查看,需要设置目录,如长篇论文、书籍资料等。手工录入目录并不是不可以,而是没有必要,因为往往后面的正文内容稍有变化,前面目录所有的页码都得重新录 阅读全文
posted @ 2020-03-11 20:08 python之家 阅读 (45) 评论 (0) 编辑
摘要:在数据探索工作中,作为数据特征分析的角度,对比分析、统计量分析同样是发掘数据间关系与数据特征的重要渠道。 1 对比分析 对比分析是指把两个相互联系的指标进行比较,从数量上展示和说明研究对象规模的大小,水平的高低,速度的快慢等,主要强调各角度的“比较”。 对比分析主要有以下两种形式: 1)绝对数比较 阅读全文
posted @ 2020-03-08 16:05 python之家 阅读 (56) 评论 (0) 编辑
摘要:数据特征分析与数据质量分析一道构成数据探索的两方面工作,在前文中介绍过关于数据质量分析的概况,本文将对数据特征分析作简介,并着重于分布分析的角度,相比于数据质量分析,数据特征分析更注重于找寻数据间的关系。 数据特征分析包括以下几个分析角度: 1、分布分析 2、对比分析 3、统计量分析 4、帕累托分析 阅读全文
posted @ 2020-03-07 20:01 python之家 阅读 (98) 评论 (0) 编辑
摘要:数据探索是对样本数据进行解释性的分析工作,它是数据挖掘和机器学习较为前期的部分,更偏重于研究数据的本质、描述数据的形态特征并解释数据的相关性。 换句话说,透过数据探索,我们应该可以回答如下问题: 样本数据的分布怎样?有什么特点?数据之间有何种关系?数据是否满足建模要求? 问题驱动发展,对以上问题进行 阅读全文
posted @ 2020-03-06 21:26 python之家 阅读 (80) 评论 (0) 编辑