特征分析
特征工程:将特征转换成矩阵的数值
找到与问题有关的特征信息
收集数据特征的方法:
1.分布分析
2.对比分析
3.统计分析
4.贡献度分析(帕累托分析)
5.相关性分析
分布分析
用来解释数据的分布类型和分布特征,显示其分布情况
a.对定量的数据进行分布分析
步骤:
1.求极差
2.决定组距与组数
3.决定分点
4.绘制频率分布图
b.对定性的数据进行分布分析
步骤:
根据变量的分类类型来确定分组
使用图形对信息进行显示
对比分析
把两个相互联系的指标进行比较,横纵向比较,时间序列比较
两种形式:
1.绝对数比较
利用这组指标绝对数进行对比,从而寻找差异的一种方法
2.相对数比较
由两个有联系的指标对比计算,反映客观现象之间数量联系成都的总和指标,数值表现为相对数。
根据研究目的和对比基础分类:结构相对数、比例相对数、动态相对数、空间相对数
统计分析
对一组数据用统计指标定量的分析数据
集中趋势:指一组数据向某一中心靠拢的倾向,核心在于寻找数据的代表值或中心值;
需找到数据的统计平均数来衡量(算数平均数、加权平均数;位置平均数)
离中趋势:指一组数据中各数据以不同的程度的举例偏离中心的趋势
极差与分为差、方差与标准差、离散系数
帕累托分析(贡献度分析)
相关性分析
研究两个或两个以上处于同等地位的随机变量间的相关关系的统计分析方法
相关分析与回归分析的区别
回归分析侧重于研究随机变量间的依赖关系,以便用一个变量去预测另一个变量
相关分析侧重于发现随机变量间的种种相关特性
相关系数r
正相关:
|r|>0.95 显著相关
|r|>0.8 高度相关
|0.5|<r<0.8 中度相关
|0.3|<r<0.5 低度相关
|r|<0.3 不相关
负相关
无线性相关
相关系数:
pearson相关系数---先进行正态分布检验
spearman秩相关系数---等级相关系数
kendall相关系数

浙公网安备 33010602011771号