3Clementine变量管理Field Ops字段选项卡
3.1变量说明 Type
3.2变量值的重新计算Filler
3.3变量类别值的调整 Reclassify
3.4生成新变量 Derive
3.5变量的离散化(分组)Binning
3.6生成样本集分割变量 Partition

4Clementine样本的管理Record Ops记录卡
4.1样本的排序Sort
4.2样本的条件筛选Select
4.3样本的随机抽样Sample
4.4样本的浓缩处理Distinct
4.5样本的分类汇总Aggregate
4.6样本的平衡处理 Balance
4.7样本的其他管理
数据转置Transpose
数据的重新组织Restructure

5Clementine数据的基本分析output graphs
5.1数据质量的探索Data Audit
离群点和极端值的修正
缺失值的替补
保留高质量的变量
保留有效样本
5.2基本描述分析
计算基本描述统计量(变量间的相关性)output-statistics
:count mean min max pearson correlations(Pearson相关系
数)
绘制散点图Graphs-Plot
5.3变量分布的探索Output-Transform
正态分布 z-score z分数
5.4两分类变量相关性的研究
5.4.1两分类变量相关性的图形分析
条形图Graphs-Distribution
网状图Graphs-Web
5.4.2两分类变量相关性的数值分析
计算两分类变量的列联表Output-Matrix
行列变量的相关性分析
:卡方检验(Pearson卡放统计量)卡方分布
5.5两总体的均值比较
5.5.1两总体均值比较的图形分析Graphs-Histogram柱状图
5.5.2独立样本的均值检验Output-Means
compare means:Between groups within a field
5.5.3配对样本的均值检验Output-Means
compare means:Between pairs of fields
5.6变量重要性的分析Modeling-Feature Selection

 

posted on 2013-04-22 21:19  翻页工  阅读(369)  评论(0编辑  收藏  举报