大数据应用与管理1:描述性统计与可视化
1、描述性统计与可视化
1.1实验说明
对给定数据集《电信客户流失分析.xlsx》进行描述性统计,利用SPSS Modeler软件计算数据的集中趋势指标:平均数、中位数、众数;离散趋势指标:极差、方差与标准差;数据的分布形态:偏度、峰度等指标。利用散点图、条形图、直方图等对电信客户流失进行初步分析。数据集《电信客户流失分析.xlsx》各字段说明如下:
1.2实验步骤
请附SPSS Modeler所建模型截图以及模型输出结果截图。
模型截图:
模型输出结果截图:
1.3结果分析
请根据对数据集的描述性统计结果,结合图形可视化,初步分析各指标的变化,对客户流失情况进行简要说明。
答:
流失客户与性别没有联系。
老年人客户更容易留下。
客户流失的情况下,未婚客户占比相比已婚客户要高,也就是说未婚客户更容易流失。
未流失客户中亲属使用占比比流失客户中亲属使用占比要多,客户流失可能与亲属使用有联系。
在网时长是流失客户的重要变量,在网时长越长,流失客户越来越少。
订购电话业务与客户流失没有关系。
是否订购宽带业务与客户流失有关系。
客服沟通频率是流失客户的重要变量,频率越大,流失的越多;频率越小,基本无流失。
客户电子账单与客户流失可能有关系。