Python数据挖掘——数据概述

Python数据挖掘——数据概述

  • 数据集由数据对象组成;
  • 数据的基本统计描述
    • 中心趋势度量
      • 均值
      • 中位数
      • 众数
      • 中列数
        • 数据集的最大值和最小值的平均
    • 度量数据分布
      • 极差
        • 最大值与最小值的差
      • 四分位数
      • 方差
      • 四分位数极差
  • 数据基本统计描述的图形显示
    • 一元分布
      • 分位数图
      • 分位数-分位数图(q-q图)
      • 直方图
    • 二元分布
      • 散点图
  • 数据可视化
    • 1、基于像素的可视化技术
    • 2、几何投影可视化技术
    • 3、基于图符的可视化技术
    • 4、层次可视化技术
  • 度量数据的相似性和相异性
    • 相似 和相异 都称 邻近性
    • 如果不相似,则称 相似性度量为0
posted @ 2020-01-15 09:48  OCEANEYES.GZY  阅读(166)  评论(0编辑  收藏  举报