• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
会发光的大月亮
博客园    首页    新随笔    联系   管理    订阅  订阅
聚类分析

一、相关背景

  • 有监督学习

    给定训练集(x1,y1)(x2,y2) ....(xn,yn)找出他们之间的关系

    即:学习一个函数

  • 无监督学习

    给定训练集:(x1,2,...xn)

    学习一个训练集的划分

二、聚类的应用场合

  • Image segmentaion
  • Data compression
  • clustering
  • market segmentation
  • social network analysis

三、聚类问题的描述

       1、聚类分析主要是发现不同的数据类簇/群组,使得组内的数据具有较高的相似性或相关性,而组间的数据具有较低的相似性或相关性

 

  2、类簇划分可以有多个角度

  • Well-Separated Clusters

    在一个组内的数据比组外的任何点都要接近

  •  Contiguous Cluster

 

  • Density-based
  •  Center-based

 

  Shared Property or Conceptual Clusters

 

 

 四、常用的聚类算法

  • K-means
  • Hierarchical clustering
  • Gaussian Mixture Model
  • (具体见后面的博文)

 

posted on 2020-05-27 19:26  会发光的大月亮  阅读(374)  评论(0)    收藏  举报
刷新页面返回顶部
博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3