数据处理方法汇总

1.层次化 K-means (Hierarchical K-means)

  不直接把数据分成k个簇,

  第一层先分k1个簇,第二层每个大簇分为k2个小簇,以此类推,形成聚类树

 

2.平衡采样

  对每类样本按比例采样

 

3.检索式筛选数据

  用分类模型,找到数据池和种子数据的相似数据

 

4.

 

posted @ 2025-10-26 10:58  zhangdudu  阅读(19)  评论(0)    收藏  举报