随笔分类 -  机器学习

摘要:scikit-learn (sklearn) 官方文档中文版 阅读全文
posted @ 2019-12-30 17:53 刘文华 阅读(637) 评论(0) 推荐(0)
摘要:基本概念:(Density-Based Spatial Clustering of Application with Noiso) 1.核心对象: 若某个点的密度达到算法设定的阈值则其为核心点。(即r领域内的点数量不小于minPts) 2.ε-领域的距离阈值: 设定的半径r 3.直接密度可达: 若某 阅读全文
posted @ 2019-10-03 01:46 刘文华 阅读(3866) 评论(0) 推荐(0)
摘要:K-MEANS算法 聚类概念: 1.无监督问题:我们手里没有标签 2.聚类:相似的东西分到一组 3.难点:如何评估,如何调参 4.要得到簇的个数,需要指定K值 5.质心:均值,即向量各维取平均即可 6.距离的度量:常用欧几里得距离和余弦相似度 7.优化目标:min$$ min \sum_{i=0}^ 阅读全文
posted @ 2019-10-03 00:47 刘文华 阅读(2769) 评论(0) 推荐(0)