摘要: # 1. 生成示例数据 X, _ = make_blobs(n_samples=10, centers=2, cluster_std=0.90, random_state=0) 生成的数据: [[ 1.10590929 5.61263348] [-0.24242331 1.4859204 ] [ 1 阅读全文
posted @ 2025-06-27 10:53 华小电 阅读(26) 评论(0) 推荐(0)
摘要: KMeans 算法的核心是计算样本与质心之间的距离,不同的距离度量方法会导致聚类结果的差异。 1. 欧氏距离(Euclidean Distance) 公式:\(d(x,y) = \sqrt{\sum_{i=1}^{n}(x_i-y_i)^2}\) 特点:最常用的距离度量,直观表示空间中两点的直线距离 阅读全文
posted @ 2025-06-27 08:56 华小电 阅读(136) 评论(0) 推荐(0)
摘要: 1. 正态分布的定义 正态分布(Normal Distribution),又称为高斯分布(Gaussian Distribution) ,是一种在统计学和概率论中最重要的连续概率分布。它广泛应用于自然科学、社会科学、工程、金融等领域。 正态分布的概率密度函数(PDF)如下: \[f(x|\mu, \ 阅读全文
posted @ 2025-06-27 05:31 华小电 阅读(2379) 评论(0) 推荐(0)