吴恩达机器学习课程笔记6-核函数和聚类算法
12 支持向量机SVM
- 优化目标

- 使用新的激活函数减缓目标函数的计算

- 新表达式

- SVM直接输出0/1,不输出概率

- SVM称为大间距分类器


- SVM,大间距分类器

- 对异常值非常敏感 如果参数C太大

-
大间距的数学原理



-
核函数1
- 非线性决策边界,选择不同特征

- 核函数,衡量相似度

- 距离核中心远近

- 核函数(正态分布)f

- 生成决策边界

-
核函数2




-
使用SVM



- SVM凸优化,不用担心收敛到局部最小值

- 逻辑回归,神经网络,SVM 是三个大的算法领域
13. 无监督学习
- 无监督学习
- 无监督学习,训练数据集没有标签

- 无监督学习应用:市场分类,社交网络分析等

- K-means算法
-
随机生成两个点作为中心点,按照样本与中心点距离进行聚类

-
计算聚类中的平均坐标点作为新聚类中心

-
迭代进行聚类,直到聚类中心不再改变

-
聚类算法描述


- 优化目标
- 最小化优化函数,寻找合适的中心点。


- 随机初始化
不同初始化中心点,会导致不同的聚类结果


- 随机初始化100次,当K-2-10时,当K非常大时随机初始化次数多没有很大改善

- 选取聚类数量K
- Elbow Method

- 后序目的给出一个评估标准,如T-Shirt尺寸可以根据市场反馈

参考

浙公网安备 33010602011771号