1.机器学习概括

2.KNN原理:越相近越相似
3.sklearn建模流程:
from sklearn.neighbors import KNeighborsClassifier #导入需要的模块
clf = KNeighborsClassifier(n_neighbors = k) #实例化
clf = clf.fit(X_train, y_train) #用训练集训练模型
result = clf.score(X_test, y_test) #导入测试集,查看模型效果
4.学习曲线(找最佳的K)→交叉验证(K折,准确率高+方差较小)→归一化(距离类模型需要对数据集归一)→惩罚因子(设距离为惩罚因子)
5.泛化能力:在陌生数据集上表现优秀的能力
6.先划分训练集和测试集→归一化训练集→用训练集归一测试集
7.模型评价:a.应用广泛
b.计算效率低,耗费计算资源较大
c.抗噪性较弱,对异常值敏感
d.模型不稳定,可重复性较弱
e.需要进行归一化处理
8.KNN属于惰性学习,距离一般选择欧几里得距离
浙公网安备 33010602011771号