1.机器学习概括

2.KNN原理:越相近越相似

3.sklearn建模流程:

  from sklearn.neighbors import KNeighborsClassifier #导入需要的模块

  clf = KNeighborsClassifier(n_neighbors = k) #实例化

  clf = clf.fit(X_train, y_train) #用训练集训练模型

  result = clf.score(X_test, y_test) #导入测试集,查看模型效果

4.学习曲线(找最佳的K)→交叉验证(K折,准确率高+方差较小)→归一化(距离类模型需要对数据集归一)→惩罚因子(设距离为惩罚因子)

5.泛化能力:在陌生数据集上表现优秀的能力

6.先划分训练集和测试集→归一化训练集→用训练集归一测试集

7.模型评价:a.应用广泛

        b.计算效率低,耗费计算资源较大

        c.抗噪性较弱,对异常值敏感

        d.模型不稳定,可重复性较弱

        e.需要进行归一化处理

8.KNN属于惰性学习,距离一般选择欧几里得距离