2021年11月3日

5 K-近邻算法实现鸢尾花种类预测

摘要: 1 再识K-近邻算法API sklearn.neighbors.KNeighborsClassifier(n_neighbors=5,algorithm='auto') n_neighbors: int,可选(默认= 5),k_neighbors查询默认使用的邻居数 algorithm:{‘auto 阅读全文

posted @ 2021-11-03 09:53 paike123 阅读(140) 评论(0) 推荐(0)

4 特征工程-特征预处理

摘要: 1 什么是特征预处理 1.1 特征预处理定义 scikit-learn的解释 provides several common utility functions and transformer classes to change raw feature vectors into a represen 阅读全文

posted @ 2021-11-03 09:47 paike123 阅读(81) 评论(0) 推荐(0)

3.scikit-learn中数据集介绍

摘要: 1. scikit-learn数据集API介绍 sklearn.datasets 加载获取流行数据集 datasets.load_*() 获取小规模数据集,数据包含在datasets里 datasets.fetch_*(data_home=None) 获取大规模数据集,需要从网络上下载,函数的第一个 阅读全文

posted @ 2021-11-03 09:34 paike123 阅读(293) 评论(0) 推荐(0)

2.kd树

摘要: 1:kd简介 1.1 什么是kd树 根据KNN每次需要预测一个点时,我们都需要计算训练数据集里每个点到这个点的距离,然后选出距离最近的k个点进行投票。当数据集很大时,这个计算成本非常高,针对N个样本,D个特征的数据集,其算法复杂度为O(DN^2)。 kd树:为了避免每次都重新计算一遍距离,算法会把距 阅读全文

posted @ 2021-11-03 08:52 paike123 阅读(511) 评论(0) 推荐(0)

导航