02 2020 档案

摘要:超参数 KNN:k,p(明科夫斯基距离超参数)--weights=("uniform"/"distance") 寻找方法:网格搜索 数据归一化 其它 阅读全文
posted @ 2020-02-20 23:49 Eliza_Herb 阅读(154) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2020-02-14 20:16 Eliza_Herb 阅读(247) 评论(0) 推荐(0)
摘要:K近邻分类器(KNN) KNN:通过计算待分类数据点,与已有数据集中的所有数据点的距离。取距离最小的前K个点,根据“少数服从多数“的原则,将这个数据点划分为出现次数最多的那个类别。 sklearn中的K近邻分类器 在sklearn库中,可以使用sklearn.neighbors.KNeighbors 阅读全文
posted @ 2020-02-12 18:20 Eliza_Herb 阅读(1216) 评论(0) 推荐(0)
摘要:监督学习的目标 利用一组带有标签的数据,学习从输入到输出的映射,然后将这种映射关系应用到未知数据上,达到分类或回归的目的。 分类:当输出是离散的,学习任务为分类任务。 回归:当输出是连续的,学习任务为回归任务。 分类学习 输入:一组有标签的训练数据(也称观察和评估),标签表明了这些数据(观察)的所署 阅读全文
posted @ 2020-02-11 20:51 Eliza_Herb 阅读(189) 评论(0) 推荐(0)
摘要:numpy库和scipy库使用指南:https://docs.scipy.org/doc/ 阅读全文
posted @ 2020-02-08 12:09 Eliza_Herb 阅读(114) 评论(0) 推荐(0)
摘要:把像素扔进K-Means函数里,然后给像素添加不同的灰度并输出。 图像分割常用方法: 1. 阈值分割:对图像灰度值进行度量,设置不同类别的阈值,达到分割的目的。 2. 边缘分割:对图像边缘进行检测,即检测图像中灰度值发生跳变的地方,则为一片 区域的边缘。 3. 直方图法:对图像的颜色建立直方图,而直 阅读全文
posted @ 2020-02-07 23:01 Eliza_Herb 阅读(555) 评论(0) 推荐(0)
摘要:PCA 主成分分析(Principal Component Analysis,PCA)是最常用的一种降维方法,通常用于高维数据集的探索与可视化,还可以用作数据压缩和预处理等。 目标 PCA可以把具有相关性的高维变量合成为线性无关的低维变量,称为主成分。主成分能够尽可能保留原始数据的信息。 相关术语 阅读全文
posted @ 2020-02-06 21:10 Eliza_Herb 阅读(363) 评论(0) 推荐(0)
摘要:K-means聚类 K-means的应用 数据介绍: 现有1999年全国31个省份城镇居民家庭平均每人全年消费性支出的八个主 要变量数据,这八个变量分别是:食品、衣着、家庭设备用品及服务、医疗 保健、交通和通讯、娱乐教育文化服务、居住以及杂项商品和服务。利用已 有数据,对31个省份进行聚类。 实验目 阅读全文
posted @ 2020-02-03 22:09 Eliza_Herb 阅读(400) 评论(0) 推荐(0)
摘要:无监督学习的目标: 利用无标签的数据学习数据的分部或数据与数据之间的关系被称作无监督学习。 无监督学习最常应用的场景是聚类和降维。 聚类 (sklearn.cluster模块) 定义 聚类(clustering),就是根据数据的“相似性”将数据分为多类的过程。 评估两个不同样本之间的“相似性” ,通 阅读全文
posted @ 2020-02-02 20:40 Eliza_Herb 阅读(264) 评论(0) 推荐(0)
摘要:sklearn的数据集种类: 自带的小数据集(packaged dataset):sklearn.datasets.load_<name> 可在线下载的数据集(Downloaded Dataset):sklearn.datasets.fetch_<name> 计算机生成的数据集(Generated 阅读全文
posted @ 2020-02-02 17:58 Eliza_Herb 阅读(541) 评论(0) 推荐(0)
摘要:sklearn库的下载安装 方法一 anaconda优雅安装 推荐此方法,因为相当地“一劳永逸”。 参考链接:https://www.cnblogs.com/yuxuefeng/articles/9235431.html 方法二 pycharm内安装 方法三 pip和shell安装(内心OS:??? 阅读全文
posted @ 2020-02-02 17:57 Eliza_Herb 阅读(6519) 评论(0) 推荐(0)
摘要:机器学习介绍 机器学习是实现人工智能的手段,其主要研究内容是如何利用数据或经验进行学习,改善具体算法的性能。 多领域交叉,涉及概率论、统计学、算法复杂度等多门学科。 分类:监督学习、无监督学习、强化学习(增强学习)、半监督学习、深度学 scikit-learn库介绍(sklearn) 依赖NumPy 阅读全文
posted @ 2020-02-02 17:56 Eliza_Herb 阅读(510) 评论(0) 推荐(0)