上一页 1 ··· 25 26 27 28 29 30 31 32 33 ··· 69 下一页
摘要: 数据的预处理是数据分析,或者机器学习训练前的重要步骤。通过数据预处理,可以 提高数据质量,处理数据的缺失值、异常值和重复值等问题,增加数据的准确性和可靠性 整合不同数据,数据的来源和结构可能多种多样,分析和训练前要整合成一个数据集 提高数据性能,对数据的值进行变换,规约等(比如无量纲化),让算法更加 阅读全文
posted @ 2023-12-20 09:28 wang_yb 阅读(646) 评论(0) 推荐(1)
摘要: 数据的预处理是数据分析,或者机器学习训练前的重要步骤。通过数据预处理,可以 提高数据质量,处理数据的缺失值、异常值和重复值等问题,增加数据的准确性和可靠性 整合不同数据,数据的来源和结构可能多种多样,分析和训练前要整合成一个数据集 提高数据性能,对数据的值进行变换,规约等(比如无量纲化),让算法更加 阅读全文
posted @ 2023-12-18 09:49 wang_yb 阅读(789) 评论(0) 推荐(0)
摘要: 数据的预处理是数据分析,或者机器学习训练前的重要步骤。通过数据预处理,可以 提高数据质量,处理数据的缺失值、异常值和重复值等问题,增加数据的准确性和可靠性 整合不同数据,数据的来源和结构可能多种多样,分析和训练前要整合成一个数据集 提高数据性能,对数据的值进行变换,规约等(比如无量纲化),让算法更加 阅读全文
posted @ 2023-12-15 08:50 wang_yb 阅读(745) 评论(0) 推荐(1)
摘要: 数据的预处理是数据分析,或者机器学习训练前的重要步骤。通过数据预处理,可以 提高数据质量,处理数据的缺失值、异常值和重复值等问题,增加数据的准确性和可靠性 整合不同数据,数据的来源和结构可能多种多样,分析和训练前要整合成一个数据集 提高数据性能,对数据的值进行变换,规约等(比如无量纲化),让算法更加 阅读全文
posted @ 2023-12-13 14:22 wang_yb 阅读(902) 评论(0) 推荐(2)
摘要: 命令行的历史可以追溯到Unix操作系统的起源,也就是1969年,Unix诞生之时,前辈们就已经用命令行来和操作系统交互了。 随着计算机性能的飞速发展,图形化的操作界面逐渐成为主流,命令行工具离普通用户越来越远。这些年来,图形界面的发展不仅仅表现在界面越来越美观,其操作方式也越来越丰富,不只是早期的鼠 阅读全文
posted @ 2023-12-10 15:04 wang_yb 阅读(1151) 评论(0) 推荐(0)
摘要: 这是scikit-learn数据加载系列的最后一篇,本篇介绍如何加载外部的数据集。 外部数据集不像之前介绍的几种类型的数据集那样,针对每种数据提供对应的接口,每个接口加载的数据都是固定的。而外部数据集加载之后,数据的字段和类型是不确定的。 简单来说,我们在实际的数据分析工作中,用到的是外部数据集加载 阅读全文
posted @ 2023-12-09 10:23 wang_yb 阅读(698) 评论(0) 推荐(0)
摘要: 除了内置的数据集,scikit-learn还提供了随机样本的生成器。通过这些生成器函数,可以生成具有特定特性和分布的随机数据集,以帮助进行机器学习算法的研究、测试和比较。 目前,scikit-learn库(v1.3.0版)中有20个不同的生成样本的函数。本篇重点介绍其中几个具有代表性的函数。 1. 阅读全文
posted @ 2023-12-08 08:35 wang_yb 阅读(978) 评论(0) 推荐(3)
摘要: 上一篇介绍了scikit-learn中的几个玩具数据集,本篇介绍scikit-learn提供的一些真实的数据集。玩具数据集:scikit-learn 基础(01)--『数据加载』之玩具数据集 1. 获取数据集 与玩具数据集不同,真实的数据集的数据不仅数据特征多,而且数据量也比较大,所以没有直接包含在 阅读全文
posted @ 2023-12-06 09:43 wang_yb 阅读(1144) 评论(3) 推荐(3)
摘要: 机器学习的第一步是准备数据,好的数据能帮助我们加深对机器学习算法的理解。 不管是在学习还是实际工作中,准备数据永远是一个枯燥乏味的步骤。scikit-learn库显然看到了这个痛点,才在它的数据加载子模块中为我们准备了直接可用的数据集。 在它的数据加载子模块中,提供了6种直接可用来学习算法的经典数据 阅读全文
posted @ 2023-12-04 11:08 wang_yb 阅读(1472) 评论(5) 推荐(1)
摘要: Scikit-learn是一个基于Python的开源机器学习库,它提供了大量的机器学习算法和工具,方便用户进行数据挖掘、分析和预测。 Scikit-learn是基于另外两个知名的库 Scipy 和 Numpy的,关于 Scipy 和 Numpy 等库,之前的系列文章中有介绍: Scipy 基础系列 阅读全文
posted @ 2023-12-02 14:18 wang_yb 阅读(1723) 评论(0) 推荐(5)
上一页 1 ··· 25 26 27 28 29 30 31 32 33 ··· 69 下一页