会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
千里之行,始于足下
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
25
26
27
28
29
30
31
32
33
···
69
下一页
2023年12月20日
【scikit-learn基础】--『预处理』之 分类编码
摘要: 数据的预处理是数据分析,或者机器学习训练前的重要步骤。通过数据预处理,可以 提高数据质量,处理数据的缺失值、异常值和重复值等问题,增加数据的准确性和可靠性 整合不同数据,数据的来源和结构可能多种多样,分析和训练前要整合成一个数据集 提高数据性能,对数据的值进行变换,规约等(比如无量纲化),让算法更加
阅读全文
posted @ 2023-12-20 09:28 wang_yb
阅读(646)
评论(0)
推荐(1)
2023年12月18日
【scikit-learn基础】--『预处理』之 正则化
摘要: 数据的预处理是数据分析,或者机器学习训练前的重要步骤。通过数据预处理,可以 提高数据质量,处理数据的缺失值、异常值和重复值等问题,增加数据的准确性和可靠性 整合不同数据,数据的来源和结构可能多种多样,分析和训练前要整合成一个数据集 提高数据性能,对数据的值进行变换,规约等(比如无量纲化),让算法更加
阅读全文
posted @ 2023-12-18 09:49 wang_yb
阅读(789)
评论(0)
推荐(0)
2023年12月15日
【scikit-learn基础】--『预处理』之 数据缩放
摘要: 数据的预处理是数据分析,或者机器学习训练前的重要步骤。通过数据预处理,可以 提高数据质量,处理数据的缺失值、异常值和重复值等问题,增加数据的准确性和可靠性 整合不同数据,数据的来源和结构可能多种多样,分析和训练前要整合成一个数据集 提高数据性能,对数据的值进行变换,规约等(比如无量纲化),让算法更加
阅读全文
posted @ 2023-12-15 08:50 wang_yb
阅读(745)
评论(0)
推荐(1)
2023年12月13日
【scikit-learn基础】--『预处理』之 标准化
摘要: 数据的预处理是数据分析,或者机器学习训练前的重要步骤。通过数据预处理,可以 提高数据质量,处理数据的缺失值、异常值和重复值等问题,增加数据的准确性和可靠性 整合不同数据,数据的来源和结构可能多种多样,分析和训练前要整合成一个数据集 提高数据性能,对数据的值进行变换,规约等(比如无量纲化),让算法更加
阅读全文
posted @ 2023-12-13 14:22 wang_yb
阅读(902)
评论(0)
推荐(2)
2023年12月10日
🚀提升生产力:是时候升级你的命令行工具了
摘要: 命令行的历史可以追溯到Unix操作系统的起源,也就是1969年,Unix诞生之时,前辈们就已经用命令行来和操作系统交互了。 随着计算机性能的飞速发展,图形化的操作界面逐渐成为主流,命令行工具离普通用户越来越远。这些年来,图形界面的发展不仅仅表现在界面越来越美观,其操作方式也越来越丰富,不只是早期的鼠
阅读全文
posted @ 2023-12-10 15:04 wang_yb
阅读(1151)
评论(0)
推荐(0)
2023年12月9日
【scikit-learn基础】--『数据加载』之外部数据集
摘要: 这是scikit-learn数据加载系列的最后一篇,本篇介绍如何加载外部的数据集。 外部数据集不像之前介绍的几种类型的数据集那样,针对每种数据提供对应的接口,每个接口加载的数据都是固定的。而外部数据集加载之后,数据的字段和类型是不确定的。 简单来说,我们在实际的数据分析工作中,用到的是外部数据集加载
阅读全文
posted @ 2023-12-09 10:23 wang_yb
阅读(698)
评论(0)
推荐(0)
2023年12月8日
【scikit-learn基础】--『数据加载』之样本生成器
摘要: 除了内置的数据集,scikit-learn还提供了随机样本的生成器。通过这些生成器函数,可以生成具有特定特性和分布的随机数据集,以帮助进行机器学习算法的研究、测试和比较。 目前,scikit-learn库(v1.3.0版)中有20个不同的生成样本的函数。本篇重点介绍其中几个具有代表性的函数。 1.
阅读全文
posted @ 2023-12-08 08:35 wang_yb
阅读(978)
评论(0)
推荐(3)
2023年12月6日
【scikit-learn基础】--『数据加载』之真实数据集
摘要: 上一篇介绍了scikit-learn中的几个玩具数据集,本篇介绍scikit-learn提供的一些真实的数据集。玩具数据集:scikit-learn 基础(01)--『数据加载』之玩具数据集 1. 获取数据集 与玩具数据集不同,真实的数据集的数据不仅数据特征多,而且数据量也比较大,所以没有直接包含在
阅读全文
posted @ 2023-12-06 09:43 wang_yb
阅读(1144)
评论(3)
推荐(3)
2023年12月4日
【scikit-learn基础】--『数据加载』之玩具数据集
摘要: 机器学习的第一步是准备数据,好的数据能帮助我们加深对机器学习算法的理解。 不管是在学习还是实际工作中,准备数据永远是一个枯燥乏味的步骤。scikit-learn库显然看到了这个痛点,才在它的数据加载子模块中为我们准备了直接可用的数据集。 在它的数据加载子模块中,提供了6种直接可用来学习算法的经典数据
阅读全文
posted @ 2023-12-04 11:08 wang_yb
阅读(1472)
评论(5)
推荐(1)
2023年12月2日
【scikit-learn基础】--概述
摘要: Scikit-learn是一个基于Python的开源机器学习库,它提供了大量的机器学习算法和工具,方便用户进行数据挖掘、分析和预测。 Scikit-learn是基于另外两个知名的库 Scipy 和 Numpy的,关于 Scipy 和 Numpy 等库,之前的系列文章中有介绍: Scipy 基础系列
阅读全文
posted @ 2023-12-02 14:18 wang_yb
阅读(1723)
评论(0)
推荐(5)
上一页
1
···
25
26
27
28
29
30
31
32
33
···
69
下一页
公告