会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
千里之行,始于足下
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
3
4
5
6
7
8
9
10
11
···
67
下一页
2025年4月15日
多变量决策树:机器学习中的“多面手”
摘要: 在机器学习的广阔领域中,决策树一直是一种备受青睐的算法。它以其直观、易于理解和解释的特点,广泛应用于分类和回归任务。 然而,随着数据复杂性的不断增加,传统决策树的局限性逐渐显现。 本文将深入探讨多变量决策树这一强大的工具,它不仅克服了传统决策树的瓶颈,还为处理复杂数据提供了新的思路。 1. 基本概念
阅读全文
posted @ 2025-04-15 09:57 wang_yb
阅读(390)
评论(0)
推荐(0)
2025年4月14日
『Plotly实战指南』--雷达图绘制与应用
摘要: 在数据分析和可视化领域,雷达图是一种适用于多维数据的可视化、综合评估和决策支持的工具。 雷达图通过将数据点沿多个轴分布,并通过多边形面积或线条连接来展示数据的多维度特征,能够直观地呈现数据在各个维度上的表现,帮助我们快速识别优势和劣势,从而做出更明智的决策。 本文主要介绍Plotly雷达图的奥秘,从
阅读全文
posted @ 2025-04-14 09:00 wang_yb
阅读(956)
评论(0)
推荐(0)
2025年4月13日
『Plotly实战指南』--面积图绘制与应用
摘要: 在数据可视化领域,面积图是一种强大而直观的工具,它通过填充线条与坐标轴之间的区域来量化数据大小, 从而帮助我们清晰地展示数据的总量、趋势变化以及不同类别之间的对比。 无论是分析随时间变化的累积量,还是对比多类别的数据占比,面积图都能以简洁而直观的方式呈现复杂的数据关系。 本文主要介绍Plotly面积
阅读全文
posted @ 2025-04-13 10:00 wang_yb
阅读(502)
评论(2)
推荐(1)
2025年4月11日
当决策树遇上脏数据:连续值与缺失值的解决方案
摘要: 在机器学习中,决策树算法因其简单易懂、可解释性强而被广泛应用。 然而,现实世界中的数据往往复杂多变,尤其是连续值和缺失值的存在,给决策树的构建带来了诸多挑战。 连续值(如年龄、收入)无法直接用于决策树的离散分裂点,需要转化为“离散区间”。 缺失值(如用户未填写的问卷项)可能导致信息损失或模型偏差。
阅读全文
posted @ 2025-04-11 11:52 wang_yb
阅读(349)
评论(0)
推荐(0)
2025年4月10日
决策树剪枝:平衡模型复杂性与泛化能力
摘要: 在机器学习的世界里,决策树是一种简单而强大的算法,但它的 “任性生长” 却常常让数据科学家陷入 “过拟合的困境”。 想象一下,一棵决策树如果无限生长,它可能会完美地拟合训练集中的每一个数据点,但当面对新的数据时,却可能表现得像一个“陌生人”——预测完全失效。 这种现象背后的原因在于模型过于复杂,对训
阅读全文
posted @ 2025-04-10 13:24 wang_yb
阅读(420)
评论(0)
推荐(0)
2025年4月9日
决策树:机器学习中的“智慧树”
摘要: 在机器学习的广阔森林中,决策树(Decision Tree)是一棵独特而强大的“智慧树”。 它是一种监督学习算法,既可以用于分类任务,也能用于回归任务,通过树形结构模拟人类决策过程。 这篇文章会带你了解决策树,从基础概念开始,一步步讲解如何构建决策树、常用的算法以及它的实际应用。 1. 概述 决策树
阅读全文
posted @ 2025-04-09 11:34 wang_yb
阅读(574)
评论(0)
推荐(0)
2025年4月8日
『Plotly实战指南』--直方图绘制与应用
摘要: 在数据科学的世界里,直方图是一种不可或缺的可视化工具,它以其简洁而直观的方式,揭示了数据的内在规律,为数据分析和决策提供了有力支持。 它能够帮助我们快速识别异常值,并为统计推断提供有力支撑。 无论是对称的钟型分布,还是偏态的长尾分布,直方图都能清晰地呈现出来。 通过观察直方图的形状,我们可以了解数据
阅读全文
posted @ 2025-04-08 10:32 wang_yb
阅读(511)
评论(0)
推荐(0)
2025年4月7日
『Plotly实战指南』--箱线图绘制与应用
摘要: 在数据可视化领域,箱线图(Box Plot)是一种强大的工具,用于展示数据的分布特征、集中趋势以及异常值。 它不仅能够快速揭示数据的偏态、离散程度,还能帮助我们识别潜在的数据问题。 本文将从基础绘制到业务实战,系统讲解如何用 Plotly 构建交互式箱线图,并掌握其在异常值检测、多组对比分析中的核心
阅读全文
posted @ 2025-04-07 12:07 wang_yb
阅读(700)
评论(0)
推荐(0)
2025年4月6日
『Plotly实战指南』--散点图绘制进阶篇
摘要: 在数据分析的世界里,散点图是一种极为重要的可视化工具。 它能够直观地展示两个或多个变量之间的关系,帮助我们快速发现数据中的模式、趋势和异常点。 无论是探索变量之间的相关性,还是寻找数据中的潜在规律,散点图都扮演着不可或缺的角色。 与传统的静态图表不同,Plotly 绘制的散点图可以通过鼠标悬停、缩放
阅读全文
posted @ 2025-04-06 08:47 wang_yb
阅读(662)
评论(0)
推荐(0)
2025年4月4日
不平衡样本数据的救星:数据再分配策略
摘要: 在机器学习领域,数据是模型训练的基础,而数据的分布情况往往会对模型的性能产生重要影响。 不平衡样本数据是我们在实际项目中经常会遇到的问题,它可能导致模型对多数类过度拟合,而对少数类的预测能力不足。 本文将详细介绍不平衡样本数据的常见场景、处理方法以及在实践中需要注意的问题,帮助你在模型训练前有效地进
阅读全文
posted @ 2025-04-04 09:45 wang_yb
阅读(944)
评论(0)
推荐(0)
上一页
1
···
3
4
5
6
7
8
9
10
11
···
67
下一页
公告