会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
千里之行,始于足下
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
21
22
23
24
25
26
27
28
29
···
67
下一页
2024年1月30日
【scikit-learn基础】--『回归模型评估』之损失分析
摘要: 分类模型评估中,通过各类损失(loss)函数的分析,可以衡量模型预测结果与真实值之间的差异。不同的损失函数可用于不同类型的分类问题,以便更好地评估模型的性能。 本篇将介绍分类模型评估中常用的几种损失计算方法。 1. 汉明损失 Hamming loss(汉明损失)是一种衡量分类模型预测错误率的指标。它
阅读全文
posted @ 2024-01-30 16:08 wang_yb
阅读(698)
评论(0)
推荐(2)
2024年1月29日
pandas高效读取大文件的探索之路
摘要: 使用 pandas 进行数据分析时,第一步就是读取文件。在平时学习和练习的过程中,用到的数据量不会太大,所以读取文件的步骤往往会被我们忽视。 然而,在实际场景中,面对十万,百万级别的数据量是家常便饭,即使千万,上亿级别的数据,单机处理也问题不大。不过,当数据量和数据属性多了之后,读取文件的性能瓶颈就
阅读全文
posted @ 2024-01-29 09:21 wang_yb
阅读(3950)
评论(1)
推荐(3)
2024年1月28日
【scikit-learn基础】--『回归模型评估』之准确率分析
摘要: 分类模型的评估和回归模型的评估侧重点不一样,回归模型一般针对连续型的数据,而分类模型一般针对的是离散的数据。 所以,评估分类模型时,评估指标与回归模型也很不一样,比如,分类模型的评估指标通常包括准确率、精确率、召回率和F1分数等等。而回归模型的评估指标通常包括均方误差(MSE)、均方根误差(RMSE
阅读全文
posted @ 2024-01-28 09:32 wang_yb
阅读(1221)
评论(0)
推荐(0)
2024年1月26日
【scikit-learn基础】--『回归模型评估』之可视化评估
摘要: 在scikit-learn中,回归模型的可视化评估是一个重要环节。它帮助我们理解模型的性能,分析模型的预测能力,以及检查模型是否存在潜在的问题。通过可视化评估,我们可以更直观地了解回归模型的效果,而不仅仅依赖于传统的评估指标。 1. 残差图 所谓残差,就是实际观测值与预测值之间的差值。 残差图是指以
阅读全文
posted @ 2024-01-26 12:57 wang_yb
阅读(2821)
评论(0)
推荐(1)
2024年1月24日
【scikit-learn基础】--『回归模型评估』之偏差分析
摘要: 模型评估在统计学和机器学习中具有至关重要,它帮助我们主要目标是量化模型预测新数据的能力。 本篇主要介绍模型评估时,如何利用scikit-learn帮助我们快速进行各种偏差的分析。 1. **R² ** 分数 R² 分数(也叫决定系数),用于衡量模型预测的拟合优度,它表示模型中因变量的变异中,可由自变
阅读全文
posted @ 2024-01-24 11:08 wang_yb
阅读(887)
评论(0)
推荐(0)
2024年1月22日
【scikit-learn基础】--『回归模型评估』之误差分析
摘要: 模型评估在统计学和机器学习中具有至关重要,它帮助我们主要目标是量化模型预测新数据的能力。 在这个数据充斥的时代,没有评估的模型就如同盲人摸象,可能带来误导和误判。模型评估不仅是一种方法,更是一种保障,确保我们在数据海洋中航行时,能够依赖准确的模型,做出明智的决策。 本篇主要介绍模型评估时,如何利用s
阅读全文
posted @ 2024-01-22 15:35 wang_yb
阅读(1546)
评论(0)
推荐(0)
2024年1月20日
【scikit-learn基础】--『监督学习』之 空间聚类
摘要: 空间聚类算法是数据挖掘和机器学习领域中的一种重要技术。 本篇介绍的基于密度的空间聚类算法的概念可以追溯到1990年代初期。随着数据量的增长和数据维度的增加,基于密度的算法逐渐引起了研究者的关注。其中,DBSCAN(Density-Based Spatial Clustering of Applica
阅读全文
posted @ 2024-01-20 14:24 wang_yb
阅读(311)
评论(0)
推荐(0)
2024年1月18日
【scikit-learn基础】--『监督学习』之 谱聚类
摘要: 谱聚类算法基于图论,它的起源可以追溯到早期的图分割文献。不过,直至近年来,受益于计算机计算能力的提升,谱聚类算法才得到了广泛的研究和关注。 谱聚类被广泛应用于图像分割、社交网络分析、推荐系统、文本聚类等领域。例如,在图像分割中,谱聚类可以有效地将图像划分为背景和前景;在社交网络分析中,它可以识别出不
阅读全文
posted @ 2024-01-18 09:40 wang_yb
阅读(631)
评论(0)
推荐(0)
2024年1月17日
告别枯燥理论,一文看懂贝叶斯概率
摘要: 贝叶斯公式由英国数学家贝叶斯发展而来,在统计学和概率论中有着广泛的应用。与传统的先验概率不同,它提出的后验概率方式,会根据不断出现的新证据来更新概率估计,从而使得估计的准确性能够不断改善。 本文尝试通过一个简单的预测天气的示例来讲解后验概率是怎么回事,以及如何根据它推导出贝叶斯公式的。 1. 从预测
阅读全文
posted @ 2024-01-17 17:00 wang_yb
阅读(1784)
评论(2)
推荐(6)
2024年1月15日
【scikit-learn基础】--『监督学习』之 层次聚类
摘要: 层次聚类算法是机器学习中常用的一种无监督学习算法,它用于将数据分为多个类别或层次。该方法在计算机科学、生物学、社会学等多个领域都有广泛应用。 层次聚类算法的历史可以追溯到上世纪60年代,当时它主要被用于社会科学中。随着计算机技术的发展,这种方法在90年代得到了更为广泛的应用。 1. 算法概述 层次聚
阅读全文
posted @ 2024-01-15 14:23 wang_yb
阅读(521)
评论(3)
推荐(1)
上一页
1
···
21
22
23
24
25
26
27
28
29
···
67
下一页
公告