会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
93
94
95
96
97
98
99
100
101
···
144
下一页
2023年3月6日
DetectGPT:使用概率曲率的零样本机器生成文本检测
摘要: DetectGPT的目的是确定一段文本是否由特定的llm生成,例如GPT-3。为了对段落 x 进行分类,DetectGPT 首先使用通用的预训练模型(例如 T5)对段落 xi 生成较小的扰动。然后DetectGPT将原始样本x的对数概率与每个扰动样本xi进行比较。如果平均对数比高,则样本可能来自源模
阅读全文
posted @ 2023-03-06 10:30 deephub
阅读(113)
评论(0)
推荐(0)
2023年3月5日
带加权的贝叶斯自举法 Weighted Bayesian Bootstrap
摘要: 在去年的文章中我们介绍过Bayesian Bootstrap,今天我们来说说Weighted Bayesian Bootstrap Bayesian bootstrap 贝叶斯自举法(Bayesian bootstrap)是一种统计学方法,用于在缺乏先验知识的情况下对一个参数的分布进行估计。这种方法
阅读全文
posted @ 2023-03-05 10:38 deephub
阅读(106)
评论(0)
推荐(0)
2023年3月4日
梯度提升算法决策过程的逐步可视化
摘要: 梯度提升算法是最常用的集成机器学习技术之一,该模型使用弱决策树序列来构建强学习器。这也是XGBoost和LightGBM模型的理论基础,所以在这篇文章中,我们将从头开始构建一个梯度增强模型并将其可视化。 梯度提升算法介绍 梯度提升算法(Gradient Boosting)是一种集成学习算法,它通过构
阅读全文
posted @ 2023-03-04 10:17 deephub
阅读(107)
评论(0)
推荐(0)
2023年3月3日
论文推荐:ScoreGrad,基于能量模型的时间序列预测
摘要: 能量模型(Energy-based model)是一种以自监督方式执行的生成式模型,近年来受到了很多关注。本文将介绍ScoreGrad:基于连续能量生成模型的多变量概率时间序列预测。如果你对时间序列预测感兴趣,推荐继续阅读本文。 为什么时间序列预测很重要? 这是一个老生常谈的问题,因为时间序列预测在
阅读全文
posted @ 2023-03-03 10:53 deephub
阅读(114)
评论(0)
推荐(0)
2023年3月2日
XGBoost和LightGBM时间序列预测对比
摘要: GBoost和LightGBM都是目前非常流行的基于决策树的机器学习模型,它们都有着高效的性能表现,但是在某些情况下,它们也有着不同的特点。 XGBoost和LightGBM简单对比 训练速度 LightGBM相较于xgboost在训练速度方面有明显的优势。这是因为LightGBM使用了一些高效的算
阅读全文
posted @ 2023-03-02 10:48 deephub
阅读(313)
评论(0)
推荐(0)
2023年3月1日
使用手工特征提升模型性能
摘要: 本文将使用信用违约数据集介绍手工特征的概念和创建过程。 通过对原始数据进行手工的特征工程,我们可以将模型的准确性和性能提升到新的水平,为更精确的预测和更明智的业务决策铺平道路, 可以以前所未有的方式优化模型并提升业务能力。 原始数据就像一个没有图片的拼图游戏——但通过特征工程,我们可以将这些碎片拼在
阅读全文
posted @ 2023-03-01 10:30 deephub
阅读(51)
评论(0)
推荐(0)
2023年2月28日
非参数检验方法,核密度估计简介
摘要: 在20世纪,统计学还处于起步阶段计算机还不是那么流行的时候,假设正态分布是生成数据的标准。这主要是因为在那个所有结果都是手工计算的时代,正态分布可以使计算不那么繁琐。 但在这个大数据时代,随着计算能力的提高,数据的可用性使得统计学家采用了更现代的技术——非参数统计。这里我们将讨论一种这样的方法来估计
阅读全文
posted @ 2023-02-28 10:41 deephub
阅读(66)
评论(0)
推荐(0)
2023年2月27日
聚类算法(下):10个聚类算法的评价指标
摘要: 上篇文章我们已经介绍了一些常见的聚类算法,下面我们将要介绍评估聚类算法的指标 在聚类算法中,评估聚类结果的好坏是非常重要的。常见的聚类评估指标包括: Rand Index:用于衡量聚类结果和真实标签之间的相似度。 Adjusted Rand Score:Rand Index的调整版本,可以对随机结果
阅读全文
posted @ 2023-02-27 10:32 deephub
阅读(393)
评论(0)
推荐(0)
2023年2月26日
聚类算法(上):8个常见的无监督聚类方法介绍和比较
摘要: 无监督聚类方法的评价指标必须依赖于数据和聚类结果的内在属性,例如聚类的紧凑性和分离性,与外部知识的一致性,以及同一算法不同运行结果的稳定性。 本文将全面概述Scikit-Learn库中用于的聚类技术以及各种评估方法。 本文将分为2个部分,1、常见算法比较 2、聚类技术的各种评估方法 本文作为第一部分
阅读全文
posted @ 2023-02-26 09:34 deephub
阅读(269)
评论(0)
推荐(0)
2023年2月25日
稀疏特征和密集特征
摘要: 在机器学习中,特征是指对象、人或现象的可测量和可量化的属性或特征。特征可以大致分为两类:稀疏特征和密集特征。 完整文章: https://avoid.overfit.cn/post/db548d55a7f44ec791bbc024727673e8
阅读全文
posted @ 2023-02-25 09:26 deephub
阅读(59)
评论(0)
推荐(0)
上一页
1
···
93
94
95
96
97
98
99
100
101
···
144
下一页
公告