会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
40
41
42
43
44
45
46
47
48
···
139
下一页
2024年8月15日
60行代码就可以训练/微调 Segment Anything 2 (SAM 2)
摘要: SAM2(Segment Anything 2)是Meta开发的一个新模型,可以对图像中的任何物体进行分割,而不局限于特定的类别或领域。这个模型的独特之处在于其训练数据的规模:1100万张图像和110亿个掩码。这种广泛的训练使SAM2成为训练新图像分割任务的强大起点。 如果SAM可以分割任何东西,为
阅读全文
posted @ 2024-08-15 10:18 deephub
阅读(520)
评论(0)
推荐(0)
2024年8月14日
音频去噪:使用Python和FFT增强音质
摘要: 根据定义,声音去噪是从音频信号中去除不需要的噪音或干扰,以提高其质量和清晰度的过程。这涉及识别和隔离噪音成分(通常以不规则或高频元素为特征),并将其过滤掉,同时保持原始声音的完整性。 声音去噪目标是改善聆听体验以及音频分析和处理的准确性。过滤掉噪音对于高保真音频来说非常重要,不仅是为了聆听,也是为了
阅读全文
posted @ 2024-08-14 11:02 deephub
阅读(160)
评论(0)
推荐(0)
2024年8月13日
掌握 PyTorch 张量乘法:八个关键函数与应用场景对比解析
摘要: PyTorch提供了几种张量乘法的方法,每种方法都是不同的,并且有不同的应用。我们来详细介绍每个方法,并且详细解释这些函数有什么区别: https://avoid.overfit.cn/post/2ce5023db7634886b602e7eb6ce4abb7
阅读全文
posted @ 2024-08-13 10:05 deephub
阅读(85)
评论(0)
推荐(0)
2024年8月12日
使用BatchNorm替代LayerNorm可以减少Vision Transformer训练时间和推理时间
摘要: 以Vision Transformer (ViT)的发现为先导的基于transformer的架构在计算机视觉领域引发了一场革命。对于广泛的应用,ViT及其各种变体已经有效地挑战了卷积神经网络(CNN)作为最先进架构的地位。尽管取得了一些成功,但是ViT需要更长的训练时间,并且对于小型到中型输入数据大
阅读全文
posted @ 2024-08-12 11:50 deephub
阅读(81)
评论(0)
推荐(0)
2024年8月11日
Skeleton Recall Loss 分割领域的新突破:极大的减少了资源消耗,还能提高性能
摘要: 精确分割在当今众多领域都是一项关键需求比如说自动驾驶汽车的训练、医学图像识别系统,以及通过卫星图像进行监测。在许多其他领域,当感兴趣的对象微小但至关重要时,例如研究血管流动、手术规划、检测建筑结构中的裂缝或优化路线规划,需要更高的精度。此前已经做了大量工作来解决这种具有挑战性的分割问题。 此前已经做
阅读全文
posted @ 2024-08-11 10:53 deephub
阅读(49)
评论(0)
推荐(0)
2024年8月10日
多元时间序列分析统计学基础:基本概念、VMA、VAR和VARMA
摘要: 多元时间序列是一个在大学课程中经常未被提及的话题。但是现实世界的数据通常具有多个维度,所以需要多元时间序列分析技术。在这文章我们将通过可视化和Python实现来学习多元时间序列概念。这里假设读者已经了解单变量时间序列分析。 1、什么是多元时间序列? 顾名思义,多元时间序列是与时间相关的多维数据。我们
阅读全文
posted @ 2024-08-10 11:14 deephub
阅读(90)
评论(0)
推荐(0)
2024年8月3日
模型量化技术综述:揭示大型语言模型压缩的前沿技术
摘要: 大型语言模型(LLMs)通常因为体积过大而无法在消费级硬件上运行。这些模型可能包含数十亿个参数,通常需要配备大量显存的GPU来加速推理过程。 因此越来越多的研究致力于通过改进训练、使用适配器等方法来缩小这些模型的体积。在这一领域中,一个主要的技术被称为量化。 在这篇文章中,我将在语言建模的背景下介绍
阅读全文
posted @ 2024-08-03 12:11 deephub
阅读(219)
评论(0)
推荐(0)
2024年8月2日
深入浅出:可视化理解揭示决策树与梯度提升背后的数学原理
摘要: 决策树是一种非参数的监督学习算法,可用于分类和回归。它使用类似树的结构来表示决策及其潜在结果。决策树易于理解和解释,并且可以轻松地进行可视化。但是当决策树模型变得过于复杂时,它不能很好地从训练数据中泛化,会导致过拟合。 梯度提升是一种集成学习模型,在其中结合许多弱学习器从而得到一个强学习器。这些弱学
阅读全文
posted @ 2024-08-02 12:10 deephub
阅读(34)
评论(0)
推荐(0)
2024年8月1日
Adam-mini:内存占用减半,性能更优的深度学习优化器
摘要: Adam(W)目前为训练LLM的主流优化器,但其内存开销较大,这是因为Adam优化器需要存储一阶动量m和二阶动量v,总内存占用至少是模型大小的两倍,这对现有的高端显卡也是一种负担。论文提出一种新的优化器Adam-mini,在不牺牲性能的情况下减少Adam优化器的内存占用。 https://avoid
阅读全文
posted @ 2024-08-01 12:26 deephub
阅读(104)
评论(0)
推荐(0)
2024年7月28日
深度学习中常用损失函数介绍
摘要: 选择正确的损失函数对于训练机器学习模型非常重要。不同的损失函数适用于不同类型的问题。本文将总结一些常见的损失函数,并附有易于理解的解释、用法和示例 https://avoid.overfit.cn/post/1435dd9dc90e420e965b3ab939363216
阅读全文
posted @ 2024-07-28 16:26 deephub
阅读(102)
评论(0)
推荐(0)
上一页
1
···
40
41
42
43
44
45
46
47
48
···
139
下一页
公告