会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
36
37
38
39
40
41
42
43
44
···
144
下一页
2024年11月14日
为什么卷积现在不火了:CNN研究热度降温的深层原因分析
摘要: 在深度学习领域,卷积神经网络(CNN)曾经是计算机视觉的代名词。自2012年AlexNet在ImageNet竞赛中取得突破性成功以来,CNN在图像识别、目标检测等领域掀起了一场革命。然而,纵观近年的顶会论文和研究热点,我们不得不承认一个现实:CNN相关的研究论文正在减少,曾经的"主角"似乎正逐渐淡出
阅读全文
posted @ 2024-11-14 10:03 deephub
阅读(48)
评论(0)
推荐(0)
2024年11月13日
SMoA: 基于稀疏混合架构的大语言模型协同优化框架
摘要: 在大语言模型(LLM)快速发展的背景下,研究者们越来越关注如何通过多代理系统来增强模型性能。传统的多代理方法虽然避免了大规模再训练的需求,但仍面临着计算效率和思维多样性的挑战。本文提出的稀疏代理混合(Sparse Mixture-of-Agents, SMoA)框架,通过借鉴稀疏专家混合(Spars
阅读全文
posted @ 2024-11-13 09:52 deephub
阅读(75)
评论(0)
推荐(0)
2024年11月12日
TSMamba:基于Mamba架构的高效时间序列预测基础模型
摘要: 在当今数据驱动的世界中,时间序列预测在多个领域扮演着关键角色。从医疗保健分析师预测患者流量,到金融分析师预测股市趋势,再到气候科学家预测环境变化,准确的时间序列预测都至关重要。然而,传统的预测模型面临着三个主要挑战: 数据获取难度:对于新兴模式的预测,相关训练数据往往难以获取或收集。例如,LOTSA
阅读全文
posted @ 2024-11-12 10:00 deephub
阅读(464)
评论(0)
推荐(0)
2024年11月11日
基于MCMC的贝叶斯营销组合模型评估方法论: 系统化诊断、校准及选择的理论框架
摘要: 贝叶斯营销组合建模(Bayesian Marketing Mix Modeling,MMM)作为一种先进的营销效果评估方法,其核心在于通过贝叶斯框架对营销投资的影响进行量化分析。在实践中为确保模型的可靠性和有效性,需要系统地进行模型诊断、分析和比较。本文将重点探讨这些关键环节,包括: 通过后验预测检
阅读全文
posted @ 2024-11-11 10:02 deephub
阅读(116)
评论(0)
推荐(0)
2024年11月10日
深度学习工程实践:PyTorch Lightning与Ignite框架的技术特性对比分析
摘要: 在深度学习框架的选择上,PyTorch Lightning和Ignite代表了两种不同的技术路线。本文将从技术实现的角度,深入分析这两个框架在实际应用中的差异,为开发者提供客观的技术参考。 核心技术差异 PyTorch Lightning和Ignite在架构设计上采用了不同的方法论。Lightnin
阅读全文
posted @ 2024-11-10 10:19 deephub
阅读(77)
评论(0)
推荐(0)
2024年11月9日
通过pin_memory 优化 PyTorch 数据加载和传输:工作原理、使用场景与性能分析
摘要: 在 PyTorch 框架中,有一个看似简单的设置可以对模型性能产生重大影响: pin_memory 。这个设置具体起到了什么作用,为什么需要关注它呢?如果你正在处理大规模数据集、实时推理或复杂的多 GPU 训练任务,将 pin_memory 设为 True 可以提高 CPU 与 GPU 之间的数据传
阅读全文
posted @ 2024-11-09 09:49 deephub
阅读(120)
评论(0)
推荐(0)
2024年11月8日
贝叶斯统计中常见先验分布选择方法总结
摘要: 在贝叶斯统计中,选择合适的先验分布是一个关键步骤。本文将详细介绍三种主要的先验分布选择方法: 经验贝叶斯方法 信息先验 无信息/弱信息先验 经验贝叶斯方法 经验贝叶斯方法是一种最大似然估计(MLE)方法,通过最大化先验分布下数据的边际似然来估计先验分布的参数。设X表示数据,θ表示参数,则经验贝叶斯估
阅读全文
posted @ 2024-11-08 17:19 deephub
阅读(157)
评论(0)
推荐(0)
2024年11月7日
Tokenformer:基于参数标记化的高效可扩展Transformer架构
摘要: 本文是对发表于arXiv的论文 "TOKENFORMER: RETHINKING TRANSFORMER SCALING WITH TOKENIZED MODEL PARAMETERS" 的深入解读与扩展分析。主要探讨了一种革新性的Transformer架构设计方案,该方案通过参数标记化实现了模型的
阅读全文
posted @ 2024-11-07 09:44 deephub
阅读(63)
评论(0)
推荐(0)
2024年11月6日
基于LLM Graph Transformer的知识图谱构建技术研究:LangChain框架下转换机制实践
摘要: 文本到图谱的转换是一个具有技术挑战性的研究领域,其核心任务是将非结构化文本数据转换为结构化的图谱表示。这种技术虽然由来已久,但随着大型语言模型(LLMs)的发展,其应用范围得到了显著扩展,并逐渐成为主流技术方案之一。 上图展示了信息抽取过程中文本到知识图谱的转换。图左侧展示了包含个人与公司关系描述的
阅读全文
posted @ 2024-11-06 09:52 deephub
阅读(80)
评论(0)
推荐(0)
2024年11月5日
基于Liquid State Machine的时间序列预测:利用储备池计算实现高效建模
摘要: Liquid State Machine (LSM) 是一种 脉冲神经网络 (Spiking Neural Network, SNN) ,在计算神经科学和机器学习领域中得到广泛应用,特别适用于处理 时变或动态数据。它是受大脑自然信息处理过程启发而提出的一种 脉冲神经网络 。 设想你正处于一片平静的湖
阅读全文
posted @ 2024-11-05 09:45 deephub
阅读(123)
评论(0)
推荐(0)
上一页
1
···
36
37
38
39
40
41
42
43
44
···
144
下一页
公告