上一页 1 ··· 26 27 28 29 30 31 32 33 34 ··· 139 下一页
摘要: 我们在工作中经常会遇到一个问题,数据基础设施的设计往往没有充分考虑数据科学的需求。数据仓库或数据湖仓中的大量表格(主要是事实表和维度表)缺乏构建高性能机器学习模型所需的关键字段或结构。其中最显著的局限性在于,大多数表格仅记录观测值的当前状态,而未保留历史记录。 本文将通过缓慢变化维度(Slowly 阅读全文
posted @ 2025-01-06 09:47 deephub 阅读(31) 评论(0) 推荐(0)
摘要: 在机器学习领域存在一个普遍的认知误区,即可解释性与准确性存在对立关系。这种观点认为可解释模型在复杂度上存在固有限制,因此无法达到最优性能水平,神经网络之所以能够在各个领域占据主导地位,正是因为其超越了人类可理解的范畴。 其实这种观点存在根本性的谬误。研究表明,黑盒模型在高风险决策场景中往往表现出准确 阅读全文
posted @ 2025-01-05 13:56 deephub 阅读(57) 评论(0) 推荐(0)
摘要: 本文介绍了如何利用torch 2.5及以上版本中新引入的FlexAttention和BlockMask功能来实现因果注意力机制与填充输入的处理。 鉴于目前网络上缺乏关于FlexAttention处理填充输入序列的完整代码示例和技术讨论,本文将详细阐述一种实现方法,该方法同时涵盖了因果注意力机制的实现 阅读全文
posted @ 2025-01-04 09:53 deephub 阅读(33) 评论(0) 推荐(0)
摘要: 深度强化学习是人工智能领域最具挑战性的研究方向之一,其设计理念源于生物学习系统从经验中优化决策的机制。在众多深度强化学习算法中,软演员-评论家算法(Soft Actor-Critic, SAC)因其在样本效率、探索效果和训练稳定性等方面的优异表现而备受关注。 传统的深度强化学习算法往往在探索-利用权 阅读全文
posted @ 2025-01-03 09:54 deephub 阅读(202) 评论(0) 推荐(0)
摘要: 扩散模型在生成高质量图像领域具有显著优势,但其迭代去噪过程导致计算开销较大。分布匹配蒸馏(Distribution Matching Distillation,DMD)通过将多步扩散过程精简为单步生成器来解决这一问题。该方法结合分布匹配损失函数和对抗生成网络损失,实现从噪声图像到真实图像的高效映射, 阅读全文
posted @ 2025-01-02 09:53 deephub 阅读(113) 评论(0) 推荐(0)
摘要: 在当前的数据分析实践中,研究人员往往过度依赖t检验和方差分析(ANOVA)等传统统计方法。但是还存在多种具有重要应用价值但未受到足够重视的统计检验方法,这些方法在处理复杂的实际数据时具有独特优势。本文将详细介绍五种具有重要应用价值的统计检验方法,并探讨它们在免疫学(TCR/BCR库分析)、金融数据分 阅读全文
posted @ 2025-01-01 20:32 deephub 阅读(98) 评论(0) 推荐(0)
摘要: 大型语言模型在各个领域都展现出了卓越的性能,但其核心组件之一——softmax注意力机制在计算资源消耗方面存在显著局限性。本文将深入探讨如何通过替代方案实现线性时间复杂度,从而突破这一计算瓶颈。 注意力机制基础理论 本文假设读者已经熟悉ChatGPT、Claude等模型及其底层的transforme 阅读全文
posted @ 2024-12-31 10:45 deephub 阅读(39) 评论(0) 推荐(0)
摘要: Key-Value (KV)缓存已成为大语言模型(LLM)长文本处理的关键性能瓶颈。当前研究尚未充分关注解码阶段的优化,这一阶段具有同等重要性,因为: 1、对需要完整上下文的场景,预填充阶段的过度压缩会显著降低模型的推理理解能力 2、在长输出推理任务中存在重要特征的显著偏移现象 这篇论文提出SCOP 阅读全文
posted @ 2024-12-30 10:12 deephub 阅读(40) 评论(0) 推荐(0)
摘要: 近期Python生态系统发生了重要变化,特别是在包管理领域。Anaconda对其商业许可证政策进行了调整,要求大型非营利组织(员工超过200人)需要为使用其默认包仓库的每位用户获取商业许可。这一变化促使开发社区开始寻找更开放的解决方案,特别是考虑到Python本身及其大多数包都是开源的这一事实。 P 阅读全文
posted @ 2024-12-29 10:52 deephub 阅读(251) 评论(0) 推荐(0)
摘要: 面向信号处理的特征保持平滑技术 在数据分析领域,信号处理中的噪声问题始终是一个重要议题。无论是实验数据、金融时间序列还是其他形式的信号处理,噪声都会干扰目标模式和趋势的识别。尽管存在多种降噪方法,但在处理短时信号时,算法的性能往往比执行效率更为重要。在众多方法中Savitzky-Golay滤波器因其 阅读全文
posted @ 2024-12-28 10:18 deephub 阅读(169) 评论(0) 推荐(0)
上一页 1 ··· 26 27 28 29 30 31 32 33 34 ··· 139 下一页