上一页 1 ··· 32 33 34 35 36 37 38 39 40 ··· 154 下一页
摘要: 真实标签的不完美性是机器学习领域一个不可避免的挑战。从科学测量数据到深度学习模型训练中的人工标注,真实标签总是包含一定比例的错误。即使像ImageNet这样精心策划的图像数据集,其人工标注的错误率仍达0.3%。在这种情况下,如何准确评估预测模型的性能就成为一个关键问题。本文将深入探讨如何在考虑测试数 阅读全文
posted @ 2025-04-02 12:12 deephub 阅读(56) 评论(0) 推荐(0)
摘要: 视频作为一种富含信息且密集的媒介,已广泛应用于娱乐、社交媒体、安全监控和自动驾驶等领域。人类能够轻松理解视频内容,例如理解因果关系、定位特定时刻以及关联动作。但是人工智能,尤其是大型语言模型(LLM)及其多模态(MLLM)变体,在视频理解方面仍然面临挑战,尤其是在处理长视频时。尽管像 GPT-4V 阅读全文
posted @ 2025-04-01 10:00 deephub 阅读(69) 评论(0) 推荐(0)
摘要: 生成对抗网络(GANs)的训练效果很大程度上取决于其损失函数的选择。本研究首先介绍经典GAN损失函数的理论基础,随后使用PyTorch实现包括原始GAN、最小二乘GAN(LS-GAN)、Wasserstein GAN(WGAN)及带梯度惩罚的WGAN(WGAN-GP)在内的多种损失函数。生成对抗网络 阅读全文
posted @ 2025-03-31 10:43 deephub 阅读(72) 评论(0) 推荐(0)
摘要: 在人工智能技术快速迭代发展的背景下,大语言模型(LLMs)已成为自然语言处理与生成领域的核心技术。然而,将这些模型与人类偏好精确对齐并增强其复杂推理能力的挑战,促使研究者开发了一系列复杂的强化学习(RL)技术。DAPO(解耦裁剪和动态采样策略优化,Decoupled Clip and Dynamic 阅读全文
posted @ 2025-03-30 10:41 deephub 阅读(259) 评论(0) 推荐(0)
摘要: 近年来,人工智能领域在多模态表示学习方面取得了显著进展,这类模型通过统一框架理解并整合不同数据类型间的语义信息,特别是图像与文本之间的关联性。在此领域具有里程碑意义的模型包括OpenAI提出的CLIP(Contrastive Language-Image Pre-training,对比语言-图像预训 阅读全文
posted @ 2025-03-29 10:14 deephub 阅读(223) 评论(0) 推荐(0)
摘要: SWEET-RL(Step-WisE Evaluation from Training-time information,基于训练时信息的逐步评估)是多轮大型语言模型(LLM)代理强化学习领域的重要技术进展。该算法相较于现有最先进的方法,成功率提升了6%,使Llama-3.1-8B等小型开源模型能够 阅读全文
posted @ 2025-03-28 09:48 deephub 阅读(139) 评论(0) 推荐(0)
摘要: 在异常检测领域,尤其针对工业机械、核反应堆和网络安全等复杂系统,传统方法往往难以有效处理高维度且相互关联的数据流。多元状态估计技术(MSET) 与序贯概率比检验(SPRT) 的组合方法在此类场景中展现出显著优势。 MSET-SPRT是一种结合机器学习状态估计与统计假设检验的混合技术框架,通过其高精度 阅读全文
posted @ 2025-03-27 10:24 deephub 阅读(86) 评论(0) 推荐(0)
摘要: RAL-Writer Agent是一种专业的人工智能写作辅助技术,旨在解决生成高质量、内容丰富的长篇文章时所面临的技术挑战,确保全文保持连贯性和相关性。本研究将系统分析RAL-Writer的核心技术架构、功能特点及其在内容创作、学术研究和专业交流领域的应用前景。 长文本生成的技术挑战 当前数字环境下 阅读全文
posted @ 2025-03-26 10:21 deephub 阅读(56) 评论(0) 推荐(0)
摘要: 预测不确定性量化在数据驱动决策过程中具有关键作用。无论是评估医疗干预的风险概率还是预测金融市场的价格波动范围,我们常需要构建预测区间——即以特定置信度包含目标真值的概率区间。 **分位数回归(Quantile Regression, QR)**作为一种传统统计方法,长期以来被用于预测此类区间。与常规 阅读全文
posted @ 2025-03-25 10:17 deephub 阅读(208) 评论(0) 推荐(0)
摘要: 扩散模型已成为现代文本到图像 (T2I) 生成技术的核心,能够生成高质量图像,但其迭代式推理过程导致生成速度缓慢。多数模型通常需要 20–50 个去噪步骤,这严重制约了其在实时应用中的部署。 现有的蒸馏技术旨在加速扩散模型的采样过程,然而,这些方法往往会引入稳定性问题,在极低步数下出现质量下降,并可 阅读全文
posted @ 2025-03-24 10:13 deephub 阅读(91) 评论(0) 推荐(0)
上一页 1 ··· 32 33 34 35 36 37 38 39 40 ··· 154 下一页