摘要: 美国网络安全局警告称,黑客正在利用PaperCut打印管理软件中的高危漏洞CVE-2023-2533进行攻击,该漏洞可导致远程代码执行,影响全球7万家机构的超1亿用户。 阅读全文
posted @ 2025-07-31 14:06 CodeShare 阅读(28) 评论(0) 推荐(0)
摘要: Google DeepMind宣布Gemini 2.5系列模型重大更新,包括增强的推理模式Deep Think、原生音频输出功能、计算机使用能力以及开发者体验优化,继续领跑AI技术前沿。 阅读全文
posted @ 2025-07-31 12:43 CodeShare 阅读(56) 评论(0) 推荐(0)
摘要: 本文提出SAKE方法,通过将待编辑知识建模为分布而非单一提示,利用最优传输理论实现大语言模型中知识的鲁棒性编辑,解决了现有方法在上下文鲁棒性和逻辑泛化方面的局限性。 阅读全文
posted @ 2025-07-31 11:01 CodeShare 阅读(37) 评论(0) 推荐(0)
摘要: 本文提出了一种渐进式训练框架HiPreNets,通过分阶段学习预测残差来提升神经网络精度,并探讨了损失函数选择、参数数量优化及自适应数据采样技术。实验验证了该方法在多个基准问题上的有效性。 阅读全文
posted @ 2025-07-31 09:01 CodeShare 阅读(21) 评论(0) 推荐(0)
摘要: 谷歌DeepMind发布Gemini Robotics和Gemini Robotics-ER两款机器人AI模型,突破视觉-语言-动作多模态技术,实现物理世界的交互与操作能力,推动通用机器人发展。 阅读全文
posted @ 2025-07-31 08:04 CodeShare 阅读(38) 评论(0) 推荐(0)
摘要: 本文提出MNEME框架,通过稀疏模型差分技术预测大语言模型在微调或知识遗忘过程中产生的副作用,如跨领域性能下降,无需依赖微调数据即可实现95%的准确率预测,并提供部分逆转效果的方法。 阅读全文
posted @ 2025-07-30 22:21 CodeShare 阅读(24) 评论(0) 推荐(0)
摘要: 本文介绍了Inworld TTS-1,这是一组基于Transformer的自回归文本转语音模型。TTS-1-Max拥有88亿参数,专为高质量和表现力设计;TTS-1则具有16亿参数,适用于实时语音合成和边缘设备。这些模型通过预训练、微调和强化学习对齐实现了最先进的性能,支持11种语言,具有精细的情感控制和48kHz高分辨率语音生成能力。 阅读全文
posted @ 2025-07-30 21:11 CodeShare 阅读(56) 评论(0) 推荐(0)
摘要: 本文提出RATE,一种基于大型语言模型(LLM)的检索增强生成技术提取管道,结合RAG和多定义LLM验证方法,在脑机接口和扩展现实领域案例中实现91.27%的F1分数,显著优于BERT模型。 阅读全文
posted @ 2025-07-30 20:01 CodeShare 阅读(30) 评论(0) 推荐(0)
摘要: 亚马逊学者Thomas Brox探讨计算机视觉的未来发展趋势,重点关注无监督学习、生成模型以及机器学习与几何学的结合,认为这些方向可能带来新的突破。 阅读全文
posted @ 2025-07-30 19:13 CodeShare 阅读(30) 评论(0) 推荐(0)
摘要: 本文介绍了RoD-TAL多模态数据集,用于评估大语言模型和视觉语言模型在罗马尼亚驾驶法律问答任务中的表现,包括信息检索、问答系统等技术实现细节。 阅读全文
posted @ 2025-07-30 14:06 CodeShare 阅读(12) 评论(0) 推荐(0)