上一页 1 ··· 7 8 9 10 11 12 13 14 15 ··· 144 下一页
摘要: 现在的量化交易早就不是简单的技术指标了。真正有效的交易系统需要像一个完整的投资团队一样工作——有专门的分析师收集各种数据,有研究员进行深度分析和辩论,有交易员制定具体策略,还有风险管理团队把关。问题是传统的程序很难模拟这种复杂的协作流程。 LangGraph的多智能体架构正好解决了这个问题。我们可以 阅读全文
posted @ 2025-09-06 20:49 deephub 阅读(45) 评论(0) 推荐(0)
摘要: 当你需要处理大规模并行任务,特别是涉及GPU集群的场景时,Ray Serve和Celery是两个主要选择。但它们的设计理念完全不同: Celery是分布式任务队列,把任务推到broker,worker拉取执行。它的核心是扇出扇入(fan-out/fan-in),特别适合大批量离线处理。Ray Ser 阅读全文
posted @ 2025-09-05 20:30 deephub 阅读(11) 评论(0) 推荐(0)
摘要: DINOv3是Meta推出的自监督视觉骨干网络,最大的亮点是你可以把整个backbone冻住不动,只训练一个很小的任务头就能在各种密集预测任务上拿到SOTA结果。这对实际工程应用来说意义重大,因为大部分时候我们并不想重新训练一个几十亿参数的模型。 https://avoid.overfit.cn/p 阅读全文
posted @ 2025-09-04 21:03 deephub 阅读(324) 评论(0) 推荐(0)
摘要: Microsoft Research最近发布的rStar2-Agent展示了一个令人瞩目的结果:一个仅有14B参数的模型在AIME24数学基准测试上达到了80.6%的准确率,超越了671B参数的DeepSeek-R1(79.8%)。这不是简单的参数效率提升,而是AI推理的进步。 过去几年,大语言模型 阅读全文
posted @ 2025-09-03 20:30 deephub 阅读(42) 评论(0) 推荐(0)
摘要: 大语言模型智能体(LLM Agent)是一类利用大语言模型通过交互、推理和决策来自主执行复杂任务的系统,通常具备访问外部工具、记忆系统或环境的能力。与被动响应单一提示的传统LLM不同,LLM智能体采用主动且迭代的运行模式,在明确目标的引导下执行任务。这类系统正被广泛部署为跨领域的自主问题解决器,Op 阅读全文
posted @ 2025-09-02 19:55 deephub 阅读(26) 评论(0) 推荐(0)
摘要: 大语言模型的推理能力提升,经历了从规模扩展到方法创新的转变。Google在2022年提出Chain-of-Thought(CoT),通过让模型"展示工作过程"大幅提升了推理表现。随后Tree-of-Thought和Graph-of-Thought相继出现,推理结构从线性链条演进为复杂图网络。 htt 阅读全文
posted @ 2025-09-01 20:04 deephub 阅读(46) 评论(0) 推荐(0)
摘要: 当你有一个由研究员、文案、数据分析师和质检员组成的团队时,如果没有合理的协调机制,再优秀的个体也可能产生冲突的结论、停滞的流程,或者解决错误的问题。AI智能体同样如此。 随着系统从单体模型向多智能体架构演进,编排成为核心技术能力。仅仅拥有强大的智能体远远不够,关键在于让它们有效协作。编排本质上是设计 阅读全文
posted @ 2025-08-31 20:16 deephub 阅读(23) 评论(0) 推荐(0)
摘要: 最近好多论文开始将 神经架构搜索(NAS) 应用于大模型或 大型语言/视觉语言模型的设计中。 比如: LangVision-LoRA-NAS、Jet-Nemotron、PhaseNAS 等看来NAS又要有一波热度了,所以我来回顾一下NAS的基础技术。 深度学习的成功很大程度上依赖于神经网络架构的精心 阅读全文
posted @ 2025-08-30 21:59 deephub 阅读(44) 评论(0) 推荐(0)
摘要: 在AI智能体架构设计中,一个核心争议正在分化整个技术社区:是构建复杂的多智能体协同系统,还是专注于提升单智能体的综合能力?基于当前大多数生产环境的实践经验,研究机构发现多智能体系统相比于具备充分上下文信息的单智能体,但往往表现出更高的脆弱性和被过度估计的效能。 在AI系统设计初期,将智能体数量与系统 阅读全文
posted @ 2025-08-29 21:42 deephub 阅读(20) 评论(0) 推荐(0)
摘要: 大型语言模型的参数规模和复杂度持续增长,量化技术已成为优化推理效率的核心手段,这一点在消费级和企业级硬件部署中尤为关键。NVIDIA推出的NVFP4格式在众多量化方案中表现突出,其与Blackwell GPU架构的深度集成实现了显著的性能提升,同时保持了模型精度的稳定性。 本文将从技术角度深入分析N 阅读全文
posted @ 2025-08-28 21:19 deephub 阅读(51) 评论(0) 推荐(0)
上一页 1 ··· 7 8 9 10 11 12 13 14 15 ··· 144 下一页