背景 过去笔者曾写过文章《AI辅助需求规格描述评审》,我们今天简单测试需求拆分任务,为什么需要markdown格式,因为MD格式1)容易通过GIT版本控制管理 2)LLM最擅长处理是MD文档 3)需求描述MD是代码逻辑生成基础。初始化我们把需求文档放入到文件夹后/INIT生成CLAUDE.md原始需 ...
介绍 (1) 发表:Arxiv 09.03 (2) 背景 查明对长执行跟踪链路中错误负责的特定代理或步骤被定义为代理系统故障归因的任务。然而,当前最新的推理 LLMS 仍不为此挑战而明显不足,精度通常低于10% 尽管现有工作已经作出了初步尝试,但他们仍然存在实质性的研究差距:① 培训资源(涉及大规模 ...
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...
背景 美团开源的 LongCat-Flash-Chat,核心卖点是“5600 亿总参数、仅激活 27 B 左右、推理 100 tokens/s、百万 token 输出成本约 5 元”。在公开基准上,它在指令遵循(IFEval 89.65)、智能体工具调用(τ²-Bench 67.7、VitaBenc ...
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...
在 AI 技术日新月异的今天,Deepseek 引领的 AI 技术革命正席卷而来,彻底改变着各行各业的工作形态。尤其是软件研发领域,AI 已成为提升开发效率的关键利器,不懂利用 AI 的研发人员,似乎正逐渐被时代的浪潮所抛下。 今天,我就来分享近两年在 AI 学习与探索之路上的点点滴滴,希望能与感兴 ...
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...
"我们的ChatBI上线半个月,准确率不到50%,老板问我们是不是在做假demo..." 如果你在做ChatBI,或正在评估要不要上ChatBI,相信你遇到过类似问题。 很多团队以为"ChatBI就是用大模型做自然语言到SQL的转换"。 有时还会被领导质疑:"找个开源项目3天就能搞定,你们怎么用了这 ...
近日,由天翼云公有云事业部联合基础架构事业部所撰写的论文《CTCCL: Cost-Efficient Joint Device-Network Load Balancing for LLM Training in RoCE-based Intelligent Computing Network》被第 ...
LangChain4j + 多模态视觉理解详细说明 @目录LangChain4j + 多模态视觉理解详细说明LangChain4j进行图像理解LangChain4j 多模态实战结合LangChain4j进行图像理解,其支持视觉-语言的多模态任务结合阿里巴巴通义万相进行图像生成(文本生成图像)最后: ...
Agentic Design Patterns A Hands-On Guide to Building Intelligent Systems[1], Antonio GulliTable of Contents - total 424 pages = 1+2+1+1+4+9+103+61+34+ ...
以下是LLaMA-Factory官方推荐的依赖组件及其版本,如果在linux上安装建议使用表格中的推荐版本,但是在windows上安装时,由于各组件提供的windows版本没有linux版本完备,为了兼容性考虑可节省时间(使用发布的wheel包而不是本地编译),这里并没有完全采用官方推荐的版本。 以 ...
参考文献:> https://www.kaggle.com/whitepaper-agents > 1.什么是Agent? Baseline:生成式AI模型 Training Aim:访问外部工具、自主规划和执行任务 What we get:具备推理、逻辑和访问外部信息的生成式AI(extended ...
背景 之前写过文章Claude Code下Kimi-k2模型初试,随着模型发展,我们今天来看看如何免费用Claude code。我们再回顾下他的特性:智能上下文管理ClaudeCode 的持久记忆机制(CLAUDE.md 文件存储项目历史)与 OpenRouter 的多模型调度深度融合,形成「记忆 ...
1. 基本信息 大语言模型 特伦斯•谢诺沃斯基 著 中信出版社,2025年07月出版 1.1. 读薄率 书籍总字数13.7万字,笔记总字数42724字。 读薄率42724÷137000≈31.19% 1.2. 读厚方向 千脑智能 脑机穿越 未来呼啸而来 虚拟人 AI3.0 新机器人 人工不智能:计算 ...
前言 看langgraph官方文档感觉human in the loop貌似还挺简单的,但实际上手时,那文档看得我云里雾里的。更详细的Guides和Reference,恕我能力有限,悲摧的也没看懂。作为试验,我想做一个功能:本地执行shell命令,每次执行前都要用户确认。左看官方文档, 右去西天请C ...
1. 从自然中学习 1.1. 大自然经过演化形成的计算机制虽然看似反直觉,但却能高效解决复杂问题 1.1.1. 这些机制天然适配于大规模并行运算,这与传统计算机追求串行处理的思路有本质区别 1.1.2. 随着并行计算技术的发展,借鉴自然界的解决方案来突破计算瓶颈已成为可能 1.2. 感觉运动系统在脊 ...
3. LangChain4j + 低阶 和 高阶 API的详细说明 @目录3. LangChain4j + 低阶 和 高阶 API的详细说明LangChain4j + 低阶 和 高阶 API的详细说明LangChain4j在两个抽象层(低阶 / 高阶)提供不同的 apilow level 低阶hig ...
背景HP DL360 Gen7 服务器安装新硬盘时,遇到问题如下问题:调研阶段KIMI K2模型我们试用让AI协助解决,第一次使用KIMI K2模型接着继续询问他的回答没有找出问题根本点,而是反馈ORCA自身限制问题,事实情况上只有2块物理硬盘。秘塔搜索最终在秘塔搜索长思考下,定位到问题https: ...