2025年7月18日
摘要:
OpenAI非常由下而上,尤其是在研究领域。我刚来的时候,开始询问下个季度的路线图。我得到的答案是:“这东西不存在”(虽然现在有了)。好的想法可以来自任何地方,而且事先往往并不清楚哪些想法会最有成效。进展不是来自一个宏伟的“总体规划”,而是迭代式的,随着新研究成果的出现而逐步揭示。得益于这种由下而上
阅读全文
posted @ 2025-07-18 15:24
风生水起
阅读(18)
推荐(0)
2025年7月15日
摘要:
SFT和RLHF阶段主要要培养模型的三个能力:(1) 领域内问题的判别能力,对领域外的问题需要能拒识 (2) 基于召回的知识回答问题的能力 (3) 领域内风格对齐的能力。 pretrain 的技术方法正在全面入侵 post training(退火、课程学习、多阶段训练。。。)
阅读全文
posted @ 2025-07-15 16:10
风生水起
阅读(14)
推荐(0)
2025年7月3日
摘要:
想象你在读一本悬疑小说,但许多关键线索却不知去向。你努力拼凑故事的碎片,但这些信息却被分散在各个章节里。这就好比AI模型在缺乏必要的信息的情况下回答问题时,它们就会胡言乱语。他们猜测,他们填补空白处——而他们也会出错。即使在像检索增强生成(RAG)这样的先进系统中,如果检索到的上下文片段不够明确或不
阅读全文
posted @ 2025-07-03 18:52
风生水起
阅读(63)
推荐(0)
2025年6月30日
摘要:
Agent:搭建任务结构,能精确地引导模型做事在有明确的 context 和清晰的任务范围时,Agent 已经能处理很复杂的任务了,可一旦任务变得模糊、需要探索环境或迭代开发,Agent 就开始吃力人类是可以做到在工作中学习的,如果能让模型在真实世界中学习,而不是人类需要花几十亿收集每个具体任务的数
阅读全文
posted @ 2025-06-30 10:43
风生水起
阅读(53)
推荐(0)
2025年4月23日
摘要:
CrewAI是一个开源的多智能体协作框架,其设计灵感来源于现实世界中的团队分工,通过协调多个具备特定角色的智能体(Agent)共同完成复杂任务。以下是其核心概念的详细说明: 1. 智能体(Agent) 定义:Agent是框架中的基本执行单元,类似于团队中的成员,拥有明确的角色、目标和背景故事
阅读全文
posted @ 2025-04-23 16:53
风生水起
阅读(307)
推荐(0)
2025年4月11日
摘要:
工业应用的三条黄金法则 基于实验结果,提炼出 MM-LLMs 在工业级 OCR 应用的实施建议: 1. 高价值文档必须专业扫描:合同、票据等关键文件需使用 ≥300PPI 的扫描设备。 2. 数字验证场景双系统并行:对验证码、身份证号等场景,建议采用"MM-LLMs 语境理解+传统 OCR 字符校验
阅读全文
posted @ 2025-04-11 10:51
风生水起
阅读(129)
推荐(0)
2025年4月8日
摘要:
O1复盘 简单复盘 o1 和 r1 之间间隔了四个月,这段时间里,rule-based reward 并没有被主流技术方案所认可。我们不妨做个简单的复盘,去思考下在那探索的四个月中,为什么大家更青睐于 prm / mcts 路线?为什么沿着这条路线做不出来突破?以及到底有哪些关键点是当时所被忽略的?
阅读全文
posted @ 2025-04-08 17:21
风生水起
阅读(277)
推荐(0)
2024年8月15日
摘要:
要将Word文档转换为Markdown格式,有几种方法可以实现这一转换,包括使用命令行工具、专门的转换工具以及通过编程方式。 使用命令行工具: Pandoc是一个强大的文档转换工具,支持多种格式之间的转换,包括Word文档(docx)到Markdown的转换。你可以从GitHub
阅读全文
posted @ 2024-08-15 19:44
风生水起
阅读(4123)
推荐(0)
2024年8月3日
摘要:
1. 回复中包含推理或解释 system prompt 1. You are an AI assistant that helps people find information. Provide a detailed answer so user don’t need to search outs
阅读全文
posted @ 2024-08-03 16:28
风生水起
阅读(432)
推荐(0)
2024年7月27日
摘要:
要确定大模型是否了解某个特定知识或概念,以下几种方法可以帮助你进行评估:1. **直接提问**: - **描述问题**:请模型解释某个概念。例如,你可以问“大模型,请解释一下牛顿的第一定律是什么?” - **生成问题**:让模型生成一些与该概念相关的问题,以此观察模型是否能正确问出与主题相关的问题。
阅读全文
posted @ 2024-07-27 10:10
风生水起
阅读(210)
推荐(0)