上一页 1 2 3 4 5 6 7 ··· 92 下一页
  2025年7月18日
摘要: OpenAI非常由下而上,尤其是在研究领域。我刚来的时候,开始询问下个季度的路线图。我得到的答案是:“这东西不存在”(虽然现在有了)。好的想法可以来自任何地方,而且事先往往并不清楚哪些想法会最有成效。进展不是来自一个宏伟的“总体规划”,而是迭代式的,随着新研究成果的出现而逐步揭示。得益于这种由下而上 阅读全文
posted @ 2025-07-18 15:24 风生水起 阅读(18) 评论(0) 推荐(0)
  2025年7月15日
摘要: SFT和RLHF阶段主要要培养模型的三个能力:(1) 领域内问题的判别能力,对领域外的问题需要能拒识 (2) 基于召回的知识回答问题的能力 (3) 领域内风格对齐的能力。 pretrain 的技术方法正在全面入侵 post training(退火、课程学习、多阶段训练。。。) 阅读全文
posted @ 2025-07-15 16:10 风生水起 阅读(14) 评论(0) 推荐(0)
  2025年7月3日
摘要: 想象你在读一本悬疑小说,但许多关键线索却不知去向。你努力拼凑故事的碎片,但这些信息却被分散在各个章节里。这就好比AI模型在缺乏必要的信息的情况下回答问题时,它们就会胡言乱语。他们猜测,他们填补空白处——而他们也会出错。即使在像检索增强生成(RAG)这样的先进系统中,如果检索到的上下文片段不够明确或不 阅读全文
posted @ 2025-07-03 18:52 风生水起 阅读(63) 评论(0) 推荐(0)
  2025年6月30日
摘要: Agent:搭建任务结构,能精确地引导模型做事在有明确的 context 和清晰的任务范围时,Agent 已经能处理很复杂的任务了,可一旦任务变得模糊、需要探索环境或迭代开发,Agent 就开始吃力人类是可以做到在工作中学习的,如果能让模型在真实世界中学习,而不是人类需要花几十亿收集每个具体任务的数 阅读全文
posted @ 2025-06-30 10:43 风生水起 阅读(53) 评论(0) 推荐(0)
  2025年4月23日
摘要: CrewAI是一个开源的多智能体协作框架,其设计灵感来源于现实世界中的团队分工,通过协调多个具备特定角色的智能体(Agent)共同完成复杂任务。以下是其核心概念的详细说明: 1. ‌智能体(Agent)‌ ‌定义‌:Agent是框架中的基本执行单元,类似于团队中的成员,拥有明确的角色、目标和背景故事 阅读全文
posted @ 2025-04-23 16:53 风生水起 阅读(307) 评论(0) 推荐(0)
  2025年4月11日
摘要: 工业应用的三条黄金法则 基于实验结果,提炼出 MM-LLMs 在工业级 OCR 应用的实施建议: 1. 高价值文档必须专业扫描:合同、票据等关键文件需使用 ≥300PPI 的扫描设备。 2. 数字验证场景双系统并行:对验证码、身份证号等场景,建议采用"MM-LLMs 语境理解+传统 OCR 字符校验 阅读全文
posted @ 2025-04-11 10:51 风生水起 阅读(129) 评论(0) 推荐(0)
  2025年4月8日
摘要: O1复盘 简单复盘 o1 和 r1 之间间隔了四个月,这段时间里,rule-based reward 并没有被主流技术方案所认可。我们不妨做个简单的复盘,去思考下在那探索的四个月中,为什么大家更青睐于 prm / mcts 路线?为什么沿着这条路线做不出来突破?以及到底有哪些关键点是当时所被忽略的? 阅读全文
posted @ 2025-04-08 17:21 风生水起 阅读(277) 评论(0) 推荐(0)
  2024年8月15日
摘要: 要将Word文档转换为Markdown格式,‌有几种方法可以实现这一转换,‌包括使用命令行工具、‌专门的转换工具以及通过编程方式。‌ 使用命令行工具:‌ Pandoc是一个强大的文档转换工具,‌支持多种格式之间的转换,‌包括Word文档(‌docx)‌到Markdown的转换。‌你可以从GitHub 阅读全文
posted @ 2024-08-15 19:44 风生水起 阅读(4123) 评论(0) 推荐(0)
  2024年8月3日
摘要: 1. 回复中包含推理或解释 system prompt 1. You are an AI assistant that helps people find information. Provide a detailed answer so user don’t need to search outs 阅读全文
posted @ 2024-08-03 16:28 风生水起 阅读(432) 评论(0) 推荐(0)
  2024年7月27日
摘要: 要确定大模型是否了解某个特定知识或概念,以下几种方法可以帮助你进行评估:1. **直接提问**: - **描述问题**:请模型解释某个概念。例如,你可以问“大模型,请解释一下牛顿的第一定律是什么?” - **生成问题**:让模型生成一些与该概念相关的问题,以此观察模型是否能正确问出与主题相关的问题。 阅读全文
posted @ 2024-07-27 10:10 风生水起 阅读(210) 评论(0) 推荐(0)
上一页 1 2 3 4 5 6 7 ··· 92 下一页