随笔列表第4页 - 风生水起

2025年4月23日

摘要： CrewAI是一个开源的多智能体协作框架，其设计灵感来源于现实世界中的团队分工，通过协调多个具备特定角色的智能体（Agent）共同完成复杂任务。以下是其核心概念的详细说明： 1. ‌智能体（Agent）‌ ‌定义‌：Agent是框架中的基本执行单元，类似于团队中的成员，拥有明确的角色、目标和背景故事阅读全文

posted @ 2025-04-23 16:53 风生水起阅读(534) 评论(0) 推荐(0)

2025年4月11日

文档识别：多模态还是OCR到底谁更强？工业届该如何抉择？

摘要：工业应用的三条黄金法则基于实验结果，提炼出 MM-LLMs 在工业级 OCR 应用的实施建议： 1. 高价值文档必须专业扫描：合同、票据等关键文件需使用 ≥300PPI 的扫描设备。 2. 数字验证场景双系统并行：对验证码、身份证号等场景，建议采用"MM-LLMs 语境理解+传统 OCR 字符校验阅读全文

posted @ 2025-04-11 10:51 风生水起阅读(163) 评论(0) 推荐(0)

2025年4月8日

RL细节为王

摘要： O1复盘简单复盘 o1 和 r1 之间间隔了四个月，这段时间里，rule-based reward 并没有被主流技术方案所认可。我们不妨做个简单的复盘，去思考下在那探索的四个月中，为什么大家更青睐于 prm / mcts 路线？为什么沿着这条路线做不出来突破？以及到底有哪些关键点是当时所被忽略的？阅读全文

posted @ 2025-04-08 17:21 风生水起阅读(373) 评论(0) 推荐(0)

2024年8月15日

word转化为markdown格式

摘要：要将Word文档转换为Markdown格式，‌有几种方法可以实现这一转换，‌包括使用命令行工具、‌专门的转换工具以及通过编程方式。‌ 使用命令行工具：‌ Pandoc是一个强大的文档转换工具，‌支持多种格式之间的转换，‌包括Word文档（‌docx）‌到Markdown的转换。‌你可以从GitHub 阅读全文

posted @ 2024-08-15 19:44 风生水起阅读(4370) 评论(0) 推荐(0)

2024年8月3日

大模型相关

摘要： 1. 回复中包含推理或解释 system prompt 1. You are an AI assistant that helps people find information. Provide a detailed answer so user don’t need to search outs 阅读全文

posted @ 2024-08-03 16:28 风生水起阅读(545) 评论(0) 推荐(0)

2024年7月27日

如何知道大模型是否了解某个知识/概念

摘要：要确定大模型是否了解某个特定知识或概念，以下几种方法可以帮助你进行评估：1. **直接提问**： - **描述问题**：请模型解释某个概念。例如，你可以问“大模型，请解释一下牛顿的第一定律是什么？” - **生成问题**：让模型生成一些与该概念相关的问题，以此观察模型是否能正确问出与主题相关的问题。阅读全文

posted @ 2024-07-27 10:10 风生水起阅读(267) 评论(0) 推荐(0)

2024年7月25日

LLAMA3.1数据处理

摘要：预训练数据我们从各种包含知识的数据源创建语言模型预训练数据集，直到2023年底。我们对每个数据源应用多种重复数据消除方法和数据清理机制，以获得高质量的令牌。我们删除了包含大量个人身份信息（PII）的域名，以及包含已知成人内容的域名。 3.1.1网络数据管理我们使用的大部分数据都是从网上获得的，我阅读全文

posted @ 2024-07-25 23:49 风生水起阅读(644) 评论(0) 推荐(0)

2024年7月20日

大模型如何学习知识？

摘要： How Do Large Language Models Acquire Factual Knowledge During Pretraining? 通常认为，LLM在预训练中学习知识。但是LLM对长尾知识的习得很差。有观点认为，Attention的qkv结构是对知识进行抽取（q*k计算attn_s 阅读全文

posted @ 2024-07-20 20:10 风生水起阅读(374) 评论(0) 推荐(0)

预处理知识库文件

摘要：预处理知识库文件阅读全文

posted @ 2024-07-20 09:58 风生水起阅读(432) 评论(0) 推荐(0)

2024年7月16日

System2蒸馏

摘要：核心思路：构造出system2系统，生产更好的数据；然后微调system1，达到更好的效果。 system2系统： 1. Rephrase and Respond 蒸馏 RaR 是一种 System 2 方法，它首先提示语言模型以进一步阐述的方式来复述原始问题，然后基于复述的问题生成响应，目的是提供阅读全文

posted @ 2024-07-16 14:12 风生水起阅读(102) 评论(0) 推荐(0)