随笔分类 - 大模型开发
摘要:目录背景和价值一、功能与架构设计二、安全与合规能力三、技术支持与服务四、成本与扩展性五、适用场景总结参考资料 背景和价值 Dify 的社区版与企业版在功能完整性、技术支持、安全性和扩展性等方面存在显著差异,以下从核心维度进行对比解析: 一、功能与架构设计 社区版: 基础功能覆盖:支持 AI 工作流设
阅读全文
摘要:目录背景和价值参考资料 背景和价值 EvalScope的优势有如下几点: 内置多个业界认可的测试基准和评测指标:MMLU、CMMLU、C-Eval、GSM8K等。(附录中会介绍这些数据集的基本情况) 支持模型种类丰富,不仅仅支持常见的大语言模型的评测,还支持多模态模型、Embedding模型、Rer
阅读全文
摘要:olmOCR (0.3.0) 源自Qwen2.5-VL-7B-Instruct,需要在GPU运行,15G显存。 通用模型, 更新的版本基于qwen3 200+大尺寸模型,需要4张A100 特点:能够识别图片的语义,解析成文本。 格式:1 总结 2 细节 目前 olmOCR 只支持本地部署,硬件条件如
阅读全文
摘要:目录微调框架选择场景1:输入输出微调(含标注的“输入-输出”对)场景2:Function Calling微调(含标注的“函数调用规则”)场景3:实体提取微调(含标注的“实体及关联规则”)参考资料 微调框架选择 Unsloth 个人或者适合小团队。4bit动态量化可以压缩模型,但是只能单卡运行,不支持
阅读全文
摘要:目录背景和价值概念 数据飞轮 VS 数据中台数据飞轮是否针对AI驱动的产品才有价值数据飞轮的数据是否要经过数据中台?一、理想协同场景:数据飞轮的数据“建议经过”数据中台1. 为数据飞轮提供“高质量、标准化的数据燃料”2. 降低数据飞轮的“数据获取成本”3. 支撑多业务线的“飞轮联动”二、特殊例外场景
阅读全文
摘要:目录背景和价值大模型的涌现能力:零样本 / 少样本学习等大模型调优提示词工程微调人类反馈的强化学习( RLHF )和数据飞轮参考资料 背景和价值 大模型的涌现能力: 如逻辑推理、跨领域理解、零样本 / 少样本学习等,创造性内容生成能力 零样本 / 少样本学习等 模型无需大规模 “针对性训练数据”,仅
阅读全文
摘要:目录CV大模型和多模态大模型区别CV视觉模型 VS CNN参考资料 ci两个向量的点积,或者余弦相似度 CV大模型和多模态大模型区别 多模态大模型与 CV(计算机视觉)大模型的核心区别,本质是 **“处理的信息范围” 与 “核心能力目标” 的差异 **:CV 大模型是 “单模态视觉专家”,专注于解决
阅读全文
摘要:目录五步框架1. TASK(明确任务)2. CONTEXT(提供上下文)3. REFERENCES(添加参考资料)4. EVALUATE(评估结果)5. ITERATE(迭代优化)整体逻辑提示词迭代翻译解释参考资料 五步框架 提示词工程的五步框架(5 Step Framework),是设计有效大模型
阅读全文
摘要:目录背景和价值MCP VS A2AA2A(Agent-to-Agent Protocol)MCP(Model Context Protocol)MCP参考资料 背景和价值 MCP VS A2A 企业内部 Agent 通讯选择 A2A 还是 MCP,取决于具体的业务场景、对数据交互的要求以及 Agen
阅读全文
摘要:目录1. PT(Pre-training,预训练)2. SFT(Supervised Fine-Tuning,监督微调)3. RL(Reinforcement Learning,强化学习)三阶段对比总结实际应用场景 总结:sft 或者 rl 。现在 rl 很火,但是比较难搞。sft 里面的提示词工程
阅读全文
摘要:目录背景和价值参考资料 背景和价值 人工智能 1 专家系统,知识图谱。推理规则都是人事先定义的,所有它们的行为是可预期和可控的 2 机器学习。算法从数据学习规则。 大部分机器学习模型是黑盒,无法校验其逻辑。常用算法: 线性回归 决策树 神经网络 3 深度学习是机器学习的一个子集,它只关注利用深度神经
阅读全文
摘要:安全围栏 输入 sdk 输入敏感词过滤。词库 中**国 文本合规过滤 图片审核:https://help.aliyun.com/document_detail/70292.html 图片审核增强版:https://help.aliyun.com/document_detail/467826.html
阅读全文
摘要:目录背景和价值参考资料 背景和价值 https://github.com/jd-opensource/joyagent-jdgenie 业界首个开源高完成度轻量化通用多智能体产品(JoyAgent-JDGenie) 参考资料
阅读全文
摘要:目录参考资料 RAG 参考资料 https://zhuanlan.zhihu.com/p/1920578973072601126
阅读全文
摘要:目录背景和价值参考资料 背景和价值 PDF里面有分栏,分块。把这些以段落的形式转文本。 要想准确率高,需要对模型做训练。 像百度的准确率就要比开源的要高。 GitHub - opendatalab/DocLayout-YOLO: DocLayout-YOLO: Enhancing Document
阅读全文
摘要:目录背景和价值通过uv list能看到安装的包,但是pycharm找不到,而且排查pycharm 虚拟环境配置没有问题先卸载强制重新安装(会重新拉取并解压二进制包)解决办法1 - 镜像源加速解决办法2解决办法3诊断方法参考资料 背景和价值 通过uv list能看到安装的包,但是pycharm找不到,
阅读全文
摘要:目录背景和价值✅ 一、核心目标🧠 二、设计意图识别 Prompt 的思路✅ 示例 Prompt(中文)📌 三、进一步优化:加入 Few-Shot 示例🛠️ 四、在代码中调用 LLM 判断意图(伪代码)🧪 五、测试样例🚀 六、进阶建议(可选)✅ 总结参考资料 背景和价值 这是一个非常关键的问
阅读全文
摘要:目录背景和价值参考资料 背景和价值 Ollama、LMStudio适合初学者自己在家里电脑玩一玩,企业级部署我们用的vllm、SGLang、DeepSpeed这种多些,原理是一样的,要看背后的GPU资源有多少。本地的个人电脑能跑个小参数模型玩一玩,所以用Ollama也没啥问题,企业级跑大参数就需要考
阅读全文
摘要:目录背景和价值向量库存存储召回参考资料 背景和价值 向量库存存储 文本(物料的名称) 文本的embeding 图片 图片的embeding 召回 1 单独文本召回 2 单独图片召回 3 文本和图片 二路招回 参考资料
阅读全文
摘要:目录背景和价值AGENT详细分析参考资料 背景和价值 AI 代理形式多样,每种类型都旨在实现用户获取和参与方面的特定功能。了解不同类型的代理可以帮助企业根据自身需求选择合适的解决方案。主要的 AI 代理类型包括: 聊天机器人:这些人工智能驱动的对话代理通过文本或语音与用户互动。它们可以回答问题、提供
阅读全文

浙公网安备 33010602011771号