AI大模型和小模型 - 随笔分类 - 向着朝阳

数据飞轮

摘要：目录背景和价值概念数据飞轮 VS 数据中台数据飞轮是否针对AI驱动的产品才有价值数据飞轮的数据是否要经过数据中台？一、理想协同场景：数据飞轮的数据“建议经过”数据中台1. 为数据飞轮提供“高质量、标准化的数据燃料”2. 降低数据飞轮的“数据获取成本”3. 支撑多业务线的“飞轮联动”二、特殊例外场景阅读全文

posted @ 2025-08-24 12:54 向着朝阳阅读(203) 评论(0) 推荐(0)

大模型未来潜力和调优

摘要：目录背景和价值大模型的涌现能力：零样本 / 少样本学习等大模型调优提示词工程微调人类反馈的强化学习（ RLHF ）和数据飞轮参考资料背景和价值大模型的涌现能力：如逻辑推理、跨领域理解、零样本 / 少样本学习等，创造性内容生成能力零样本 / 少样本学习等模型无需大规模 “针对性训练数据”，仅阅读全文

posted @ 2025-08-24 11:18 向着朝阳阅读(25) 评论(0) 推荐(0)

CV大模型和多模态大模型

摘要：目录CV大模型和多模态大模型区别CV视觉模型 VS CNN参考资料 ci两个向量的点积，或者余弦相似度 CV大模型和多模态大模型区别多模态大模型与 CV（计算机视觉）大模型的核心区别，本质是 **“处理的信息范围” 与 “核心能力目标” 的差异 **：CV 大模型是 “单模态视觉专家”，专注于解决阅读全文

posted @ 2025-08-23 20:14 向着朝阳阅读(422) 评论(0) 推荐(0)

大模型算法-PT（预训练）、SFT（监督微调）和RL（强化学习）

摘要：目录1. PT（Pre-training，预训练）2. SFT（Supervised Fine-Tuning，监督微调）3. RL（Reinforcement Learning，强化学习）三阶段对比总结实际应用场景总结：sft 或者 rl 。现在 rl 很火，但是比较难搞。sft 里面的提示词工程阅读全文

posted @ 2025-08-14 13:49 向着朝阳阅读(872) 评论(0) 推荐(0)

AI学习笔记--001-什么是人工智能

摘要：目录背景和价值参考资料背景和价值人工智能 1 专家系统，知识图谱。推理规则都是人事先定义的，所有它们的行为是可预期和可控的 2 机器学习。算法从数据学习规则。大部分机器学习模型是黑盒，无法校验其逻辑。常用算法：线性回归决策树神经网络 3 深度学习是机器学习的一个子集，它只关注利用深度神经阅读全文

posted @ 2025-08-04 17:19 向着朝阳阅读(28) 评论(0) 推荐(0)

NER模型

摘要：目录参考资料 NER模型(Named Entity Recognition,命名实体识别)是一种自然语言处理技术,用于从文本中识别并分类特定类型的实体,如人名、地名、组织名等。 NER模型需要微调，才能达到更好的识别效果。比如开发一个销售助手Agent，需要从用户的query识别出类目信息，那么阅读全文

posted @ 2025-06-01 22:48 向着朝阳阅读(107) 评论(0) 推荐(0)

关于召回准确率和切片和 BGE-M3

摘要：目录背景BGE-M3 介绍一、核心功能二、技术亮点三、应用场景四、与其他模型的对比五、使用建议参考资料背景向量数据库召回的准确度受2方面影响 1 切片方式 2 embeding算法 BGE-M3 介绍 BGE-M3 是北京智源人工智能研究院（BAAI）开发的多功能文本嵌入模型，其核心功能是通过多阅读全文

posted @ 2025-05-14 20:39 向着朝阳阅读(1086) 评论(0) 推荐(0)

query纠错处理

摘要：目录背景参考资料背景我是一个销售智能体，用户输入某个产品，打错字了，比如香奈儿口红，输成香赖儿口红 1 使用用户的输入去向量库查询，取top3，如果都一样，那么就取向量库的数据作为输入 2 如果向量库top3返回的结果不一样，就取top3 公共的字符串，去ES做模糊查询。如果ES模糊的结阅读全文

posted @ 2025-05-12 21:13 向着朝阳阅读(29) 评论(0) 推荐(0)

小模型小样本训练提高模型精度的方法

摘要：目录背景和价值背景和价值 bert 训练1万起，但是样本只有1000+ 使用bert+ P-tuning小样本算法，进行多标签分类 P-tuning 是一种针对预训练语言模型（如BERT、GPT）的参数高效微调方法，专门用于小样本学习（Few-shot Learning）场景。它通过引入可学习阅读全文

posted @ 2025-04-25 07:04 向着朝阳阅读(121) 评论(0) 推荐(0)

模型调优临时笔记

摘要：[TOC] 差评打标 bert 1万起，但是样本只有1000+ 使用 P-tuning小样本算法，进行多标签分类 bert基座+P-tuning 使用模型预训练、损失函数优化、阈值搜索等技术手段提升模型效果多标签使用正负样本，损失函数 -- shoujianming 多标签现在做法：使用大阅读全文

posted @ 2025-04-23 10:26 向着朝阳阅读(27) 评论(0) 推荐(0)

产品推荐算法

摘要：目录背景和价值比如，我是卖ERP的，关注行业分类，客户规模。相同行业，想通规模，需要的ERP产品是一样。 1000人的餐饮，跟5人餐饮公司，需要的ERP产品不要。如果都是餐饮行业，相同规模的餐饮公司，需要的产品是类似的。参考资料背景和价值产品推荐。 A用户画像和B用户画像相近，A买了什么场景，阅读全文

posted @ 2025-04-19 18:04 向着朝阳阅读(169) 评论(0) 推荐(0)

aibi1

随笔分类 - 大模型开发 / AI大模型和小模型

公告