随笔分类 - 大模型开发 / AI大模型和小模型
摘要:目录背景和价值概念 数据飞轮 VS 数据中台数据飞轮是否针对AI驱动的产品才有价值数据飞轮的数据是否要经过数据中台?一、理想协同场景:数据飞轮的数据“建议经过”数据中台1. 为数据飞轮提供“高质量、标准化的数据燃料”2. 降低数据飞轮的“数据获取成本”3. 支撑多业务线的“飞轮联动”二、特殊例外场景
阅读全文
摘要:目录背景和价值大模型的涌现能力:零样本 / 少样本学习等大模型调优提示词工程微调人类反馈的强化学习( RLHF )和数据飞轮参考资料 背景和价值 大模型的涌现能力: 如逻辑推理、跨领域理解、零样本 / 少样本学习等,创造性内容生成能力 零样本 / 少样本学习等 模型无需大规模 “针对性训练数据”,仅
阅读全文
摘要:目录CV大模型和多模态大模型区别CV视觉模型 VS CNN参考资料 ci两个向量的点积,或者余弦相似度 CV大模型和多模态大模型区别 多模态大模型与 CV(计算机视觉)大模型的核心区别,本质是 **“处理的信息范围” 与 “核心能力目标” 的差异 **:CV 大模型是 “单模态视觉专家”,专注于解决
阅读全文
摘要:目录1. PT(Pre-training,预训练)2. SFT(Supervised Fine-Tuning,监督微调)3. RL(Reinforcement Learning,强化学习)三阶段对比总结实际应用场景 总结:sft 或者 rl 。现在 rl 很火,但是比较难搞。sft 里面的提示词工程
阅读全文
摘要:目录背景和价值参考资料 背景和价值 人工智能 1 专家系统,知识图谱。推理规则都是人事先定义的,所有它们的行为是可预期和可控的 2 机器学习。算法从数据学习规则。 大部分机器学习模型是黑盒,无法校验其逻辑。常用算法: 线性回归 决策树 神经网络 3 深度学习是机器学习的一个子集,它只关注利用深度神经
阅读全文
摘要:目录参考资料 NER模型(Named Entity Recognition,命名实体识别)是一种自然语言处理技术,用于从文本中识别并分类特定类型的实体,如人名、地名、组织名等。 NER模型需要微调,才能达到更好的识别效果。比如开发一个销售助手Agent,需要从用户的query识别出 类目信息, 那么
阅读全文
摘要:目录背景BGE-M3 介绍一、核心功能二、技术亮点三、应用场景四、与其他模型的对比五、使用建议参考资料 背景 向量数据库召回的准确度受2方面影响 1 切片方式 2 embeding算法 BGE-M3 介绍 BGE-M3 是北京智源人工智能研究院(BAAI)开发的多功能文本嵌入模型,其核心功能是通过多
阅读全文
摘要:目录背景参考资料 背景 我是一个销售智能体, 用户输入某个产品,打错字了,比如 香奈儿口红,输成 香赖儿口红 1 使用用户的输入去向量库查询,取top3,如果都一样,那么就取向量库的数据作为输入 2 如果向量库top3返回的结果不一样,就取top3 公共的字符串,去ES做模糊查询。 如果ES模糊的结
阅读全文
摘要:目录背景和价值 背景和价值 bert 训练1万起,但是样本只有1000+ 使用bert+ P-tuning小样本算法, 进行多标签分类 P-tuning 是一种针对预训练语言模型(如BERT、GPT)的参数高效微调方法,专门用于小样本学习(Few-shot Learning)场景。它通过引入可学习
阅读全文
摘要:[TOC] 差评打标 bert 1万起,但是样本只有1000+ 使用 P-tuning小样本算法, 进行多标签分类 bert基座+P-tuning 使用模型预训练、损失函数优化、阈值搜索等技术手段提升模型效果 多标签使用 正负样本,损失函数 -- shoujianming 多标签 现在做法: 使用大
阅读全文
摘要:目录背景和价值比如,我是卖ERP的,关注行业分类,客户规模。 相同行业,想通规模,需要的ERP产品是一样。 1000人的餐饮,跟5人餐饮公司,需要的ERP产品不要。如果都是餐饮行业,相同规模的餐饮公司,需要的产品是类似的。参考资料 背景和价值 产品推荐。 A用户画像和B用户画像相近,A买了什么场景,
阅读全文

浙公网安备 33010602011771号