随笔分类 - 大模型开发
摘要:目录背景和价值参考资料 背景和价值 参考资料 https://e.naixuejiaoyu.com/p/t_pc/course_pc_detail/column/p_66af216fe4b0d84dbbf4859b?product_id=p_66af216fe4b0d84dbbf4859b
阅读全文
摘要:目录 测试python,openai和langchain的版本 import sys print(sys.version) # 应显示虚拟环境中的 Python3 路径 import openai print(openai.__version__) import langchain print(la
阅读全文
摘要:目录背景和价值步骤 1:创建 Python3 虚拟环境步骤 2:激活虚拟环境步骤 3:安装 ipykernel 到虚拟环境步骤 4:将虚拟环境注册到 Jupyter步骤 5:在 Jupyter 中使用虚拟环境常见问题删除虚拟环境内核(如果需要)参考资料 背景和价值 在 Jupyter 中使用 Pyt
阅读全文
摘要:目录背景和价值Python 安装方法一:使用 pyenv(推荐)Anaconda 安装创建虚拟环境1. 退出当前虚拟环境 (如果要重建需要这么做)2. 验证 pyenv 是否正常工作3. 重新创建虚拟环境虚拟环境和 jupter绑定在虚拟环境中安装langchain 版本 0.1.16安装 opea
阅读全文
摘要:目录Model I/O常用接口Chat 基本原理一、消息类型定义与用途few show -- 提示词让大模型有规划能力开发流程1。准备好不同场景的提示词 ,可能有几百个,甚至几千个2. 用户发起问题 (用户)3. 基于语义相似度等挑选部分提示词(可能只有几个)+ 用户问的问题,一起给到大模型 (目的
阅读全文
摘要:目录背景知识1. 微调必须做的核心工作:领域微调(Fine Turing),目的是为了做领域适配RAG(检索增强生成)Retrieval - Augmented Generation 英 /ɔːɡˈmentɪd/RAG VS 微调2. Agent3. 大模型能替代垂直领域的小模型吗?参考资料 背景知
阅读全文
摘要:目录背景和价值参考资料 背景和价值 参考资料
阅读全文
摘要:目录LangChain架构LangSmith: 运维+监控 。LangServe:Templates: (非核心)LangGraph:LangChain:APIModel I/OChainsRetrievalAgentsMemoryLangchain官网如何学习最佳实践基于langchain开发的各
阅读全文
摘要:目录背景和价值Word2Vec基本思想模型架构连续词袋模型(CBOW)跳字模型(Skip - Gram)训练方法词向量的获取ELMo核心概念工作原理优势局限性应用场景参考资料 背景和价值 Word2Vec Word2Vec 是一种用于将文本中的单词转换为向量表示的模型,由谷歌团队在2013年提出。其
阅读全文
摘要:目录为什么要微调null业务概念向量流程数据算法算力编码器Input embedding 向量化处理位置编码(Positional Encoding)注意力(远近)机制 (Attention)全连接前馈网络- 关键字 : 激活函数解码器参考资料 什么是微调? 预训练的迷你版是微调 为什么要微调 全量
阅读全文
摘要:目录背景和价值调用大模型之前大模型调用优化提问质量引入本地知识库结果缓存与复用微调本地小模型参考资料 背景和价值 问题分析: 通常这类API是按调用次数或者按token数量计费的。 减少调用次数,或者token 我们应该从大模型开发的流程来看怎么节约token资源 调用大模型之前 缓存化。如果用户之
阅读全文
摘要:目录RAG流程子流程1: 知识更新 (上图的1-7)--数据准备阶段数据提取和清晰数据切分Embedding 嵌入存储(向量数据库)子流程2 知识检索/ 增强生成查询(Query)Embedding 嵌入生成向量查询向量数据库返回Related Text Chunks (一阶段检索)重排序 rera
阅读全文
摘要:目录业务概念微调(Fine-Tuning)和检索增强生成(RAG)相似点不同点应用架构应用层应用架构层应用技术层Agent智能体knowledgeworkfowRAG/检索增强生成Prompt/提示词工程Fine-tuning/微调COT/ 思维链数据抓取数据清洗数据向量访问控制模型层作为一个企业,
阅读全文
摘要:目录DEEPSEEK1 DeepSeek 深度优化混合专家模型2 MLA 多头潜注意力3 多令牌预测机制Deepseek的 MLA VS OpenapiI的 MHL计算和存储优化方面位置编码处理方面模型性能和应用场景方面参考资料 DEEPSEEK 3个创新 1 DeepSeek 深度优化混合专家模型
阅读全文

浙公网安备 33010602011771号