2025 年 6月 16 日随笔档案 - m516606428

2025年6月16日

摘要： ONNX 和 TensorRT：AI 模型部署的 “黄金搭档”（大白话版）一、ONNX：模型的 “通用翻译官” 1. 解决啥问题？不同 AI 框架（比如 PyTorch、TensorFlow）训练出的模型格式不一样，就像中文、英文、日文各自有语法，互相 “听不懂”。 ONNX 的作用：把所有模型阅读全文

posted @ 2025-06-16 23:10 m516606428 阅读(54) 评论(0) 推荐(0)

Coze和Dify 大白话讲讲

摘要： Coze 和 Dify 都是 AI 应用开发相关的平台，它们的区别如下：平台定位 Coze1：是字节跳动推出的，就像一个社交达人，主打 “对话即服务”。它是低代码 / 无代码的平台，能让你在半小时内快速搭建出一个可以发微博、接客服的聊天机器人，很适合 C 端用户和没有太多技术经验的小白开发者。 D 阅读全文

posted @ 2025-06-16 23:09 m516606428 阅读(349) 评论(0) 推荐(0)

模型层和技术的关系

摘要：模型层与技术之间存在紧密的互动关系，两者在不同领域（如计算机科学、机器学习、系统架构等）中相互依存、相互驱动。以下从概念定义、关系解析、具体案例及延伸思考四个维度展开说明：一、核心概念定义 1. 模型层（Model Layer）本质：指对现实问题或系统进行抽象、建模后的逻辑层次，通常以数学公式、阅读全文

posted @ 2025-06-16 22:53 m516606428 阅读(26) 评论(0) 推荐(0)

大模型mcp

摘要：在大模型领域，MCP 是指模型上下文协议（Model Context Protocol）1。以下是关于它的详细介绍1：起源与背景：2024 年 11 月 25 日由 Anthropic 公司发布。随着大模型的广泛应用，在处理长对话、多轮交互时面临上下文长度限制导致的信息丢失问题，以及不同模型 Fu 阅读全文

posted @ 2025-06-16 22:48 m516606428 阅读(198) 评论(0) 推荐(0)

对比 NLP 大模型工程师和 NLP 工程师的区别

摘要：从工作内容、知识学习、技术栈三个维度，对比 NLP 大模型工程师和 NLP 工程师的区别：一、工作内容差异 1. NLP 工程师（聚焦「传统 NLP 任务落地」）任务类型：围绕文本分类、情感分析、命名实体识别、机器翻译等单一 / 小型 NLP 任务展开。比如给电商评论做情感分析（区分好评 / 差阅读全文

posted @ 2025-06-16 22:28 m516606428 阅读(68) 评论(0) 推荐(0)

做模型算法工程师和大模型应用工程师你的工作内容具体区别是什么

摘要：模型算法工程师和大模型应用工程师在工作内容上有明显区别，从核心目标、技术侧重、工作流程等维度来看：一、核心目标差异模型算法工程师：聚焦 “造模型”，像打造能解决各类业务问题的算法模型，比如为金融风控设计精准识别风险的机器学习模型，或是给推荐系统构建高效推荐算法。要从 0 到 1 设计、优化算法阅读全文

posted @ 2025-06-16 22:13 m516606428 阅读(265) 评论(0) 推荐(0)

面试题如何提高rag 搜索资料的精准性和快速性

摘要：以下从精准性和快速性两方面，结合实际优化思路，用大白话给你讲清提升 RAG 检索效果的方法，面试答题时可这么组织：一、提高精准性的核心思路：让检索 “又准又贴” 要解决 “找的资料和问题对不上、有噪声” 的问题，关键是让检索系统更懂用户需求，精准匹配知识。 1. 优化文档处理（从源头保证质量）合阅读全文

posted @ 2025-06-16 21:12 m516606428 阅读(170) 评论(0) 推荐(0)

RAG（检索增强生成）的工作流程

摘要：一、先理解 RAG 的核心目的大模型（比如 ChatGPT）虽然知识多，但有两个问题：知识可能过时（比如不知道 2025 年的新政策）；没有你的私有知识（比如你公司的内部文档、行业机密）。 RAG 就是解决这俩问题的：让大模型回答问题时，先从你的 “私有知识库” 里找相关资料，再结合这些资料生阅读全文

posted @ 2025-06-16 21:08 m516606428 阅读(292) 评论(0) 推荐(0)

金融工具被用户调戏 agent怎么判断比如金融app 助手被问小孩两岁能不能学自行车

摘要：以下用大白话讲讲金融 APP 里的 Agent（智能助手）该咋判断、处理这类 “跨界调戏” 问题，分判断逻辑和处理方法两部分说：一、Agent 咋判断 “被调戏”？核心看 3 点金融 APP 的 Agent 本质是 “解决金融相关问题的”（比如查账户、理财咨询、贷款流程），遇到 “小孩两岁能不能阅读全文

posted @ 2025-06-16 21:06 m516606428 阅读(19) 评论(0) 推荐(0)

Transformer 里编码器（Encoder）的工作原理

摘要：这张图是在解释 Transformer 里编码器（Encoder）的工作原理，用大白话拆解如下：一、核心概念：“12288 维空间” 是啥？可以把一句话里的每个字 / 词，想象成一个 “超级多维度的坐标点”。比如 “北京” 这个词，在 AI 眼里不是简单的文字，而是一个 12288 个数字组成的阅读全文

posted @ 2025-06-16 21:03 m516606428 阅读(61) 评论(0) 推荐(0)

transformer decorder方向是主流么

摘要：要判断 Transformer Decoder 方向算不算主流，得结合它的应用场景和发展情况来看，用大白话给你拆解：一、先搞懂 Transformer 的 “encoder（编码器） + decoder（解码器）” 基本结构简单说，Transformer 是个 “编码器 - 解码器” 的组合：阅读全文

posted @ 2025-06-16 21:00 m516606428 阅读(20) 评论(0) 推荐(0)

“段位” 和 “年薪”：AI 岗位的 “等级 - 收入对照表”

摘要：一、“段位” 和 “年薪”：AI 岗位的 “等级 - 收入对照表” 最初级（5 - 15 万）：刚入门，会基础 Prompt（写指令让 AI 干活）就能混，比如让 AI 写文案、简单问答。初级（10 - 30 万）：比最初级多会 Agent（让 AI 像 “智能小助手” 执行任务），能做简单 AI 阅读全文

posted @ 2025-06-16 20:57 m516606428 阅读(75) 评论(0) 推荐(0)

语言文本预测和文本分类

摘要：语言文本预测和文本分类是两个相关但不同的概念，不能简单说 “文本预测本身就是文本分类任务”。下面用大白话拆解两者的关系： 1. 文本分类：给文本 “贴标签” 本质：把文本分到预设的几个类别里，比如：判断一句话是正面情绪还是负面情绪（情感分类）；区分邮件是垃圾邮件还是正常邮件；识别新闻属于体育、阅读全文

posted @ 2025-06-16 20:55 m516606428 阅读(34) 评论(0) 推荐(0)

GPT-3.5 比 GPT-3 好用的关键原因，核心是 “能力升级的三重逻辑”：

摘要：你理解得挺到位，用大白话展开唠唠 GPT-3.5 比 GPT-3 好用的关键原因，核心是 “能力升级的三重逻辑”：一、基础能力：参数、数据、训练目标的 “代际碾压” 参数与数据的量变→质变 GPT-3 是 “初代巨人”：参数多、数据广，但更像 “知识仓库”，你得用很规整的格式（比如指令清晰的问答、阅读全文

posted @ 2025-06-16 20:46 m516606428 阅读(100) 评论(0) 推荐(0)

GPT - 3、LLaMA

摘要：以下用大白话对比 GPT - 3 和 LLaMA 的区别、优缺点，方便你理解：一、“出身” 和定位 GPT - 3：你可以把它想成是 “科技大厂（OpenAI）精心打造的专业选手”，是 OpenAI 开发的大语言模型，目标就是面向全球各种场景，给大家提供通用又厉害的语言服务，像帮写文章、做问答这阅读全文

posted @ 2025-06-16 20:42 m516606428 阅读(42) 评论(0) 推荐(0)

讲讲微调

摘要：一、先说白话解释 “微调” 你可以把大模型想象成一个 “啥都懂点但不够精的通才”，就像刚毕业的大学生，知道很多知识，但没特别专长。微调就是给它上 “职业特训班”，用特定领域的小量数据接着训练，让它在某一行变成 “专家”。比如：通用大模型聊奶茶，只会说 “好喝”；微调后（用奶茶测评数据训练），能阅读全文

posted @ 2025-06-16 20:39 m516606428 阅读(23) 评论(0) 推荐(0)

怎么让 AI 系统（比如大语言模型 + 各种工具）更靠谱、更好用

摘要：这页内容是在说怎么让 AI 系统（比如大语言模型 + 各种工具）更靠谱、更好用，像人解决问题一样，拆成几个步骤，每个步骤找关键 “提升点”。用大白话逐个拆：标题：如何提升性能就是说，咱要搞清楚 “怎么让 AI 干活更准、更稳” ，核心是四个大方向：让 AI “判断当前状态” 更准（比如分清用户阅读全文

posted @ 2025-06-16 20:38 m516606428 阅读(110) 评论(0) 推荐(0)

基于大语言模型的智能体（LLM Based Agent）

摘要：就是说要聊聊靠大语言模型来打造 “智能小助手”（Agent）的事儿，这些小助手能像有逻辑、有状态的 “小脑瓜” 一样工作。 “从无状态，到特定状态的定义和识别” 以前大模型输出可能比较 “没条理、没记忆延续性”（无状态），现在要想办法让基于大模型的智能体，能明确 “不同阶段该啥样（定义特定状态）” 阅读全文

posted @ 2025-06-16 20:32 m516606428 阅读(46) 评论(0) 推荐(0)

function call..

摘要： Function Call 的核心：让 AI 自己决定 “该用哪个工具”，但你得提前 “摆好工具架” 一、AI 选工具的逻辑：像 “点菜” 一样，它只选你菜单里有的你提前定义好 “工具清单”：比如你告诉 AI：“现在有 3 个工具可用 → [天气 API、翻译 API、计算器]”。每个工具要写阅读全文

posted @ 2025-06-16 20:27 m516606428 阅读(40) 评论(0) 推荐(0)

MCP ,function call

摘要： MCP 没有替代 Function Call，它们有各自的特点和适用场景，以下是两者的对比1：定义和性质 MCP：是由 Anthropic 推出的通信协议，就像是一个 “通用插座标准”，目标是解决多模型、多工具对接时标准缺失的问题。它规定了上下文与请求的结构化传递方式，要求通信格式符合 JSON 阅读全文

posted @ 2025-06-16 20:24 m516606428 阅读(240) 评论(0) 推荐(0)

Function Call

摘要：一、先搞懂：AI 原来只会 “动嘴”，不会 “动手” 普通 AI（比如 ChatGPT）能跟你聊天、写文章，但没法直接「做事」：你问：“帮我订一张明天去上海的机票”，它只能回答 “好的，已为你查询到机票信息……” 但不会真的打开订票系统下单。 Function Call 的作用：给 AI 装一个阅读全文

posted @ 2025-06-16 20:21 m516606428 阅读(61) 评论(0) 推荐(0)

随机决策树, 随机树+随机森林

摘要：一、随机决策树（随机树）：单棵 "随性" 的树，是个 "基础算法单元" 本质：它本身就是一种独立的算法，核心特点是「在构建决策树的过程中引入随机性」。比如选特征时不选最靠谱的，而是随机挑一个；分节点时也不追求最优划分，而是 "差不多就行"。作用：像一个 "单打独斗的新手"，单独用也能做分类 / 阅读全文

posted @ 2025-06-16 20:17 m516606428 阅读(35) 评论(0) 推荐(0)

随机树

摘要：随机树：用 "选西瓜" 思维搞懂这棵会 "随机" 的树一、随机树是啥？先看个生活场景假设你去买西瓜，想挑个熟的，随机树就像一个 "选瓜攻略生成器"：它先随机挑一个选瓜标准（比如先看纹路是否清晰，还是先拍声音闷不闷）；按这个标准把西瓜分成两堆（纹路清晰的一堆，不清晰的一堆）；然后在每堆里再随阅读全文

posted @ 2025-06-16 20:15 m516606428 阅读(27) 评论(0) 推荐(0)

随机森林和随机树

摘要：随机森林和随机树的「接地气用法」：从买菜到写代码全场景覆盖一、随机森林的 5 大真实场景（附大白话解释） 1. 买菜时挑西瓜：判断西瓜熟没熟问题：根据西瓜的颜色、纹路、敲起来的声音，判断是否成熟。随机森林做法：找 100 个有经验的大爷大妈（100 棵树），每个人按自己的经验判断（比如 A 阅读全文

posted @ 2025-06-16 20:13 m516606428 阅读(47) 评论(0) 推荐(0)

随机森林随机树

摘要：随机森林和随机树：像一群 “算命先生” 帮你做决定先搞懂：啥是 “决策树”？决策树就像一棵 “问题树”，通过问一系列问题来做判断。比如判断 “今天要不要出门打球”：问题 1：下雨吗？→ 是→不出门；否→继续问问题 2：温度超过 35℃吗？→ 是→不出门；否→出门这棵树的每个分叉都是一个问题，阅读全文

posted @ 2025-06-16 20:10 m516606428 阅读(14) 评论(0) 推荐(0)

Stable Diffusion

摘要： Stable Diffusion 就是一个能 “画图画” 的 AI 工具，而且是那种你给点文字描述，它就能生成对应图片的狠角色！它到底能干啥？按你的想法 “捏图”：比如你说 “给我画一只戴着墨镜、在太空里弹吉他的橘猫”，它就能把这些元素组合成一张图，连细节（像猫的表情、吉他样式）都尽量贴合你的描阅读全文

posted @ 2025-06-16 20:09 m516606428 阅读(22) 评论(0) 推荐(0)

大模型dify

摘要： Dify 是一个开源的大语言模型（LLM）应用开发平台，旨在简化和加速生成式 AI 应用的创建和部署1。其具体功能如下1：融合多种理念和技术：融合了后端即服务（Backend as Service）和 LLMOps 的理念，为开发者提供用户友好的界面和强大工具，能快速搭建生产级 AI 应用。低代阅读全文

posted @ 2025-06-16 20:06 m516606428 阅读(95) 评论(0) 推荐(0)

大模型 Diffusion

摘要：大模型 Diffusion，也就是扩散模型，是一种生成式模型，能依据训练数据的模式和规律生成新的数据样本，在图像、音频、文本等多个领域都有应用123。它的工作原理可以理解为两个过程2：前向扩散过程：从干净的原始数据样本开始，比如一张图像，通过一系列时间步，逐步向其添加少量高斯噪声，直到原始信号几阅读全文

posted @ 2025-06-16 20:05 m516606428 阅读(31) 评论(0) 推荐(0)

LlamaIndex

摘要： LlamaIndex 是一个开源数据编排框架，主要用于构建大型语言模型（LLM）应用程序1。简单来说，它就像是一个桥梁，能把各种不同的数据和大型语言模型连接起来，让模型可以更好地利用这些数据来完成各种任务3。它具有以下功能3：数据处理：可以把非结构化的数据，如文本、PDF、网页、数据库等，转化成阅读全文

posted @ 2025-06-16 20:02 m516606428 阅读(32) 评论(0) 推荐(0)

大模型和nlp工程师区别

摘要：一、大模型工程师和 NLP 工程师的区别：就像 “造火箭” 和 “开飞机” NLP 工程师：专注于 “语言处理的具体问题” 工作内容：解决跟语言相关的具体任务，比如：让机器看懂文字：分词（把 “我爱北京天安门” 拆成 “我 / 爱 / 北京 / 天安门”）、命名实体识别（找出 “张三” 是人名）；阅读全文

posted @ 2025-06-16 19:56 m516606428 阅读(38) 评论(0) 推荐(0)

大模型mcp

摘要：大模型 MCP 就是一套让大模型能和外部世界更好沟通交流的规则和标准，全名叫模型上下文协议（Model Context Protocol）1。以前的大模型就像一个知识丰富但有点 “手脚不便” 的学者，只能根据自己学过的知识回答问题，因为训练数据是固定的，很难直接使用外部的工具或者获取最新的数据1。阅读全文

posted @ 2025-06-16 19:50 m516606428 阅读(38) 评论(0) 推荐(0)

Prompt

摘要： Prompt 大白话：让 AI 秒懂你心思的「沟通密码」一、先拆词：Prompt = 跟 AI 说话的「黑话模板」啥是 Prompt：你给 AI 下的「指令 + 提示」，比如对 ChatGPT 说「写一首春天的诗」，这句话就是 Prompt。类比：像教小孩做事 —— 你得说清楚「做什么、怎么做阅读全文

posted @ 2025-06-16 19:49 m516606428 阅读(27) 评论(0) 推荐(0)

LLM

摘要： LLM 大白话：让 AI 从「复读机」变「话痨智囊」一、先拆词：LLM = 超大号的「语言拼图大师」 LLM 全称：Large Language Model（大型语言模型），比如 GPT-4、Claude、文心一言。类比：你小时候玩过「词语接龙」，LLM 就是玩得贼 6 的高手，而且脑子装了海量阅读全文

posted @ 2025-06-16 19:47 m516606428 阅读(9) 评论(0) 推荐(0)

损失函数和激活函数大白话差异

摘要：损失函数和激活函数：大白话讲透两者的核心差异 1. 先记结论：一个是「裁判」，一个是「神经元开关」激活函数：管着神经网络里每个神经元「要不要干活、干多少活」，是「内部计算零件」。损失函数：管着整个模型「猜得准不准」，算完后告诉模型「哪里该改」，是「外部评价标准」。 2. 激活函数：神经元的「干活阅读全文

posted @ 2025-06-16 19:14 m516606428 阅读(48) 评论(0) 推荐(0)

二分类概率预测器

摘要： class TorchModel(nn.Module): def __init__(self, input_size): super(TorchModel, self).__init__() self.linear = nn.Linear(input_size, 1) # 线性层 self.acti 阅读全文

posted @ 2025-06-16 13:16 m516606428 阅读(23) 评论(0) 推荐(0)

ReLU

摘要：用大白话来说，ReLU 这个 “开关” 的核心意义就一句话：让神经网络只记住 “有用的正数信息”，扔掉 “没用的负数信息”，这样既能简化计算，又能让模型更聚焦关键特征。举个生活中的例子帮你理解：比如你要记一篇课文的重点：正数就像课文里的关键词（比如 “重点”“必须记住”），是有用的信息；负阅读全文

posted @ 2025-06-16 01:09 m516606428 阅读(18) 评论(0) 推荐(0)

如果不加 DiyModel 类的 forward 方法没有实现 Sigmoid 和 ReLU 激活函数呢

摘要：好的，用大白话解释就是：如果你的 DIY 模型里不实现 Sigmoid 和 ReLU 这两个「开关」，它算出来的结果就和 PyTorch 模型完全对不上！举个例子：假设 PyTorch 模型是这样工作的：先做一次线性变换（乘权重 + 偏置）经过 Sigmoid「开关」：把结果压缩到 0~1 阅读全文

posted @ 2025-06-16 01:08 m516606428 阅读(12) 评论(0) 推荐(0)

DNNfoward

摘要：一、DNN 前向传播（Forward）是什么？大白话：就像「做菜」，把原材料（输入数据）按菜谱（模型参数）一步步加工成成品（预测结果）。核心流程：输入数据 → 第 1 层（乘权重 + 加偏置 → 激活函数） → 第 2 层（同上） → … → 输出层 → 预测结果二、关键步骤拆解（用「做菜」阅读全文

posted @ 2025-06-16 00:37 m516606428 阅读(5) 评论(0) 推荐(0)

DNN 前向传播

摘要：用「快递包裹」比喻，5 分钟让你秒懂 DNN 的前向传播（Forward）～一、DNN 前向传播是干啥的？大白话：就像一个「包裹加工厂」，把输入数据一步步加工成输出结果。比如你输入一张猫的照片，DNN 会经过层层处理，最终输出「这是猫」的判断。整个过程就像：包裹（输入） → 传送带 → 1 号阅读全文

posted @ 2025-06-16 00:35 m516606428 阅读(40) 评论(0) 推荐(0)

pytorch 定义使用哪些网络层这是干什么 2个网络层和20个的区别，怎么定义用那些网络层并且这些网络层如何组成

摘要：续用「搭积木盖房子」的比喻，这次重点讲「怎么挑积木」和「怎么搭房子」，保证零基础也能懂～一、定义网络层：就像「挑积木类型」 1. 常用积木（网络层）有哪些？各干啥用？积木名称（PyTorch 层）白话功能描述常见用途举例 nn.Linear（全连接层）把输入数字全部「串起来」做线性变换，像「数阅读全文

posted @ 2025-06-16 00:32 m516606428 阅读(32) 评论(0) 推荐(0)

pytorch 定义使用哪些网络层这是干什么 2个网络层和20个的区别

摘要：一、网络层是干啥的？大白话：网络层就像是「乐高积木」，每个积木有特定功能，你可以拼出不同的房子（模型）。常见的网络层有：全连接层（nn.Linear）：像「万能连接器」，把所有输入连到输出，用于简单的数字变换。卷积层（nn.Conv2d）：像「扫描仪」，专门处理图像、音频等有局部结构的数据。阅读全文

posted @ 2025-06-16 00:28 m516606428 阅读(33) 评论(0) 推荐(0)

m516606428

公告