2025年11月28日

摘要: 🌊 SFT(监督微调):像"老师教孩子游泳" 想象一下,你是一位游泳教练,正在教一个孩子学游泳: 你先站在泳池边,示范标准动作:"手臂这样划水,腿这样蹬,眼睛看前方" 你让孩子照着你的示范做,然后手把手纠正: "手抬高一点,这样划水更有效" "腿蹬得再用力一点" 你直接告诉孩子"标准答案",不是让 阅读全文

posted @ 2025-11-28 17:07 Java后端的Ai之路 阅读(38) 评论(0) 推荐(0)

摘要: DeepSeek-MoE:医院里的"智能分诊系统"大揭秘 想象一下,你走进一家超级智能医院,这里有1000位医生,但不是所有医生都懂所有疾病 术语说明图: 传统医院(Dense模型): 你生病了,不管是什么病,都必须找同一位全科医生 这位医生必须懂所有疾病,所以要学很多东西,但可能不是特别精通 你得 阅读全文

posted @ 2025-11-28 16:12 Java后端的Ai之路 阅读(21) 评论(0) 推荐(0)

摘要: 更生动的MLA工作原理:超市购物的"智能导购"比喻 想象一下,你走进一个超级大超市,想买一包特定的薯片。但这个超市有1000个货架,每个货架上有100种零食,你完全记不住每种零食的具体位置。 术语说明 传统方法(MHA):死记硬背 你必须记住:"乐事薯片在3号货架第5层第3个位置" 如果你要买"上好 阅读全文

posted @ 2025-11-28 15:16 Java后端的Ai之路 阅读(13) 评论(0) 推荐(0)

摘要: Thinking:当我们写程序的时候,什么时候用 DeepSeek-V3-0324,什么时候用 DeepSeek-R1? V3-0324:日常编程、快速开发、前端代码生成、常规脚本任务。 R1:数学密集型计算、复杂算法、代码逻辑深度优化、需要推理过程的任务。 => 更擅长复杂算法实现,能优化逻辑并减 阅读全文

posted @ 2025-11-28 14:05 Java后端的Ai之路 阅读(22) 评论(0) 推荐(0)


2025年11月27日

摘要: 🌟 PyCharm 通义灵码返回英文?30秒解决指南(亲测有效!) 一句话总结: 通义灵码在 PyCharm 默认用英文,不是插件问题,是 PyCharm 语言没调成中文! → 按3步操作,10秒搞定! 🛠️ ❓ 为什么 PyCharm 里通义灵码返回英文?(真相) 原因 说明 为什么在 PyC 阅读全文

posted @ 2025-11-27 14:11 Java后端的Ai之路 阅读(118) 评论(0) 推荐(0)


2025年11月26日

摘要: 🌟 Temperature & Top P 一句话总结: Temperature = AI的"胆量"(胆小→保守,大胆→创意) Top P = AI的"选词范围"(小范围→热门词,大范围→冷门词) 🧠 一、Temperature:AI的"胆量" ✅ 原理: 温度低(0.1) → AI胆小,只选最 阅读全文

posted @ 2025-11-26 21:21 Java后端的Ai之路 阅读(67) 评论(0) 推荐(0)

摘要: 🌟 ChatGPT训练原理 一句话总结: ChatGPT = AI通过"读书-培训-排序-优化"四步成长, 人类用"排序"教它"什么回答更好",不是"打分"! 📚 🧠 一、训练真相:四步走 ✅ 第一步:预训练(吃遍全网书) 真实过程: 用3000亿个token(相当于300万本书)训练语言模型 阅读全文

posted @ 2025-11-26 19:52 Java后端的Ai之路 阅读(55) 评论(0) 推荐(0)

摘要: 什么是AI AI的核心目标是让机器能够执行通常需要人类智能的任务,例如语言理解、图像识别、复杂问题解决等。 早期阶段:以规则为基础的专家系统,依赖预设的逻辑和规则。 机器学习时代:通过数据训练模型,使机器能够从数据中学习规律。 深度学习时代:利用神经网络模拟人脑的复杂结构,处理更复杂的任务。 大模型 阅读全文

posted @ 2025-11-26 19:25 Java后端的Ai之路 阅读(16) 评论(0) 推荐(0)

摘要: 🌟 30秒上手:DashScope API 调用指南(附案例+完整代码) 一、必须准备:获取 API Key(5分钟搞定) 去阿里云控制台 → DashScope 服务 点击“API Key” → “创建新的API Key” 复制 Key(像复制外卖账号密码!) 💡 重要:sk- 开头的字符串( 阅读全文

posted @ 2025-11-26 14:25 Java后端的Ai之路 阅读(58) 评论(0) 推荐(0)

摘要: 🌟 DashScope 大白话:阿里云的“AI点菜平台” ✅ 一句话说清:DashScope = 阿里云的“AI外卖平台” 你不用自己养厨师(训练模型), 直接点菜(调用API), 10秒吃上现成的AI大餐! 🍜 🔥 为什么叫“DashScope”?(名字拆解) Dash = 速度(像闪电一样 阅读全文

posted @ 2025-11-26 12:42 Java后端的Ai之路 阅读(97) 评论(0) 推荐(0)


博客园  ©  2004-2026
浙公网安备 33010602011771号 浙ICP备2021040463号-3