此分类用于记录吴恩达深度学习课程的学习笔记。 课程相关信息链接如下: 原课程视频链接:[双语字幕]吴恩达深度学习deeplearning.ai github课程资料,含课件与笔记:吴恩达深度学习教学资料 课程配套练习(中英)与答案:吴恩达深度学习课后习题与答案 本篇为第五课的第二周内容,2.4到2. ...
在使用 Cursor、ChatGPT 等 AI 编程工具的过程中,我逐渐意识到:
相比多轮对话不断修补需求,用更少的对话轮次一次性描述清楚核心需求,
反而更容易得到符合预期的实现。
本文结合实际使用经验,分析了对话轮次过多导致结果偏离的原因,
以及在什么情况下应当重新编辑问题而不是继续对话修补。 ...
在深度学习项目实践中,数据加载往往成为限制训练速度的关键瓶颈。当数据集规模达到数百万甚至数十亿样本时,传统的文件系统随机访问方式会导致I/O效率急剧下降,让昂贵的GPU资源处于闲置等待状态。WebDataset通过流式处理和顺序读取的设计理念,可以极大提升数据加载性能。 什么是WebDataset? ...
大模型微调评测入门:看懂这些指标,才知道模型好不好 从“瞎评”到“精准评”:大模型微调核心评测指标全拆解 大家好,我是七七!最近后台收到很多粉丝的共性提问:“我用LoRA微调了Llama 2 7B模型做情感分析,怎么判断它好不好用?”“微调后的文案生成模型,凭感觉比原版好,但是怎么证明?” 这其实戳 ...
大模型微调的GPU选型,核心是“匹配场景+平衡成本”——个人追求性价比,团队兼顾稳定性,企业看重规模化。今天这篇文章,我就从三类GPU的核心差异、适配场景、实操选型三个维度,用大白话讲透选择逻辑,附实测数据和选型步骤,帮你不管是个人入门还是企业落地,都能选到最适合的GPU。 ...
不管是16G显卡的个人开发者,还是预算有限的小团队、追求ROI的企业,算力成本控制都是大模型落地的核心必修课。今天这篇文章,我就从微调、推理两个核心环节,拆解成本控制的底层逻辑和实操技巧,附16G显卡可直接套用的代码,帮你在不牺牲效果的前提下,把算力成本砍到最低。 ...
一、起点:从手动查找到一键问答 开发初期,我只是想解决自己的一个高频痛点:在写代码、看PDF、甚至答题时,经常需要复制一段文本 → 打开浏览器 → 打开AI对话页 → 粘贴 → 等待回复 → 再切回原窗口。这个过程重复、低效,且打断心流。 于是,第一个版本诞生了:一个简单的窗口程序,内置大模型调用, ...
1. 互动 1.1. 亲密无间且直觉化的交互体验从此成为衡量人机互动的黄金准则 1.2. 对于产品发明者来说,理解人与产品之间只能通过预先编程好的零散规则进行交流互动,这很重要 1.3. 作为消费者和设计师,我们成长的环境都让人理所当然地认为产品就是功能的集合 1.4. 在设计产品的过程中最好是放弃 ...
目录1.发展史2.斜杠命令 commands3.skill 技能包4.钩子 HOOK5. MCP 服务器6.插件 plugins7.子代理 SubAgents8.项目记忆文件 CLAUDE.md9.Plan模式暂时的结语 很少有人真的喜欢天天学新东西,我一个 java 技术栈的朋友,说我们怎么天天能 ...
本文介绍了一个基于YOLO算法的PCB板元器件检测系统,该系统可识别22种元器件,支持图片、视频、批量文件和摄像头实时检测。系统采用Python3.10开发,前端使用PyQt5,数据库为SQLite,集成了YOLOv5/v8/v11/v12等多种模型。通过对比测试显示,YOLO12n模型精度最高(m... ...
书接上回,这次学习一种更高级的模式:监督者模式。职场上的牛马们,大家回想一下,每次部门的OKR,是怎样层层拆解最终落地的?是不是得有一个大佬(即:监督者),根据OKR先做拆解计划(plan),然后把活儿派给各组去落地(action),中间还会时不时的review? 这个就叫做监督者模式。 仍然还是这 ...
1. 物体的表达方式 1.1. 随着产品变得更具有互动性和内容驱动性,例如亚马逊的Alexa或苹果的Siri,语音交互成为多模态系统的必要组成部分 1.2. 语音要素必须与灯光、非语音提示、动作等实体表达形式有机融合,构成统一的产品语义体系 2. 灯光 2.1. 一种可以改变产品整体外观的动态材料 ...
大模型从“瞎聊”到“干活”:指令微调核心逻辑全拆解 指令微调破局,让大模型从 “瞎聊” 变 “能干” 大家好,我是七七!刚入门大模型时,我总被一个问题困扰:明明Llama 2、Qwen这些模型能聊天说地,可一让它干具体活就掉链子——让它写电商文案,通篇空话套话;让它整理会议纪要,逻辑混乱漏重点;让它 ...
前面已经学习了 顺序、循环、条件分支、并行 这4种基本的工作流编排方式,利用这些可以组合出各种复杂的逻辑。下面将前面招聘的整个流程串起来,做一个相对比较完整的工作流: 宏观上,1-2-3是面向候选人的,4-5-6是面向公司招聘团队的。 一、定义Agent 1.1 CandidateWorkflow ...
企业大模型微调别盲目跟风!本文从ROI(投入产出比)出发,拆解微调的成本与收益,涵盖显性/隐性投入、商业收益量化、适用场景及4步测算法,附实用工具与案例,助企业避开烧钱陷阱,实现技术与生意的双赢。关注理性决策,让每一分投入都值得。 ...
背景与动机 现代软件项目广泛依赖开源库以避免重复开发,但库版本更新常引入破坏性变更,导致代码兼容性问题。手动适配这些更新需消耗大量开发者时间,且大型代码库中开发者易忽视更新警告或锁定旧版本,长期阻碍功能迭代、性能优化与安全修复。现有自动化方案未被广泛采用,而 LLM 在代码生成、程序修复等领域已展现 ...
5分钟掌握开源大模型选型核心:模型规模、任务适配性、许可协议、生态完善度四大维度,结合硬件与需求,16G显卡也能精准匹配Qwen、Mistral等模型,避坑提效,新手必看! ...
目录1.首先是安装!2.配置代理3.上聚合站搞 API4.配置环境,自定义模型 API5.选择其他模型6.终于看到主界面了7.完成 首先,这个话题针对的大概率是 claude opus 4.5 模型 很难在国内被使用。这个很好解决,我肯定不会肉身在国内,冒险去花个几百块砸去 Anthropic 官网 ...
书接上回,简历评估完后,根据评估结果,如果合格,公司就该通知面试,否则回邮件拒绝。也就是今天要演示的“条件工作流”。下面定义这2个分支对应的Agent: 一、定义不同分支的Agent 1.1 EmailAssistant (发邮件拒绝候选人Agent) 1 public interface Emai ...
基于YOLO系列深度学习算法的昆虫识别系统,支持对33种昆虫(如星天牛属、剑尾蛾、橙粉蝶等)进行高精度识别。系统提供图片、视频、文件夹批量及摄像头实时检测功能,具备多模型切换、置信度调节、语音播报、结果保存与导出等交互模块。训练阶段采用6000张标注图片,YOLO12n模型在验证集上mAP达40.6... ...