AI
刷新
吴恩达深度学习课程五:自然语言处理 第二周:词嵌入(二)词嵌入模型原理

博主头像 此分类用于记录吴恩达深度学习课程的学习笔记。 课程相关信息链接如下: 原课程视频链接:[双语字幕]吴恩达深度学习deeplearning.ai github课程资料,含课件与笔记:吴恩达深度学习教学资料 课程配套练习(中英)与答案:吴恩达深度学习课后习题与答案 本篇为第五课的第二周内容,2.4到2. ...

使用 AI 编程工具的一点实践体会:为什么要减少对话轮次、一次把需求说清楚

博主头像 在使用 Cursor、ChatGPT 等 AI 编程工具的过程中,我逐渐意识到: 相比多轮对话不断修补需求,用更少的对话轮次一次性描述清楚核心需求, 反而更容易得到符合预期的实现。 本文结合实际使用经验,分析了对话轮次过多导致结果偏离的原因, 以及在什么情况下应当重新编辑问题而不是继续对话修补。 ...

WebDataset使用指南:构建高效深度学习数据管道

博主头像 在深度学习项目实践中,数据加载往往成为限制训练速度的关键瓶颈。当数据集规模达到数百万甚至数十亿样本时,传统的文件系统随机访问方式会导致I/O效率急剧下降,让昂贵的GPU资源处于闲置等待状态。WebDataset通过流式处理和顺序读取的设计理念,可以极大提升数据加载性能。 什么是WebDataset? ...

大模型微调评测入门:看懂这些指标,才知道模型好不好

博主头像 大模型微调评测入门:看懂这些指标,才知道模型好不好 从“瞎评”到“精准评”:大模型微调核心评测指标全拆解 大家好,我是七七!最近后台收到很多粉丝的共性提问:“我用LoRA微调了Llama 2 7B模型做情感分析,怎么判断它好不好用?”“微调后的文案生成模型,凭感觉比原版好,但是怎么证明?” 这其实戳 ...

民用卡 vs 专业卡 vs 云 GPU:大模型微调该选哪种?

博主头像 大模型微调的GPU选型,核心是“匹配场景+平衡成本”——个人追求性价比,团队兼顾稳定性,企业看重规模化。今天这篇文章,我就从三类GPU的核心差异、适配场景、实操选型三个维度,用大白话讲透选择逻辑,附实测数据和选型步骤,帮你不管是个人入门还是企业落地,都能选到最适合的GPU。 ...

大模型成本刺客退散!1/3算力跑出同等效果的秘诀

博主头像 不管是16G显卡的个人开发者,还是预算有限的小团队、追求ROI的企业,算力成本控制都是大模型落地的核心必修课。今天这篇文章,我就从微调、推理两个核心环节,拆解成本控制的底层逻辑和实操技巧,附16G显卡可直接套用的代码,帮你在不牺牲效果的前提下,把算力成本砍到最低。 ...

我们为什么需要另一个“桌面助手”?

一、起点:从手动查找到一键问答 开发初期,我只是想解决自己的一个高频痛点:在写代码、看PDF、甚至答题时,经常需要复制一段文本 → 打开浏览器 → 打开AI对话页 → 粘贴 → 等待回复 → 再切回原窗口。这个过程重复、低效,且打断心流。 于是,第一个版本诞生了:一个简单的窗口程序,内置大模型调用, ...

读人本智能产品设计6原则06互动(上)

博主头像 1. 互动 1.1. 亲密无间且直觉化的交互体验从此成为衡量人机互动的黄金准则 1.2. 对于产品发明者来说,理解人与产品之间只能通过预先编程好的零散规则进行交流互动,这很重要 1.3. 作为消费者和设计师,我们成长的环境都让人理所当然地认为产品就是功能的集合 1.4. 在设计产品的过程中最好是放弃 ...

初学者掌握 claude code 的一些进阶知识

博主头像 目录1.发展史2.斜杠命令 commands3.skill 技能包4.钩子 HOOK5. MCP 服务器6.插件 plugins7.子代理 SubAgents8.项目记忆文件 CLAUDE.md9.Plan模式暂时的结语 很少有人真的喜欢天天学新东西,我一个 java 技术栈的朋友,说我们怎么天天能 ...

基于深度学习的PCB板元器件检测系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)

博主头像 本文介绍了一个基于YOLO算法的PCB板元器件检测系统,该系统可识别22种元器件,支持图片、视频、批量文件和摄像头实时检测。系统采用Python3.10开发,前端使用PyQt5,数据库为SQLite,集成了YOLOv5/v8/v11/v12等多种模型。通过对比测试显示,YOLO12n模型精度最高(m... ...

Agent设计模式学习(基于langchain4j实现)(7) - 监督者模式

博主头像 书接上回,这次学习一种更高级的模式:监督者模式。职场上的牛马们,大家回想一下,每次部门的OKR,是怎样层层拆解最终落地的?是不是得有一个大佬(即:监督者),根据OKR先做拆解计划(plan),然后把活儿派给各组去落地(action),中间还会时不时的review? 这个就叫做监督者模式。 仍然还是这 ...

读人本智能产品设计6原则05表达(下)

博主头像 1. 物体的表达方式 1.1. 随着产品变得更具有互动性和内容驱动性,例如亚马逊的Alexa或苹果的Siri,语音交互成为多模态系统的必要组成部分 1.2. 语音要素必须与灯光、非语音提示、动作等实体表达形式有机融合,构成统一的产品语义体系 2. 灯光 2.1. 一种可以改变产品整体外观的动态材料 ...

大模型从“瞎聊”到“干活”:指令微调核心逻辑全拆解

博主头像 大模型从“瞎聊”到“干活”:指令微调核心逻辑全拆解 指令微调破局,让大模型从 “瞎聊” 变 “能干” 大家好,我是七七!刚入门大模型时,我总被一个问题困扰:明明Llama 2、Qwen这些模型能聊天说地,可一让它干具体活就掉链子——让它写电商文案,通篇空话套话;让它整理会议纪要,逻辑混乱漏重点;让它 ...

软件工程Agent在工程依赖版本升级探索

博主头像 背景与动机 现代软件项目广泛依赖开源库以避免重复开发,但库版本更新常引入破坏性变更,导致代码兼容性问题。手动适配这些更新需消耗大量开发者时间,且大型代码库中开发者易忽视更新警告或锁定旧版本,长期阻碍功能迭代、性能优化与安全修复。现有自动化方案未被广泛采用,而 LLM 在代码生成、程序修复等领域已展现 ...

新手在国内,如何 10 分钟快速用上 Claude Code !

博主头像 目录1.首先是安装!2.配置代理3.上聚合站搞 API4.配置环境,自定义模型 API5.选择其他模型6.终于看到主界面了7.完成 首先,这个话题针对的大概率是 claude opus 4.5 模型 很难在国内被使用。这个很好解决,我肯定不会肉身在国内,冒险去花个几百块砸去 Anthropic 官网 ...

基于深度学习的昆虫识别系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)

博主头像 基于YOLO系列深度学习算法的昆虫识别系统,支持对33种昆虫(如星天牛属、剑尾蛾、橙粉蝶等)进行高精度识别。系统提供图片、视频、文件夹批量及摄像头实时检测功能,具备多模型切换、置信度调节、语音播报、结果保存与导出等交互模块。训练阶段采用6000张标注图片,YOLO12n模型在验证集上mAP达40.6... ...

<123···50>