AI
刷新
吴恩达深度学习课程四:计算机视觉 第三周:检测算法 (四)YOLO 的完整传播过程

博主头像 此分类用于记录吴恩达深度学习课程的学习笔记。 课程相关信息链接如下: 原课程视频链接:[双语字幕]吴恩达深度学习deeplearning.ai github课程资料,含课件与笔记:吴恩达深度学习教学资料 课程配套练习(中英)与答案:吴恩达深度学习课后习题与答案 本篇为第四课的第三周内容,3.9到3. ...

GPT-5.2安全报告讨论

博主头像 一场复杂的辩论 OpenAI于12月11日发布的关于其最新模型GPT-5.2的系统安全报告,一经问世便在业内引发了广泛而复杂的争议。这份报告详细地呈现了新模型在各项安全与能力指标上的表现,但其数据却同时引出了两种截然相反的解读。这使得我们不得不直面一个核心问题:“我们究竟是看到了一个在安全和能力上取 ...

读人机沟通法则:理解数字世界的设计与形成06机器让失衡自动化

博主头像 1. 排斥 1.1. 科技公司需要全速运行以跟上摩尔时间尺度,这加大了在潜在雇员中优化“文化适配度” 1.1.1. 意味着招聘“和我们一样”的人—的压力 1.1.2. 新员工就会花更少的时间适应(因为他们“和我们一样”​)​,产生更少的日常摩擦(因为他们“和我们一样”​)​,并且听老板的话(因为他们 ...

吴恩达深度学习课程四:计算机视觉 第三周:检测算法 (三)交并比、非极大值抑制和锚框

博主头像 此分类用于记录吴恩达深度学习课程的学习笔记。 课程相关信息链接如下: 原课程视频链接:[双语字幕]吴恩达深度学习deeplearning.ai github课程资料,含课件与笔记:吴恩达深度学习教学资料 课程配套练习(中英)与答案:吴恩达深度学习课后习题与答案 本篇为第四课的第三周内容,3.6到3. ...

AI大模型电商Ecom-Bench评测解读

博主头像 阿里巴巴通义实验室推出的 EcomBench,这是一个专门为评估人工智能智能体在真实电商场景中表现而设计的基准测试。研究者认为现有的 AI 测试过于偏向学术理论,因此通过人工参与的方式,从亚马逊等平台提取真实的用户需求,构建了涵盖营销策略、成本定价和法律咨询等七大领域的实战考题。测试结果显示,尽管 ...

吴恩达深度学习课程四:计算机视觉 第三周:检测算法 (二)目标检测算法

博主头像 此分类用于记录吴恩达深度学习课程的学习笔记。 课程相关信息链接如下: 原课程视频链接:[双语字幕]吴恩达深度学习deeplearning.ai github课程资料,含课件与笔记:吴恩达深度学习教学资料 课程配套练习(中英)与答案:吴恩达深度学习课后习题与答案 本篇为第四课的第三周内容,3.3到3. ...

基于深度学习的安检危险品检测系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)

博主头像 摘要:本文介绍了一个基于YOLO算法的智能安检危险品检测系统。该系统采用三栏式界面设计,支持图片、视频及实时摄像头检测,可识别枪支、刀具等危险品,检测结果可标注保存并导出Excel。系统内置YOLOv5/v8/v11/v12多种模型,其中YOLO12n精度最高(mAP40.6%),YOLO11n速度... ...

吴恩达深度学习课程四:计算机视觉 第三周:检测算法 (一)目标定位与特征点检测

博主头像 此分类用于记录吴恩达深度学习课程的学习笔记。 课程相关信息链接如下: 原课程视频链接:[双语字幕]吴恩达深度学习deeplearning.ai github课程资料,含课件与笔记:吴恩达深度学习教学资料 课程配套练习(中英)与答案:吴恩达深度学习课后习题与答案 本篇为第四课的第三周内容,3.1到3. ...

企业级AI智能体(Agent)市场分析

博主头像 企业级AI智能体(Agent)市场分析报告:从应用场景到落地挑战的深度洞察AI智能体——从辅助工具到自主生产力的范式转移一场深刻的范式转移正在重塑人工智能的版图,其核心驱动力便是AI智能体(AI Agent)。它不再是亦步亦趋的辅助工具,而是正在崛起为一种能够自主规划与执行的全新生产力,彻底改写着人 ...

基于深度学习的水下海洋生物检测系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)

博主头像 本文介绍了一个基于YOLO算法的水下海洋生物识别系统,该系统具有以下特点:1)采用三栏式交互界面,支持图片、视频、摄像头等多种检测模式;2)具备多模型切换功能,内置YOLOv5/v8/v11/v12等模型,其中YOLO12n精度最高(mAP40.6%),YOLO11n速度最快(56.1ms);3)提... ...

Codex 正在推动开源 AI 模型的训练与发布

博主头像 继我们使用 Claude Code 训练开源模型的项目之后,现在我们更进一步,将 Codex 引入这一流程。这里的重点不是“Codex 自己开源模型”,而是让 Codex 作为编码代理,参与并自动化开源模型的训练、评估与发布全流程。为此,我们为 Codex 接入了 Hugging Face Skil ...

经同意的语音克隆

博主头像 在这篇博客文章中,我们介绍了“语音同意验证机制 (voice consent gate)”的概念,支持通过明确同意来进行语音克隆。我们还提供了一个 示例 Space 应用 和 相关代码,帮助大家快速上手这一想法。 近年来,逼真的语音生成技术已经达到了令人惊讶的水平。在某些情况下,生成出来的合成语音几 ...

流式数据集:效率提升 100 倍!

博主头像 快速了解(TLDR) 现在只需一行代码,就能通过 load_dataset('dataset', streaming=True) 以流式方式加载数据集,无需下载! 无需复杂配置、不占磁盘空间、不再担心 “磁盘已满” 或 429 请求过多错误,立即开始训练 TB 级数据集! 性能非常强劲:在 64×H ...

读人机沟通法则:理解数字世界的设计与形成03机器是有生命的

博主头像 1. 有没有生命 1.1. 看到一个物体在运动是判断其有生命的第一条线索 1.2. 智能手机和自动驾驶汽车出现之前就存在的技术:自动客服代表 1.3. 过去,人们很容易认为计算机很笨,因为它做任何事情都要花很长时间 1.3.1. 过去的交互技术很简单,缺少许多必要的组成部分,只能缓慢地响应我们的输入 ...

基于深度学习的草莓健康度检测系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)

博主头像 本文介绍了一套基于YOLO算法的草莓健康度智能检测系统。该系统采用三栏式界面设计,支持图片、视频和实时摄像头检测,能自动识别10种草莓病害状态并生成可视化报告。系统内置YOLOv5/v8/v11/v12多模型切换功能,其中YOLO12n以40.6%mAP表现最优,YOLO11n则以56.1ms推理速... ...

<1···789···50>