上一页 1 ··· 18 19 20 21 22 23 24 25 26 ··· 66 下一页
摘要: 一、引言:长尾分布,视觉模型的“隐形陷阱” 在工业质检、智能安防、交通监控等真实场景中,视觉识别模型经常面临一个棘手的问题:训练集和测试环境中类别分布极度不均衡,这就是所谓的“长尾分布”现象。 少数主流类别(如正常样本、常见行为)数据丰富,而大量重要却稀有的“异常”样本(如瑕疵、越界、违规行为)极为 阅读全文
posted @ 2025-07-09 12:39 音视频牛哥 阅读(14) 评论(0) 推荐(0)
摘要: 一、引言:工业自动化的“智能眼睛” 随着智能制造、工业4.0的持续推进,计算机视觉逐渐取代人眼,成为工业自动化场景中不可替代的“感知系统”。 从生产线上的缺陷检测,到仓储机器人中的定位与导航,再到高危场所的远程识别与告警,图像识别技术已经从实验室走向生产线核心。 但现实问题是,工业视觉系统在部署时往 阅读全文
posted @ 2025-07-09 12:27 音视频牛哥 阅读(15) 评论(0) 推荐(0)
摘要: 一、引言:为什么选择 OpenCV + 视频流? 在人工智能的众多子领域中,计算机视觉无疑是最贴近“感知智能”的一环。而 OpenCV,作为最经典、最广泛应用的视觉库之一,提供了丰富的图像处理、目标检测、特征提取与几何变换工具,成为深度学习、边缘识别、嵌入式AI等场景中不可或缺的基础工具。 但在工程 阅读全文
posted @ 2025-07-09 11:10 音视频牛哥 阅读(7) 评论(0) 推荐(0)
摘要: 一、引言 在各种移动端与边缘端视觉应用中,图像抖动、画面晃动、拍摄不稳定等问题普遍存在,极大影响了用户观看体验与后续分析任务(如目标检测、追踪、超分等)的准确性。 因此,“稳像处理”(Video Stabilization)作为视觉图像预处理中的关键环节,已成为安防监控、直播采集、远程视频通话、智能 阅读全文
posted @ 2025-07-09 10:48 音视频牛哥 阅读(9) 评论(0) 推荐(0)
摘要: 近年来,Transformer 架构在计算机视觉(CV)领域的崛起推动了视觉模型的性能革命。从 ViT(Vision Transformer)到 Swin Transformer,再到各种混合卷积-Transformer 模型,Transformer 以其卓越的建模能力被广泛应用于图像分类、检测、分 阅读全文
posted @ 2025-07-09 10:31 音视频牛哥 阅读(22) 评论(0) 推荐(0)
摘要: 在音视频开发中,“能播”往往只是第一步,**“能正确、稳定、高质量地播”**才是衡量一款播放器成熟度的真正标准。尤其是在面对 AAC 音频流时,很多开发者容易忽视一个极其关键但看似微小的配置段 —— AAC Audio Specific Config(音频特定配置)。本文将以大牛直播SDK的RTSP 阅读全文
posted @ 2025-07-03 12:08 音视频牛哥 阅读(8) 评论(0) 推荐(0)
摘要: 在深度学习的黄金时代,大量标注数据似乎成了算法性能的前提。然而在许多现实场景中,如医疗图像分析、工业缺陷检测、遥感识别、甚至个性化视觉服务中,高质量、成规模的标注数据往往昂贵、稀缺,甚至难以获得。这种场景正是**少样本学习(Few-Shot Learning, FSL)**大展身手的舞台。 本文将系 阅读全文
posted @ 2025-07-02 23:26 音视频牛哥 阅读(15) 评论(0) 推荐(0)
摘要: 近年来,扩散模型(Diffusion Models, DMs)迅速崛起,成为计算机视觉领域最令人瞩目的生成模型之一。从生成高质量图像到风格迁移、图像修复,再到文本驱动图像生成(如 DALL·E 2、Stable Diffusion、Midjourney),扩散模型正以惊人的速度改变着视觉内容生成的格 阅读全文
posted @ 2025-07-02 23:19 音视频牛哥 阅读(197) 评论(0) 推荐(0)
摘要: 十年积累、全平台支持、毫秒级低延迟,我们如何在Unity3D中构建专业级RTSP/RTMP播放能力? 一、背景与定位:为什么Unity3D也需要一个专业级直播播放器? 随着Unity在工业可视化、远程运维、智能监控、教育培训甚至VR/AR等场景的广泛应用,Unity 开发者对“低延迟、高稳定”的直播 阅读全文
posted @ 2025-06-24 16:35 音视频牛哥 阅读(3) 评论(0) 推荐(0)
摘要: “不是每一行代码都值得骄傲,但每一次迭代,都是一次更接近极致的尝试。” 从最初的数千行代码、到如今跨平台、全功能、稳定可靠的直播技术基座,大牛直播SDK走过了整整十年。十年,既是时间的刻度,更是技术沉淀与产品信仰的写照。 一、从0到1:开源时代的“缝合怪”,与一行行自研代码的反叛 早期的音视频开发, 阅读全文
posted @ 2025-06-24 12:37 音视频牛哥 阅读(5) 评论(0) 推荐(0)
上一页 1 ··· 18 19 20 21 22 23 24 25 26 ··· 66 下一页