吴建明wujianming

2024年11月3日

摘要： CoSeR桥接图像和语言以实现认知超分辨率 6.10.1 CoSeR桥接图像和语言以实现认知超分辨率概述现有的超分辨率（SR）模型主要侧重于恢复局部纹理细节，往往忽略了场景中的全局语义信息。这种疏忽可能会导致在恢复过程中遗漏关键的语义细节或引入不准确的纹理。引入了认知超分辨率（CoSeR）框架，阅读全文

posted @ 2024-11-03 14:03 吴建明wujianming 阅读(122) 评论(0) 推荐(0)

综合、诊断和优化：迈向精细视觉语言理解

摘要：综合、诊断和优化：迈向精细视觉语言理解 6.8.1 综合、诊断和优化：迈向精细视觉语言理解概述视觉语言模型（VLM）在各种下游任务中表现出了卓越的性能。然而，理解细粒度的视觉语言概念，如属性和对象间关系，仍然是一个重大的挑战。虽然有几个基准旨在以更精细的粒度评估VLM，但它们的主要重点仍然是语言阅读全文

posted @ 2024-11-03 13:56 吴建明wujianming 阅读(57) 评论(0) 推荐(0)

2024年11月2日

光谱和偏振视觉光谱偏振现实世界数据集技术分析

摘要：光谱和偏振视觉光谱偏振现实世界数据集技术分析两种具有代表性的极化可视化，如图6-13所示。图6-13 两种具有代表性的极化可视化在图6-13中，（a）偏振椭圆描绘了投影到与光传播相切的平面上的电场振荡。（b）庞加莱球将光在归一化斯托克斯矢量轴上的偏振态可视化。图6-14 光谱偏振图像数据集阅读全文

posted @ 2024-11-02 18:35 吴建明wujianming 阅读(179) 评论(0) 推荐(0)

2024年11月1日

三重时空变化模式的视频协调

摘要：三重时空变化模式的视频协调 5.4.1 三重时空变化模式的视频协调概述视频协调是一项重要而具有挑战性的任务，旨在通过自动调整前景的外观以与背景协调，从而获得视觉上逼真的合成视频。受手动协调的短期和长期逐步调整过程的启发，提出了一个视频三重变换器框架，用于模拟视频中的三种时空变化模式，即短期空间以及阅读全文

posted @ 2024-11-01 09:17 吴建明wujianming 阅读(37) 评论(0) 推荐(0)

2024年10月31日

视频恶劣天气消除的扩散测试时间适应性

摘要：实践中的真知灼见：视频恶劣天气消除的扩散测试时间适应性现实世界中的视觉任务经常受到意外恶劣天气条件的影响，包括雨、霾、雪和雨滴。在过去的十年里，卷积神经网络和视觉变换器在单天气视频去除方面取得了突出成果。然而，由于缺乏适当的适应，它们中的大多数无法推广到其他天气条件。尽管ViWS-Net被建议使用阅读全文

posted @ 2024-10-31 05:38 吴建明wujianming 阅读(87) 评论(0) 推荐(0)

2024年10月30日

CDFormer：当退化预测包含盲图像超分辨率的扩散模型时

摘要： CDFormer：当退化预测包含盲图像超分辨率的扩散模型时现有的盲图像超分辨率（BSR）方法侧重于估计核或退化信息，但长期以来忽视了基本的内容细节。提出了一种新的BSR方法，即内容感知退化驱动变换器（CDFormer），用于捕获退化和内容表示。然而，低分辨率图像无法提供足够的内容细节，因此引入了一阅读全文

posted @ 2024-10-30 10:42 吴建明wujianming 阅读(73) 评论(0) 推荐(0)

2024年10月29日

分段任意模型满足零样本6D对象姿态估计

摘要： 6.11 SAM-6D：分段任意模型满足零样本6D对象姿态估计 6.11.1 SAM-6D：分段任意模型满足零样本6D对象姿态估计概述零样本6D物体姿态估计涉及在杂乱场景中检测具有6D姿态的新物体，这对模型的可推广性提出了重大挑战。幸运的是，最近的Segment Anything Model（SA 阅读全文

posted @ 2024-10-29 06:39 吴建明wujianming 阅读(144) 评论(0) 推荐(0)

2024年10月28日

PromptKD：视觉语言模型的无监督提示提取

摘要： PromptKD：视觉语言模型的无监督提示提取快速学习已成为增强视觉语言模型（VLM）的一种有价值的技术，例如用于特定领域下游任务的CLIP。现有的工作主要集中在设计各种学习形式的提示，忽视了提示作为从大型教师模型中学习的有效蒸馏器的潜力。介绍了一种无监督的领域提示蒸馏框架，旨在通过使用未标记的领阅读全文

posted @ 2024-10-28 08:45 吴建明wujianming 阅读(105) 评论(0) 推荐(0)

2024年10月27日

《LLVM编译器原理与实践》新书推荐（2024年10月）

摘要：《LLVM编译器原理与实践》，机械工业出版社出版，已于2024年10月出版。微信视频号：sph0RgSyDYV47z6快手号：4874645212抖音号：dy0so323fq2w小红书号：95619019828B站1：UID:3546863642871878B站2：UID: 35469554100 阅读全文

posted @ 2024-10-27 10:50 吴建明wujianming 阅读(868) 评论(4) 推荐(0)

2024年10月26日

简单谈谈Google TPUv6

摘要：简单谈谈Google TPUv6 根据Google TPU第六代的数据做了一些性能数据的对比，需要注意的是TPUv6当前应该是一个用于训推一体的单Die的版本,用于训练的V6p双Die版本应该会后期再发布. 需要注意的是在国内外都开始卷大模型推理价格的时候, TPU这样的东西对于提高ROI非常有帮助阅读全文

posted @ 2024-10-26 18:44 吴建明wujianming 阅读(537) 评论(0) 推荐(0)

吴建明

微信视频号：sph0RgSyDYV47z6 快手号：4874645212 抖音号：dy0so323fq2w 小红书号：95619019828 B站1：UID:3546863642871878 B站2：UID: 3546955410049087

公告