吴建明wujianming

2024年11月27日

摘要：模糊耗散合成神经编解码器中的拉普拉斯熵模型虽然用条件扩散模型代替高斯解码器，可以提高神经图像压缩中重建的感知质量，但它们缺乏对图像数据的感应偏差，限制了它们实现最先进感知水平的能力。为了解决这一局限性，在解码器侧采用了非各向同性扩散模型。该模型施加了一种感应偏置，旨在区分频率内容，从而促进高质量图阅读全文

posted @ 2024-11-27 04:24 吴建明wujianming 阅读(20) 评论(0) 推荐(0)

2024年11月26日

CFAT：释放三角窗口实现图像超分辨率

摘要： CFAT：释放三角窗口实现图像超分辨率基于变换器的模型通过利用其固有的捕获复杂上下文特征的能力，彻底改变了图像超分辨率（SR）的效果。如今，在Transformer架构中使用的重叠矩形移位窗口技术是超分辨率模型中的一种常见做法，可以提高图像放大的质量和鲁棒性。然而，它在边界处存在失真，并且具有有限阅读全文

posted @ 2024-11-26 02:49 吴建明wujianming 阅读(56) 评论(0) 推荐(0)

2024年11月25日

SFOD：尖峰聚变目标探测器

摘要： SFOD：尖峰聚变目标探测器事件摄像机具有高时间分辨率、高动态范围、低功耗和高像素带宽的特点，为特殊环境中的物体检测提供了独特的能力。尽管有这些优点，但事件数据的固有稀疏性和异步性对现有的对象检测算法提出了挑战。受人脑编码和处理信息方式的启发，尖峰神经网络（SNN）为这些难题提供了一种潜在的解决方阅读全文

posted @ 2024-11-25 03:17 吴建明wujianming 阅读(97) 评论(0) 推荐(0)

2024年11月24日

通过学习先验增强基于流的生成超分辨率模型

摘要：通过学习先验增强基于流的生成超分辨率模型基于流的超分辨率（SR）模型在生成高质量图像方面表现出了惊人的能力。然而，这些方法在图像生成过程中遇到了一些挑战，例如网格伪影、爆炸反转以及由于采样温度不稳定而导致的次优结果。为了克服这些问题，这项工作在基于流的SR模型的推理阶段之前引入了条件学习。该先验是阅读全文

posted @ 2024-11-24 09:10 吴建明wujianming 阅读(122) 评论(0) 推荐(0)

2024年11月23日

LEAD：用于无源通用域自适应的学习分解

摘要： LEAD：用于无源通用域自适应的学习分解通用领域适应（UniDA）的目标是在存在协变量和标签转移的情况下进行知识转移。最近，出现了无源通用域适配（SF UniDA），可以在不访问源数据的情况下实现UniDA，由于数据保护政策，这往往更实用。主要的挑战在于确定协变量移位样本是否属于目标私有未知类别。阅读全文

posted @ 2024-11-23 04:59 吴建明wujianming 阅读(125) 评论(0) 推荐(0)

无监督域自适应的域不可知相互激励

摘要：无监督域自适应的域不可知相互激励传统的无监督域自适应（UDA）致力于最大限度地减少域之间的分布差异，这忽视了从数据中利用丰富的语义，并难以处理复杂的域转换。一种有前景的技术是利用大规模预训练视觉语言模型的知识进行更有指导的适应。尽管做出了一些努力，但当前的方法通常会学习文本提示，分别嵌入源域和目标阅读全文

posted @ 2024-11-23 04:40 吴建明wujianming 阅读(81) 评论(0) 推荐(0)

2024年11月17日

IMPRINT：通过学习身份保持表示进行生成对象合成

摘要： IMPRINT：通过学习身份保持表示进行生成对象合成生成对象合成作为合成图像编辑的一种有前景的新途径出现了。然而，对象身份保存的要求带来了重大挑战，限制了大多数现有方法的实际使用。作为回应，介绍了IMPRINT，这是一种基于扩散的生成模型，采用两阶段学习框架进行训练，将身份保持学习与合成学习解耦。阅读全文

posted @ 2024-11-17 17:24 吴建明wujianming 阅读(28) 评论(0) 推荐(0)

CuVLER：通过穷尽式自监督Transformer增强无监督对象发现

摘要： CuVLER：通过穷尽式自监督Transformer增强无监督对象发现介绍了VoteCut，这是一种创新的无监督对象发现方法，它利用了来自多个自监督模型的特征表示。VoteCut采用基于归一化切割的图分割、聚类和像素投票方法。此外，还介绍了CuVLER（Cut-Vote-and-LEaRn），一种阅读全文

posted @ 2024-11-17 04:20 吴建明wujianming 阅读(62) 评论(0) 推荐(0)

2024年11月16日

RealCustom：缩小真实文本词的范围，实现实时开放域文本到图像的定制

摘要： RealCustom：缩小真实文本词的范围，实现实时开放域文本到图像的定制文本到图像定制旨在为给定的主题合成文本驱动的图像，最近彻底改变了内容创作。现有的作品遵循伪词范式，即将给定的主题表示为伪词，然后将其与给定的文本组合在一起。然而，伪词与给定文本固有的纠缠扩散范围导致了双重最优悖论，即给定主题阅读全文

posted @ 2024-11-16 04:40 吴建明wujianming 阅读(54) 评论(0) 推荐(0)

2024年11月15日

超越图像超分辨率的任务驱动感知损失图像识别

摘要：超越图像超分辨率的任务驱动感知损失图像识别在实际场景中，由于低分辨率（LR）内容中缺乏可用信息，图像识别任务（如语义分割和对象检测）通常会带来更大的挑战。图像超分辨率（SR）是解决这些挑战的有前景的解决方案之一。然而，由于SR的病态特性，典型的SR方法很难恢复与任务相关的高频内容，这可能会削弱使用阅读全文

posted @ 2024-11-15 04:28 吴建明wujianming 阅读(61) 评论(0) 推荐(0)

吴建明

微信视频号：sph0RgSyDYV47z6 快手号：4874645212 抖音号：dy0so323fq2w 小红书号：95619019828 B站1：UID:3546863642871878 B站2：UID: 3546955410049087

公告