上一页 1 ··· 89 90 91 92 93 94 95 96 97 ··· 367 下一页
摘要: 三重时空变化模式的视频协调 5.4.1 三重时空变化模式的视频协调概述 视频协调是一项重要而具有挑战性的任务,旨在通过自动调整前景的外观以与背景协调,从而获得视觉上逼真的合成视频。受手动协调的短期和长期逐步调整过程的启发,提出了一个视频三重变换器框架,用于模拟视频中的三种时空变化模式,即短期空间以及 阅读全文
posted @ 2024-12-21 03:36 吴建明wujianming 阅读(42) 评论(0) 推荐(0)
摘要: 6本书推荐《MLIR编译器原理与实践》、《ONNX人工智能技术与开发实践》、《AI芯片开发核心技术详解》、《智能汽车传感器:原理·设计·应用》、《TVM编译器原理与实践》、《LLVM编译器原理与实践》 由清华大学出版社资深编辑赵佳霓老师策划编辑的新书《MLIR编译器原理与实践》已经出版,京东、淘宝天 阅读全文
posted @ 2024-12-21 03:21 吴建明wujianming 阅读(91) 评论(0) 推荐(0)
摘要: 任意尺度图像超分辨率的基准技术分析 在计算机视觉领域,超分辨率(SR)一直是一个突出的研究领域。它的目的是从低分辨率(LR)图像重建高分辨率(HR)图像。最近,主要基于学习图像的连续表示的任意尺度图像SR取得了重大进展。 这些方法通常需要在特定范围内(即×1.0-×4.0)使用连续的细粒度尺度变化L 阅读全文
posted @ 2024-12-20 03:24 吴建明wujianming 阅读(140) 评论(0) 推荐(0)
摘要: 用于端到端场景图生成的密集关系变换器 场景图生成旨在捕捉图像中对象之间的详细空间和语义关系,由于标签不完整、长尾关系类别和关系语义重叠,这具有挑战性。现有的基于Transformer的方法要么对对象和谓词采用不同的查询,要么对关系三元组采用整体查询,因此学习低频关系的能力往往有限。提出了一种新的基于 阅读全文
posted @ 2024-12-20 03:17 吴建明wujianming 阅读(67) 评论(0) 推荐(0)
摘要: 6本书推荐《MLIR编译器原理与实践》、《ONNX人工智能技术与开发实践》、《AI芯片开发核心技术详解》、《智能汽车传感器:原理·设计·应用》、《TVM编译器原理与实践》、《LLVM编译器原理与实践》 由清华大学出版社资深编辑赵佳霓老师策划编辑的新书《MLIR编译器原理与实践》已经出版,京东、淘宝天 阅读全文
posted @ 2024-12-20 03:12 吴建明wujianming 阅读(45) 评论(0) 推荐(0)
摘要: AWQ:激活-软件权重量化 大型语言模型(LLM)已经改变了许多人工智能应用程序。设备上的LLM变得越来越重要:在边缘设备上本地运行LLM,可以降低云计算成本并保护用户隐私。然而,天文模型的大小和有限的硬件资源带来了巨大的部署挑战。提出了激活感知权重量化(AWQ),这是一种硬件友好的LLM低比特权重 阅读全文
posted @ 2024-12-19 03:49 吴建明wujianming 阅读(159) 评论(0) 推荐(0)
摘要: 用于显微镜的掩模自编码器是细胞生物学的可扩展学习 将显微镜图像特征化用于生物研究仍然是一个重大挑战,特别是对于跨越数百万张图像的大规模实验。这项工作探讨了弱监督分类器和自监督掩码自编码器(MAE),在使用越来越大的模型骨干和显微镜数据集进行训练时的缩放特性。结果表明,基于ViT的MAE在各种任务上的 阅读全文
posted @ 2024-12-19 03:40 吴建明wujianming 阅读(42) 评论(0) 推荐(0)
摘要: 6本书推荐《MLIR编译器原理与实践》、《ONNX人工智能技术与开发实践》、《AI芯片开发核心技术详解》、《智能汽车传感器:原理·设计·应用》、《TVM编译器原理与实践》、《LLVM编译器原理与实践》 由清华大学出版社资深编辑赵佳霓老师策划编辑的新书《MLIR编译器原理与实践》已经出版,京东、淘宝天 阅读全文
posted @ 2024-12-19 03:34 吴建明wujianming 阅读(31) 评论(0) 推荐(0)
摘要: TiNO-Edit:基于扩散的稳健图像编辑的时间步长和噪声优化 尽管有许多尝试利用预训练的文本到图像模型(T2I)(如稳定扩散(SD)),进行可控图像编辑,但产生良好的可预测结果仍然是一个挑战。以前的方法要么侧重于在特定数据集上,对预训练的T2I模型进行精细调优,以生成特定类型的图像(例如,使用特定 阅读全文
posted @ 2024-12-18 04:18 吴建明wujianming 阅读(25) 评论(0) 推荐(0)
摘要: 并非所有体素都是相等的:具有自蒸馏的硬度感知语义场景完成 语义场景完成,也称为语义占用预测,可以为自动驾驶汽车提供密集的几何和语义信息,这引起了学术界和工业界越来越多的关注。不幸的是,现有的方法通常将此任务表述为体素分类问题,并在训练过程中在3D空间中平等对待每个体素。由于硬体素没有得到足够的重视, 阅读全文
posted @ 2024-12-18 04:16 吴建明wujianming 阅读(39) 评论(0) 推荐(0)
上一页 1 ··· 89 90 91 92 93 94 95 96 97 ··· 367 下一页