摘要: 并行文本世界中的LLM训练的多模态Agent 虽然大型语言模型(LLM)在模拟文本世界中表现出色,但在没有视觉或音频信号等其他模态感知的情况下,它们很难与更现实的世界互动。尽管视觉语言模型(VLM)集成了LLM模块(1)与静态图像特征对齐,以及(2)可能具有世界动态的先验知识(如在文本世界中所示), 阅读全文
posted @ 2024-05-30 04:36 吴建明wujianming 阅读(2) 评论(0) 推荐(0) 编辑
摘要: OpenVG向量图形加速标准 OpenVG™是一个无版权、跨平台的API,它为高级用户界面和向量图形库(如SVG)提供了一个低级硬件加速接口。OpenVG主要针对消费电子产品、手持设备、可穿戴设备和汽车设备,这些设备需要高质量向量图形的便携式加速,以获得引人注目的用户界面和文本,同时使硬件加速能够在 阅读全文
posted @ 2024-05-29 03:49 吴建明wujianming 阅读(3) 评论(0) 推荐(0) 编辑
摘要: OpenCL异构系统并行编程的开放标准部署灵活性 随着平台和设备的行业格局变得越来越复杂,工具正在发展,使OpenCL应用程序能够部署到没有可用的本地OpenCL驱动程序的平台上。例如,开源clspv编译器和clvk API转换器使OpenCL应用程序能够在Vulkan运行时上运行。这为OpenCL 阅读全文
posted @ 2024-05-28 03:55 吴建明wujianming 阅读(2) 评论(0) 推荐(0) 编辑
摘要: MindSpore设计概览杂谈 https://www.mindspore.cn/docs/zh-CN/r2.3.0rc2/index.html 概述 人工智能(AI)框架已经有近10年的发展历史,四条主线驱动着AI框架不停地演进和发展: 面向开发者:兼顾算法开发的效率和运行性能。 面向硬件:充分发 阅读全文
posted @ 2024-05-26 03:39 吴建明wujianming 阅读(7) 评论(0) 推荐(0) 编辑
摘要: 端到端自适应大规模分布式训练技术 随着 2020 年 GPT-3 1750 亿超大语言预训练模型的提出,语言、视觉、多模态等领域也随即发布多种超大规模预训练模型,不仅模型参数量越来越大,训练数据量和计算量也相应变大。针对大规模稠密参数模型高效训练问题,飞桨于 2021 年初在业内首发 4D 混合并行 阅读全文
posted @ 2024-05-25 03:52 吴建明wujianming 阅读(5) 评论(0) 推荐(0) 编辑
摘要: OpenCL技术方案示例 NaplesPU http://www.naplespu.com/ http://www.naplespu.com/doc/index.php?title=Main_Page 主页 NaplesPU是一个全面的开源多核加速器,涵盖了从计算核心到片上互连、一致性存储器层次结构 阅读全文
posted @ 2024-05-24 04:22 吴建明wujianming 阅读(9) 评论(0) 推荐(0) 编辑
摘要: OpenVX一些算法问题 双边滤波器 该函数将双边滤波应用于输入张量。 双边滤波器是一种非线性、边缘保持和降噪的平滑滤波器。输入和输出是具有相同维度和数据类型的张量。张量维度分为空间维度和非空间维度。空间维度是笛卡尔等距距离。他们是最后2名。非空间维度是第一个,我们称之为辐射测量。每个空间位置处的辐 阅读全文
posted @ 2024-05-23 03:44 吴建明wujianming 阅读(6) 评论(0) 推荐(0) 编辑
摘要: 哈里斯Harris角 计算图像的哈里斯角。 哈里斯角是用几个参数计算的 =输入图像 =拐角强度阈值 =欧几里得半径 =灵敏度阈值 =窗口大小 =块大小 求角点值或分数的计算可以概括为: :: where [eq]#V~c~# is the thresholded corner value. 用于梯度 阅读全文
posted @ 2024-05-22 04:22 吴建明wujianming 阅读(6) 评论(0) 推荐(0) 编辑
摘要: OpenVX便携式、高能效的视觉处理 OpenVX 1.3.1 来了! OpenVX 1.3.1 规范于 2022 年 2 月 2 日发布 OpenVX™ 是一种开放、免版税的标准,用于计算机视觉应用程序的跨平台加速。OpenVX 支持性能和功耗优化的计算机视觉处理,这在嵌入式和实时用例中尤为重要, 阅读全文
posted @ 2024-05-21 04:18 吴建明wujianming 阅读(6) 评论(0) 推荐(0) 编辑
摘要: OpenXR™Loader-设计和操作 介绍 本文档包含了解如何为OpenXR加载程序进行开发以及与之交互的必要信息。本文档的预期用途是作为详细的设计文档和学习一般OpenXR加载程序行为的工具。 如果本文档与OpenXR规范之间存在任何差异,则以该文档为准。 OpenXR™和OpenXR标志是Kh 阅读全文
posted @ 2024-05-20 03:58 吴建明wujianming 阅读(5) 评论(0) 推荐(0) 编辑