使用 OSS-Vectors-Embed-CLI 工具三步搭建多模态语义检索系统

向量数据作为 AI 应用的基础设施，正呈现爆炸式增长的趋势。OSS 向量 Bucket 于 2025 年 9 月发布，是阿里云对象存储 OSS 提供的一种专门用于存储、查询和管理向量数据的 Bucket 类型，具有低成本、大规模和简单易用的特点，面向多模态检索、知识库、RAG、AI Agent 等 AI 场景提供向量数据存储和查询的能力。目前，已经有众多客户基于向量 Bucket 来构建自身的语义检索系统。

近期，OSS 全新发布 OSS Vectors Embed CLI 命令行工具，用户可以便捷地调用阿里云百炼向量模型，将 OSS 中原始文件或存储在本地的海量文件进行向量化，并将向量化结果写入到 OSS 向量 Bucket。同时，该命令行工具也支持发起多模态语义检索，简化如 RAG 知识库、AI 助手、多模态语义检索等各类 AI 应用的开发流程，核心能力包括：

无缝集成：便捷调用阿里云百炼服务实现数据向量化。
多源输入：支持对本地文件、OSS 对象、第三方文件 URL 或文本字符串等多种数据格式进行向量化。
批量处理：支持将原始文件的向量化结果批量写入到向量 Bucket。
灵活自定义：支持灵活设置向量 Key 值、灵活自定义模型参数，并支持将向量数据携带的标量元数据一同写入到向量 Bucket。
多模态检索：支持根据文本、图片等检索条件进行相似度语义检索，满足多模态语义检索需求。

本文将在下面介绍如何使用 OSS Vectors Embed CLI 命令行工具，通过若干简单的命令快速构建多模态语义检索系统。同时，本文将介绍 OSS Vectors Embed CLI 命令行工具的灵活自定义能力，如批量写入、自定义向量键、自定义向量模型参数等。

第一步：环境准备

在环境配置步骤中，您需要配置访问凭证、安装 OSS-Vectors-Embed-CLI 工具、创建向量 Bucket。

配置访问凭证

在使用 CLI 工具前，需要准备以下访问凭证：

已开通 OSS 服务，并获取AccessKey ID 和 AccessKey Secret 。
已开通阿里云百炼服务，并获取 API Key。

将访问凭证配置为环境变量。CLI 在执行时会自动读取这些变量，无需在命令中重复提供。

安全提示：请勿在脚本中硬编码凭证，建议使用环境变量。

安装 OSS-Vectors-Embed-CLI 工具

支持 Python 3.9 或更高版本。

方式一：pip 安装（推荐）

方式二：开发模式安装

验证安装：

创建向量 Bucket

写入向量数据之前，需要创建向量 Bucket 并配置索引：

创建向量 Bucket：在向量 Bucket页面创建向量 Bucket，用于存储向量数据和索引。
创建向量索引：在已创建的向量 Bucket 中创建索引，配置与向量模型匹配的向量维度。

重要：向量索引的维度必须与所用向量模型输出维度一致。例如，使用 text-embedding-v4 模型（默认 1024 维）时，索引维度也应设为 1024。

第二步：向量写入

OSS 向量 Bucket 提供 PutVectors 接口，将向量数据写入到 OSS 向量 Bucket 中。OSS-Vectors-Embed-CLI 命令行工具将原始文件读取（GetObject）、调用阿里云百炼做向量化、向量数据写入（PutVectors）等多次 API 调用封装为一条命令，用户仅需调用一条命令便可以快速完成向量数据的生产和写入。阿里云百炼提供文本向量模型和多模态向量模型，支持对来自 OSS 和客户本地的文本、图片和视频文件进行向量化，您可以将任意文件的向量化结果写入到向量 Bucket 中。以下分别介绍通过 OSS-Vectors-Embed-CLI 命令行工具来写入“文本文件向量”、“图片文件向量”和“视频文件向量”的使用方式。

写入文本文件的向量

以阿里云百炼文本向量模型text-embedding-v4为例，您可以根据自己的需求选择其他合适的向量模型。输入源支持文本字符串、OSS 对象或本地文本文件。

直接输入文本来生成向量并将其写入到向量 Bucket-

请求示例：

返回示例：

对本地文本文件生成向量并将其写入向量 Bucket

对 OSS 文本文件生成向量并将其写入向量 Bucket

请求示例：

返回示例：

写入图片文件的向量

以阿里云百炼多模态向量模型qwen2.5-vl-embedding为例，您可以根据自己的需求选择其他合适的向量模型。输入源支持本地文件、OSS 对象或 HTTP/HTTPS URL。

对本地图片文件生成向量并将其写入向量 Bucket-

请求示例：

返回示例：

对 OSS 图片文件生成向量并将其写入向量 Bucket

请求示例：

返回示例：

对 URL 文件生成向量并将其写入向量 Bucket

请求示例：

返回示例：

写入视频文件的向量

以阿里云百炼多模态向量模型qwen2.5-vl-embedding为例，您可以根据自己的需求选择其他合适的向量模型。输入源支持 OSS 视频文件、 HTTP/HTTPS URL 文件。

对 OSS 视频文件生成向量并将其写入向量 Bucket

请求示例：

返回示例：

对 URL 文件生成向量并将其写入向量 Bucket

请求示例：

返回示例：

同时添加标量元数据

您可以参照以下方式，在上述向量写入的命令中添加自定义标量元数据。添加后，可以用于向量和标量混合检索。

请求示例：

返回示例：

第三步：向量检索

OSS 向量 Bucket 提供 QueryVectors 接口，可以发起向量的相似度检索。使用向量的相似度检索之前，需要先将 Query 内容（文本或图片）进行向量化，然后在向量索引中查找语义最相似的向量。OSS-Vectors-Embed_CLI 提供简单的命令语句，快速完成 Query 内容的向量化和相似度检索。

重要：查询时使用的向量模型必须与索引数据所用的模型保持一致。