兄弟们,我发现 Minimax 实际上是支持图像输入的
起因是在使用 Claude Code 时,Minimax 能够正确处理图像信息,但是官方关于 Anthropic API 兼容的文档中却说不支持 image 类型的 message:

通过 mitmproxy 看了下请求过程,其 messages 有如下片段:

这里虽然在 messages 中有 image 的信息,但是 minimax 大模型在下一步却用了 tool_use 读取本地文件,然后在 tool_result 类型的 message 中看到了与上述 image 类型的 message 中一样的 base64 编码:

并且在这之后,minimax 也确实给出了图像的描述信息。
回过头来看 minimax 的官方文档,它所说的完全支持 type="tool_result" 类型,应该是包含了对图像信息的处理。
Anthropic 的官方文档对 tool_result 类型的 message 描述如下,确实可以在里面放图像:

所以,minimax 的接口实际上是可以处理图像的,只是直接在 messages 中放 image 类型时接口不会去处理,放在 tool_result 中就能处理了。
那在用 minimax 的 API 搭建一些应用时,是不是也能够手动追加 message,将图片信息放进入,通过间接方式实现图片输入?

浙公网安备 33010602011771号