使用gradio生成看图说话界面

这个应用看起来很像小学生写作文的场景,主要利用的还是多模态模型来实现的。
界面比较简单,根据上传图片对其进行描述。下面是一个简单的效果:

image

当然对于模型来说,它可能无法很好的区分性别。
其实现代码如下:

import gradio

def process(image, choice):
    ....

demo = gradio.Interface(
	fn=process,
	inputs=[
	 gradio.Image(label="图片"),
	 gradio.Radio(choices=["精简版","详细版"],value="详细版",label="选项")
	],
	outputs=gradio.Markdown(label="输出")
)
demo.launch()

对于详细版,其效果如下:

image

而对于简略版,就是一句话概述了:
image

可以看到其效果还可以。

posted @ 2025-04-06 15:39  月薪几千的牛马  阅读(39)  评论(0)    收藏  举报