使用gradio生成看图说话界面
这个应用看起来很像小学生写作文的场景,主要利用的还是多模态模型来实现的。
界面比较简单,根据上传图片对其进行描述。下面是一个简单的效果:

当然对于模型来说,它可能无法很好的区分性别。
其实现代码如下:
import gradio
def process(image, choice):
....
demo = gradio.Interface(
fn=process,
inputs=[
gradio.Image(label="图片"),
gradio.Radio(choices=["精简版","详细版"],value="详细版",label="选项")
],
outputs=gradio.Markdown(label="输出")
)
demo.launch()
对于详细版,其效果如下:

而对于简略版,就是一句话概述了:

可以看到其效果还可以。