wx_gd_01

多模态模型配置

MODEL_ENDPOINTS = {
"vl-7b": {
"url": "http://localhost:8000/v1/chat/completions",
"description": "轻量级多模态模型,响应速度快",
"max_tokens": 1000,
"temperature": 0.7
},
"vl-32B": {
"url": "http://localhost:8001/v1/chat/completions",
"description": "高性能多模态模型,理解能力更强",
"max_tokens": 1500,
"temperature": 0.7
}
}

图片编辑模型配置

IMAGE_EDIT_MODELS = {
"qwen-image-edit": {
"url": "http://localhost:8628",
"description": "Qwen-Image-Edit-Plus 图片编辑模型(支持1-3张图片输入)",
"type": "qwen_api"
}
}

文生图模型配置(参考 text_to_image_client.py)

TEXT_TO_IMAGE_MODELS = {
"qwen-image": {
"url": "http://localhost:8091",
"description": "文生图模型,根据提示词生成图片",
"type": "t2i"
}
}

文本对话模型配置

TEXT_CHAT_MODELS = {
"qwen3-30b-a3b": {
"base_url": "https://api-inference.modelscope.cn/v1",
"api_key": "ms-f6473da3-f8ad-4b4a-ae43-133756a9ddda", # ModelScope Token
"model_id": "Qwen/Qwen3-30B-A3B", # ModelScope Model-Id
"description": "Qwen3-30B-A3B 文本对话模型,支持高质量文本生成和对话",
"max_tokens": 2000,
"temperature": 0.7,
"type": "openai_client" # 使用 OpenAI 客户端
}
}

用户认证配置

AUTH_CONFIG = {
"enabled": False, # 是否启用登录验证
"users": {
"admin": "password123",
"user1": "userpass456",
"user2": "anotherpass789"
},
"session_timeout": 3600 # 会话超时时间(秒)
}

应用配置

APP_CONFIG = {
"server_name": "127.0.0.1",
"server_port": 7860,
"share": False,
"debug": True,
"max_image_size": 10 * 1024 * 1024, # 10MB
"supported_formats": [".jpg", ".jpeg", ".png", ".bmp", ".gif", ".webp"]
}

知识库 RAG 服务配置

RAG_CONFIG = {
"enabled": True,
"service_url": "http://localhost:8000",
"users": ["张三", "李四", "王五", "Admin", "电销"] # 必须与 RAG 服务端 config.yaml 中的 users 保持一致
}

文生图内置约束提示词配置

该提示词会自动拼接在用户输入之前发送给模型,用于约束生成质量,无需用户手动填写

T2I_BUILT_IN_PROMPT_PREFIX = "请生成一张精美、高质量的图片,画面清晰、色彩和谐、构图平衡、光影自然,整体呈现专业的视觉美感。如果图片中需要出现文字或文案,必须严格遵守以下所有规则:第一,图片中出现的所有中文文字必须书写完全正确,每个汉字的笔画必须完整、准确,绝对不允许出现错别字、错字、笔画缺失、笔画多余、字形扭曲变形等任何文字错误,文案内容必须与用户要求完全一致,一字不差;第二,文字和文案只能放置在画面中色调单纯、背景干净的空白区域或边缘留白处,严禁将文字覆盖在图片的主体对象、人物面部、核心产品或视觉焦点之上,主体内容必须保持完整清晰可见;第三,文字颜色必须与其所在位置的背景颜色形成强烈的视觉对比,浅色背景上使用深色文字,深色背景上使用浅色或白色文字,文字颜色绝对不能与背景颜色相同或相近,不得出现文字融入背景、看不清楚的情况;第四,需要放置文字时,应主动在画面构图阶段为文字预留背景色调简洁、对比度充足的区域,通过合理的构图和留白来保障文字清晰可读,而非在复杂背景上强行添加遮挡物,以维护画面整体美感;第五,如果画面中有多处文字,各文字元素之间需保持适当间距,不得互相重叠或遮挡;第六,所有文字必须完整地显示在图片范围之内,不得出现文字被截断或超出边框的情况;第七,字体必须清晰、工整、易于辨认,字号大小与画面比例协调,避免使用笔画过于复杂或难以辨认的字体;第八,文字的颜色、字体风格和排版方式应与整体画面的色调和风格和谐统一,文字作为画面的一部分而非附加元素,共同构成完整的视觉设计;第九,整体画面的视觉层次清晰,主体突出、背景衬托,避免画面元素过于杂乱、拥挤或喧宾夺主;第十,图片色彩搭配协调美观,避免出现大面积高饱和度的刺眼色块,整体色调统一,符合用户描述的场景氛围。以下是用户的具体需求:"

T2I_NEGATIVE_PROMPT = "错别字、错字、笔画缺失、笔画错误、字形错误、文字变形、汉字不完整、文字模糊、文字不清晰、低对比度文字、文字与背景颜色相同、文字融入背景、看不见的文字、文字覆盖主体、文字遮挡人脸、文字压在产品上、文字遮挡视觉焦点、文字互相重叠、文字间距过小、文字被截断、文字超出边框、文字排版混乱、画面杂乱、主体不突出、色彩刺眼、色调不统一、画面模糊、低分辨率、噪点、水印、过度曝光、曝光不足、画质低劣"

posted @ 2026-03-26 16:13  yulecc  阅读(1)  评论(0)    收藏  举报