wb.ouyang

毕竟几人真得鹿,不知终日梦为鱼

导航

记录使用screenCoder

1、获取doubao api key

要获取豆包 API Key,需要先注册火山方舟账号,然后开通豆包模型,最后在控制台创建密钥,具体步骤如下:
注册火山方舟账号:访问火山方舟官网,点击 “注册” 或 “登录”,使用手机号或邮箱完成注册。注册后,系统会自动赠送初始免费额度。
开通豆包模型:登录火山方舟控制台后,在左侧菜单栏找到 “开通管理” 并点击。选择需要开通的豆包模型,如 “Doubao - lite - 32k” 或 “Doubao - pro - 32k”,开通后,模型状态变为 “已启用”。
获取 API 密钥:在控制台的 “密钥管理” 或 “API 管理” 页面,点击 “创建密钥” 生成 API Key。这个密钥是调用 API 的核心凭证,密钥格式通常为长字符串,如 “sk - xxxxxxxxxxxxxxxxxxxxxx”。

 

2、本地部署screenCoder

开源地址:https://github.com/leigest519/ScreenCoder

1. 克隆项目
    git clone https://github.com/leigest519/ScreenCoder.git
    cd ScreenCoder

2. 创建虚拟环境
    python3 -m venv .venv
    source .venv/bin/activate # Windows 使用 .venv\Scripts\activate

3. 安装依赖
    pip install -r requirements.txt
4. 配置模型和 API密钥 选择生成模型 :在 block_parsor.py 和 html_generator.py 中选择需要的模型。选择项:豆包(默认)、Qwen、GPT、Gemini。 添加 API 密钥: 根据您所选的模型,在 root 目录下新建一个同名 txt 文档(doubao_api.txt, qwen_api.txt, gpt_api.txt, gemini_api.txt),然后复制粘贴您的 API Key 即可。 5. 运行应用程序,使用以下命令启动应用程序:python main.py 6. 使用也很简单,只需要把设计图截个屏上传上去,即可自动进行 UI 元素检测,并输出相应的 HTML 初稿代码。开发者可以根据自己的实际需求对自动生成的代码进一步自定义编辑修改。

 

3、修改模型

运行 main.py 后报错

Error code: 404 - {'error': {'code': 'ModelNotOpen', 'message': 'Your account %!s(int64=2112346598) has not activated the model doubao-1.5-thinking-vision-pro-250428. 
Please activate the model service in the Ark Console. Request id: 021761211092551eb5cd35b58dcbd0d14b1782773d336b1934f23
', 'param': '', 'type': 'Not Found'}}

doubao-1.5-thinking-vision-pro-250428 介绍:

doubao-1.5-thinking-vision-pro-250428 是视觉-语言多模态模型
该模型也被称为 Seed1.5-VL,由字节跳动 Seed 团队发布,具备更强的通用多模态理解和推理能力seed.bytedance.com。它由三个主要组件构成,分别是用于对图像和视频进行编码的视觉编码器 SeedViT、
将视觉特征投影到多模态表征空间的多层感知机(MLP)适配器,以及对多模态输入进行处理的 Seed1.5-LLMseed.bytedance.com。它支持文本、图片、视频输入,在视觉推理、图像问答、图表理解与问答、
视觉定位 / 计数、视频理解、GUI 智能体等任务中均表现突出。

全局搜索 doubao-1.5-thinking-vision-pro-250428,替换成当前对应最新的。【doubao-seed-1-6-vision-250815】多模态模型。

图片

 

posted on 2025-10-23 21:10  wenbin_ouyang  阅读(4)  评论(0)    收藏  举报