最近试了个AI视频工具,分享一下感受
背景
AI视频关注了很久了。Sora出来的时候就想试,HappyHorse、可灵也都注册了账号。但一直卡在"试过生成5秒片段"的阶段——后面的剧本设计、拼接、配音、BGM什么的,完全不会。
看到有人在GitHub上分享了一个叫 spark-video 的东西,说是"一句话就能出完整视频",将信将疑试了一下。
安装过程
需要:Node.js + 百炼账号 + ffmpeg
npm install -g bailian-cli
bl auth login
npx skills add modelstudioai/skills --skill spark-video -g
ffmpeg 我之前就有。百炼 API Key 在这里免费领的。
整个安装大概 3 分钟。
第一次用
在 Qwen Code 里输入:
用 spark-video 做一个30秒的短视频。
内容:雨天的咖啡馆,窗外模糊的行人,室内暖光和咖啡蒸汽。治愈氛围。16:9。
然后它就开始跑了:
- 先问我"剧本这样行吗?"——列了4个镜头的描述。我看了下还行,说OK
- 然后问"分镜确认吗?预估费用约10元"——我说OK
- 开始渲染。大概等了6-7分钟。中间有一个镜头它自己重拍了(说是质量不够)
- 最后问"成片满意吗?"——看了下,确实是一条完整的视频,有BGM有画面过渡
总共花了约12分钟。
感受
优点:
- 真的是"一句话就能用",不需要你懂什么模型参数
- 费用提前告知,不会盲花钱
- 质量审核是自动的(差的会自动重拍,不需要你判断)
- 出来的是完整视频,不是5秒片段
体验:
- 画面是动画/概念风格的,不是照片级真实感
- 有时候镜头之间的衔接还是能看出AI痕迹
- 但作为"第一条AI视频"来说——我跨过了这个坎
关于费用
这是之前最让我犹豫的点。实际用下来:
- 30秒视频大概 8-12 元
- 百炼新用户有免费额度,第一条基本不花钱
- 而且它不是启动就烧钱——有个确认节点,你看到价格再决定
比我之前自己用 API 试了十几次只出片段花的钱少多了(那些才是真正的"学费")。
我的理解
它本质上是把"有经验的AI视频创作者的工作流"自动化了:
- 怎么写提示词效果好?→ 它知道
- 怎么保证角色前后一致?→ 它管理
- 质量不行怎么办?→ 它自动重拍
- 怎么拼接才流畅?→ 它处理
你跳过的不是知识,而是试错过程。
总结
如果你和我之前一样:对AI视频感兴趣,但一直停在"收藏教程"阶段——可以试试这个。不保证出来的东西能直接商用,但至少能帮你做出第一条。
做出来之后,你就知道下一步想改什么了。
链接:
- GitHub:modelstudioai/skills
- 百炼 CLI:安装
- API Key:免费领
试了一个方案,AI 10分钟自动出产品视频,分享一下
最近在研究短视频营销方案,试了很多 AI 视频生成工具后,发现一个叫 spark-video 的东西挺有意思。它不只是生成几秒的视频片段,而是从剧本到成片全自动。记录一下过程。
背景
我的需求很简单:给新品做产品视频,发抖音/视频号。
之前的做法:
- 外包:3 万起,两周交付。ROI 很差。
- 自己拍:没设备没经验,出来效果很业余。
- Sora/可灵:生成 5 秒画面很惊艳,但还得自己写脚本、拼接、配音、加字幕。
后来在 GitHub 上发现了 spark-video。
它是什么
spark-video 是阿里云百炼(Model Studio)Skills 仓库里的一个 Skill。安装到你的 AI Agent 里后,一句话就能自动出片。
核心流程:
- 你输入一句话(比如"做一个耳机广告")
- AI 自动写剧本
- 自动分镜(设计每个镜头画面)
- 调用 HappyHorse 视频模型渲染
- 自动审核画面质量(低分重拍)
- ffmpeg 拼接 + 配音 + BGM
- 输出 mp4
中间有 4 个确认节点,你可以随时叫停或修改。
安装
npm install -g bailian-cli
bl auth login
npx skills add modelstudioai/skills --skill spark-video -g
需要 Node.js >= 18 + ffmpeg + 百炼 API Key(免费领)。
实测
试了做一个耳机广告:
用 spark-video 做一个高端无线耳机广告。
产品图:~/Documents/headphone.webp
文案:"AirWave Pro,自适应降噪,空间音频,28小时续航。"
16:9。背景音乐循环播放。
过程:
- AI 把文案拆成了 5 个镜头
- 第一个镜头产品特写,第二个使用场景,第三个技术参数,第四个品牌LOGO,第五个结尾
- 并行渲染(4 路同时跑),大约 8 分钟全部渲完
- 其中第 3 个镜头画面质量被打了 5.8 分,自动重渲了一次
- 最后拼接 + 混 BGM
总耗时 12 分钟,API 费用约 8 元。
几个细节
-
角色一致性:它有一个 cast.json 管理人物外貌描述,每次渲染都带上这个描述,所以前后画面中的人不会长得不一样。
-
费用预估:在分镜确认后、渲染前,会显示预估费用。你可以决定"太贵了改少几个镜头"或者"OK 开渲"。
-
重拍机制:每个片段渲染后用视觉模型打分,低于 7 分自动重拍(改 prompt),最多 3 次。3 次都不行会升级给你处理。
-
审计日志:所有 API 调用记在
logs/model_calls.jsonl,可以回溯每一分钱花在哪。
适合谁
- 需要产品视频的中小企业/创业者
- 需要批量出视频的自媒体
- 对 AI 视频生成感兴趣的开发者
不适合做 30 分钟以上的长视频(成本线性增长),也不适合替代真人实拍。
链接
- GitHub:modelstudioai/skills
- CLI 安装:https://bailian.console.aliyun.com/cli?source_channel=cli_github&
- API Key:免费领取
以上,希望对有类似需求的朋友有参考价值。

浙公网安备 33010602011771号