最近试了个AI视频工具，分享一下感受

背景

AI视频关注了很久了。Sora出来的时候就想试，HappyHorse、可灵也都注册了账号。但一直卡在"试过生成5秒片段"的阶段——后面的剧本设计、拼接、配音、BGM什么的，完全不会。

看到有人在GitHub上分享了一个叫 spark-video 的东西，说是"一句话就能出完整视频"，将信将疑试了一下。

安装过程

需要：Node.js + 百炼账号 + ffmpeg

npm install -g bailian-cli
bl auth login
npx skills add modelstudioai/skills --skill spark-video -g

ffmpeg 我之前就有。百炼 API Key 在这里免费领的。

整个安装大概 3 分钟。

第一次用

在 Qwen Code 里输入：

用 spark-video 做一个30秒的短视频。
内容：雨天的咖啡馆，窗外模糊的行人，室内暖光和咖啡蒸汽。治愈氛围。16:9。

然后它就开始跑了：

先问我"剧本这样行吗？"——列了4个镜头的描述。我看了下还行，说OK
然后问"分镜确认吗？预估费用约10元"——我说OK
开始渲染。大概等了6-7分钟。中间有一个镜头它自己重拍了（说是质量不够）
最后问"成片满意吗？"——看了下，确实是一条完整的视频，有BGM有画面过渡

总共花了约12分钟。

感受

优点：

真的是"一句话就能用"，不需要你懂什么模型参数
费用提前告知，不会盲花钱
质量审核是自动的（差的会自动重拍，不需要你判断）
出来的是完整视频，不是5秒片段

体验：

画面是动画/概念风格的，不是照片级真实感
有时候镜头之间的衔接还是能看出AI痕迹
但作为"第一条AI视频"来说——我跨过了这个坎

关于费用

这是之前最让我犹豫的点。实际用下来：

30秒视频大概 8-12 元
百炼新用户有免费额度，第一条基本不花钱
而且它不是启动就烧钱——有个确认节点，你看到价格再决定

比我之前自己用 API 试了十几次只出片段花的钱少多了（那些才是真正的"学费"）。

我的理解

它本质上是把"有经验的AI视频创作者的工作流"自动化了：

怎么写提示词效果好？→ 它知道
怎么保证角色前后一致？→ 它管理
质量不行怎么办？→ 它自动重拍
怎么拼接才流畅？→ 它处理

你跳过的不是知识，而是试错过程。

总结

如果你和我之前一样：对AI视频感兴趣，但一直停在"收藏教程"阶段——可以试试这个。不保证出来的东西能直接商用，但至少能帮你做出第一条。

做出来之后，你就知道下一步想改什么了。

链接：

GitHub：modelstudioai/skills
百炼 CLI：安装
API Key：免费领

试了一个方案，AI 10分钟自动出产品视频，分享一下

最近在研究短视频营销方案，试了很多 AI 视频生成工具后，发现一个叫 spark-video 的东西挺有意思。它不只是生成几秒的视频片段，而是从剧本到成片全自动。记录一下过程。

背景

我的需求很简单：给新品做产品视频，发抖音/视频号。

之前的做法：

外包：3 万起，两周交付。ROI 很差。
自己拍：没设备没经验，出来效果很业余。
Sora/可灵：生成 5 秒画面很惊艳，但还得自己写脚本、拼接、配音、加字幕。

后来在 GitHub 上发现了 spark-video。

它是什么

spark-video 是阿里云百炼（Model Studio）Skills 仓库里的一个 Skill。安装到你的 AI Agent 里后，一句话就能自动出片。

核心流程：

你输入一句话（比如"做一个耳机广告"）
AI 自动写剧本
自动分镜（设计每个镜头画面）
调用 HappyHorse 视频模型渲染
自动审核画面质量（低分重拍）
ffmpeg 拼接 + 配音 + BGM
输出 mp4

中间有 4 个确认节点，你可以随时叫停或修改。

安装

npm install -g bailian-cli
bl auth login
npx skills add modelstudioai/skills --skill spark-video -g

需要 Node.js >= 18 + ffmpeg + 百炼 API Key（免费领）。

实测

试了做一个耳机广告：

用 spark-video 做一个高端无线耳机广告。
产品图：~/Documents/headphone.webp
文案："AirWave Pro，自适应降噪，空间音频，28小时续航。"
16:9。背景音乐循环播放。

过程：

AI 把文案拆成了 5 个镜头
第一个镜头产品特写，第二个使用场景，第三个技术参数，第四个品牌LOGO，第五个结尾
并行渲染（4 路同时跑），大约 8 分钟全部渲完
其中第 3 个镜头画面质量被打了 5.8 分，自动重渲了一次
最后拼接 + 混 BGM

总耗时 12 分钟，API 费用约 8 元。

几个细节

角色一致性：它有一个 cast.json 管理人物外貌描述，每次渲染都带上这个描述，所以前后画面中的人不会长得不一样。
费用预估：在分镜确认后、渲染前，会显示预估费用。你可以决定"太贵了改少几个镜头"或者"OK 开渲"。
重拍机制：每个片段渲染后用视觉模型打分，低于 7 分自动重拍（改 prompt），最多 3 次。3 次都不行会升级给你处理。
审计日志：所有 API 调用记在 logs/model_calls.jsonl，可以回溯每一分钱花在哪。

适合谁

需要产品视频的中小企业/创业者
需要批量出视频的自媒体
对 AI 视频生成感兴趣的开发者

不适合做 30 分钟以上的长视频（成本线性增长），也不适合替代真人实拍。

链接

GitHub：modelstudioai/skills
CLI 安装：https://bailian.console.aliyun.com/cli?source_channel=cli_github&
API Key：免费领取

以上，希望对有类似需求的朋友有参考价值。

posted @ 2026-07-01 18:26 诚小纯阅读(0) 评论(0) 收藏举报

刷新页面返回顶部

诚小纯