全智能深度演进，一键成片让视频创作颠覆式提效

全智能一键成片，让内容创作的「边际成本」逼近于零。

大模型和AIGC技术的发展，可以用“日新月异”来形容，其迭代速度史无前例，涌现出的各类垂直应用模型，也使得音视频行业的应用场景更加广泛和多样化。

然而，视频化浪潮汹涌、视频“消费”速度不断加快，视频内容消费的需求与供给的矛盾依然突出。

当云和AI走向深度融合，AI不再仅仅作为单点能力应用在某个环节，一切皆向着“全智能”演进。

阿里云「云端智能剪辑」正式推出一键成片能力，让视频生产力不断“提速”，内容生产成本不断降低，以“全智能”带来视频创作颠覆式提效。

一键成片的2种“思路”

全智能的「一键成片」能力，支持以下两种成片思路方案。

l 方案一：脚本化自动成片

适合于已有比较明确的成片逻辑结构和对应的素材准备，通过设定脚本结构及期望成片数量，自动化批量完成制作。

l 方案二：智能图文匹配成片

适合于已有素材准备，期望能根据口播文案（支持AI智能生成），自动截取并智能匹配素材中的关联资源片段，一键实现完美音画同步的效果。

如上图所示，以制作哈尔滨文旅视频为例，当视频结构已明确为“城市风貌”、“历史底蕴”、“吃喝玩乐”，并为每个节点关联对应的图片或视频素材时，方案一「脚本化自动成片」将按照结构顺序整体排布，各节点随机选择素材，根据搭配口播文稿进行时长自适应，一键批量生成指定数量的视频。

当已确定该视频的口播文案内容时，可使用方案二「智能图文匹配成片」提交期望匹配的对应素材资源，系统将针对每句口播文本在素材中智能截取片段，完成视频制作。

内容生产「全智能提效」

运用大模型技术对文案稿件（支持AI智能生成）进行智能化分析，依据分析结果自动匹配对应素材，并通过AI音色合成、片段优选、自动对齐、花字字幕及背景样式智能组合等操作，一键实现内容生产的全链路、全智能提效。

多维场景「高自由扩展」

基于深厚的剪辑制作服务能力积淀，在成片风格、样式、分辨率尺寸格式等维度，具备高自由度的个性化定制能力及扩展性，满足不同场景应用下的多样化需求。

门槛降低「一站式成片」

由AI智能生成完成极大部分繁琐工作，结果可导入可视化编辑界面（即将上线）由人工完成极小部分“精修”美化和把控，通过更高效的内容生产方式填补内容缺口，极大节省人力、进一步降低内容生产的成本与门槛。

场景1：影视解说

如果你时常刷刷“电子榨菜”，那么一定看过“注意看眼前的男人叫小帅，眼前的女人叫小美”之类的视频，这些3-5分钟解说完一部电影或电视剧的视频，其实有着较为格式化的制作模版，如果依靠人工进行文本内容提炼、剧集画面匹配、逐帧裁剪、时长控制等，无法高效、低成本满足大众对于内容消费的需求。

通过「一键成片」，将解说文本与对应剧集关联并提交，大模型会将解说场景自动定位剧情片段，在选择智能配音后，便能按照预期片长快速完成全局的镜头画面、口播音频的对齐生成。

场景2：赛事/综艺“拆条”

高价购买了赛事版权或是高成本拍摄综艺，如何发挥它们的“长尾效应”？一个出圈的“看点”短视频片段，会吸引观众启动对长视频内容的消费，带火一场已经结束的比赛或综艺节目。

在当内容“拆条”速度快30秒，单条视频可多收获2000万流量（据咪咕视讯相关报道）。通过「一键成片」，将创意文案与版权视频关联匹配素材，结合花字字幕、背景样式、成片风格需求，在更短的时间内产出更多高质量可用的视频。

场景3：新闻视频制作

在当前新闻视频化的趋势下，记者、编辑需要基于文字稿件进行新闻视频制作。其中，素材收集和排版工作占到工作时长的80%以上，而新闻类内容对内容准确度和素材质量要求较高，如果使用生成式大模型或简单的检索匹配，产生的内容从质量到准确度可控性差，难以实际落地应用。

通过「一键成片」能力，将新闻稿件关联至指定素材库，大模型将针对稿件自动分析、分段，并针对每段关键信息从资源库片段智能截取，进行素材优选、有序拼接、AI口播对齐、模板整合等全智能操作，并可人工预览及手动微调，从而在分钟级完成新闻类成片。

上述三个场景之外，「一键成片」还可广泛运用于其他N个场景。如：营销视频的批量化混剪，快速分发内容带来更多流量曝光；或是助力观点类、知识类、热点类等PGC高效完成视频化制作、保持内容输出频率，降低因视频剪辑带来的创作门槛和工作量。

AIGC时代下，聚焦智能媒体服务，阿里云视频云不断探索内容生产力变革的更多可能，在云端智能剪辑产品之上，以创新升级的「一键成片」能力，拓展更多应用场景的想象空间。

欢迎加入官方答疑「钉钉群」咨询交流：48335001108

posted @ 2024-03-22 10:15 阿里云CloudImagine 阅读(571) 评论(0) 收藏举报

刷新页面返回顶部