新一代AI媒体生成模型与工具重塑创意表达
介绍Veo 3、Imagen 4以及名为Flow的新型电影制作工具
今日宣布了最新的生成式媒体模型,这些模型标志着重大突破。它们能创造令人惊叹的图像、视频和音乐,赋能艺术家实现其创作愿景,并为每个人提供表达自我的出色工具。
Veo 3:视频遇见音频
Veo 3是最先进的视频生成模型,不仅提升了Veo 2的质量,并且首次能够生成带音频的视频——城市街景中的交通噪音、公园里的鸟鸣,甚至角色间的对话。
从文本和图像提示到真实世界物理效果和准确的唇形同步,Veo 3全面表现出色。其理解能力强大,可以通过简短的文字描述,生成将故事生动呈现的视频片段。Veo 3今日起在美国向Ultra订阅用户在Gemini应用及Flow中提供,同时也在Vertex AI上为企业用户提供。
Veo 2更新:与电影制作人共建的新功能
在推进Veo 3的同时,根据与创作者和电影制作人的合作,也为广受欢迎的Veo 2模型新增了多项功能。今日推出的新功能包括:
- 参考驱动视频功能:允许向Veo提供角色、场景、物体甚至风格的图像,以实现更好的创意控制和一致性。
- 摄像机控制:帮助定义精确的摄像机运动,包括旋转、推拉和变焦,以达成完美镜头。
- 扩展画幅:允许拓宽画面,将视频从竖屏转为横屏,并更智能地扩展场景以适应任何屏幕尺寸。
- 物体添加与移除:允许在视频中添加或擦除物体。Veo理解比例、交互和阴影,并利用这种理解来创建自然、逼真的场景。
参考驱动视频和摄像机控制功能现已在Flow中提供。预计在未来几周内将这些新功能引入Vertex AI API,并在未来几个月内扩展到更多产品。
Flow:为Veo设计的AI电影制作工具
Flow是一款AI电影制作工具,让创作者能够无缝地通过自然语言描述镜头,在一个便捷的地方管理故事要素——演员阵容、地点、物体和风格,并将叙事编织成精美的场景。Flow集成了某中心旗下研究机构的最先进模型:Veo、Imagen和Gemini。
Flow今日起面向美国市场的AI Pro和Ultra计划订阅用户提供,更多国家/地区即将推出。
Imagen 4:卓越画质与出色的排版能力
最新的Imagen模型结合了速度与精度,能够创造令人惊艳的图像。Imagen 4在精细细节(如复杂织物、水滴和动物毛发)上具有显著的清晰度,并在照片级真实感和抽象风格方面均表现出色。它能以多种宽高比和高达2K的分辨率创建图像,非常适合打印或演示。其在拼写和排版方面也有显著提升,使得创建贺卡、海报甚至漫画变得更加容易。
Imagen 4今日起在Gemini应用、Whisk、Vertex AI以及Workspace套件中的Slides、Vids、Docs等应用内提供。
很快还将推出Imagen 4的快速变体,其速度比Imagen 3快高达10倍,以便更快地探索创意。
Lyria 2:强大的作曲与无限的探索空间
今年四月,扩大了由Lyria 2驱动的Music AI Sandbox的访问权限。Music AI Sandbox为音乐家、制作人和词曲作者提供了一套实验性工具,可以激发新的创作可能性,并帮助艺术家探索独特的音乐创意。
音乐行业的专业知识和宝贵反馈有助于确保这些工具赋能创作者,同时邀请创意人士在其艺术中实现AI的可能性。
Lyria 2带来了强大的作曲和无限的探索能力,现通过YouTube Shorts为创作者提供,并通过Vertex AI为企业用户提供。同时还通过API和在AI Studio中提供了Lyria RealTime——驱动MusicFX DJ的交互式音乐生成模型。Lyria RealTime允许任何人实时交互式地创建、控制和表演生成音乐。
负责任的创作及与创意社区的合作
自2023年推出以来,SynthID已为超过100亿张图像、视频、音频文件和文本添加了水印,有助于将其识别为AI生成,并减少错误信息和误认的可能性。由Veo 3、Imagen 4和Lyria 2生成的输出将继续带有SynthID水印。
今日,推出了SynthID Detector,这是一个验证门户,可帮助人们识别AI生成的内容。上传一个内容文件,SynthID Detector将识别整个文件或其中一部分是否包含SynthID。
通过所有的生成式AI模型,目标是释放人类的创造力,使艺术家和创作者能够比以往更快、更轻松地将他们的想法变为现实。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)
公众号二维码

公众号二维码


浙公网安备 33010602011771号