Google新发布了两个重要的AI生成模型产品更新:Veo 2视频生成模型和Imagen 3图像生成模型。
Veo 2是一款先进的视频生成模型,它最大的特色在于对真实世界物理规律和人类动作表情有着深入的理解。它能够理解电影摄影的专业语言,可以根据用户的要求生成特定镜头角度、景深效果等专业视频效果。比如用户可以要求低角度跟踪镜头,或者特写镜头等。Veo 2支持高达4K分辨率的视频输出,时长可达数分钟。相比其他模型,Veo 2的一个重要优势是较少出现"幻觉"问题(如多出的手指或意外物体),这让生成的视频更加真实可信。
Imagen 3则是图像生成模型的升级版本。这个版本生成的图像更加明亮,构图更好。它的一大特色是能够准确渲染多种艺术风格,从写实主义到印象派,从抽象到动漫都能精确表现。此外,Imagen 3对提示词的理解更准确,能够渲染更丰富的细节和纹理。在人工评分的对比测试中,Imagen 3在主流图像生成模型中取得了最好的成绩。
在实际应用场景方面,Veo 2主要通过VideoFX、YouTube和Vertex AI等平台提供服务,特别适合YouTube创作者制作短视频背景,企业用户优化创意工作流程等场景。而Imagen 3则通过ImageFX向全球100多个国家提供服务,适合需要高质量图像生成的各类场景。
video-fx 要申请 waitlist:[链接登录后可见]
image-fx 可以直接用了 [链接登录后可见]