Sora展现的细节丰富性和逻辑连贯性是迄今AI领域未曾见过的。视频中不仅有复杂的摄影技巧、多个角色、鲜明的情感表现,还有精确的物理效果。Sora的开发基于OpenAI在图像生成领域(如DALL-E)以及文本生成(比如GPT-3和GPT-4)的先前工作。
即便视频主题暂时移出画面,Soa生成的视频也能保持内容上的一致性。AI学会了现实世界的物理规律,因此视顷中的对象行为真实可信。此外,Sora还采用了变换器模型(transformer architecture),使其在生成模型的可扩展性方面超越以往。
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
评论0+