千呼万唤始出来:OpenAI正式上线Sora,Sora是什么?怎么使用?

【重要】推荐使用 Wildcard虚拟信用卡订阅GPT、Sora等服务,价格更便宜、卡片有效期更长、支持的服务更多,具体教程请查看:Wildcard教程


其他精选文章

类别 教程
Claude 如何解决Claude账号被封,及Claude3使用方法【重要】如何注册Claude3?
Sora 【保姆级】体验Sora模型的官方途径 【精华】4000字搞懂sora!
ChatGPT 【包教包会】国内ChatGPT账号注册教程【绝对管用】教你一键注册官方GPT账号!
Midjourney 【推荐】midjourney注册方式
Poe 【保姆级】Poe订阅问题看这一篇就够了
Suno 【推荐】Suno用法和订阅一文详解!
其他 【一看就会】Overleaf升级保姆级教程【保姆级】如何订阅Youtube Premium?更多精彩

Sora 是什么?

2024年2月16日,OpenAI 在其官网上面正式宣布推出文本生成视频的大模型Sora

在我们等了298天的Sora,终于, OpenAI直播发布第3天,Sora2024年12月9日正式上线了。而且不仅仅是一个模型,而是一个非常完善且体验极佳的真正的产品。

12月9日,在OpenAI第3场直播发布中,文生视频模型Sora正式发布!在今天的demo中,OpenAI团队确认了目前的Sora支持文字、图像和视频三种内容作为生成视频的输入材料,用户可主动调节横竖屏(尺寸)、清晰度、视频时长等多个参数。

image-20241218210429205

会员特权与体验模式

地址:Sora地址 ,从今天起,ChatGPT Plus和Pro会员即可开始体验Sora模型!

Sora 的发布也直接绑定了 ChatGPT 的会员体系,Plus 和 Pro 会员今天起就可以抢先体验!但不同会员级别享受的权限大不相同:

  • ChatGPT Plus(20美元/月)
    • 每月最多生成 50个视频
    • 支持最高 720P 分辨率,视频时长最高 5秒
    • 视频带有 水印
  • ChatGPT Pro(200美元/月)
    • 每月最多生成 500个视频
    • 支持最高 1080P 分辨率,视频时长最高 20秒
    • 支持 5个并行生成任务
    • 视频 无水印,且可无限慢速生成

如果是追求极致体验和更高需求的用户,Pro 会员显然更值得入手。

image-20241218210540456

PS:国内想升级ChatGPT Plus和Pro会员微信和支付宝都不能直接使用,信用卡借记卡都不行,只能使用国外的虚拟卡,推荐本人一直使用的WildCard平台,很靠谱和专业: WildCard地址 | 一分钟开卡,轻松订阅海外软件服务 邀请码 JJDPH,有开卡优惠,虚拟卡开好之后,用支付宝充值使用。

Sora主要技术难点

Sora背后接入的是一个新模型,Sora Turbo,推理成本肯定少了非常非常多,这也解释了为啥OpenAI把Sora拖了这么久,就是因为二月份的那个模型,推理起来太烧钱了,跑不动。

这样说吧给你一段话, 让你写一篇800字的论文,你的理解很可能都有偏差,那么作为OpenAi要做文生视频到底有多难,下面看看主要技术难点。

image-20241218210645390

Sora之前案例视频

Sora的应用范围非常广泛,从教育教学、产品演示到内容营销等,都可以通过Sora来实现高质量的视频内容创作。

下面是 OpenAI 官方发布的应用案例:

官方给出的:Sora 能够生成具有多个角色、特定类型的运动以及主体和背景的准确细节的复杂场景。该模型不仅了解用户在提示中提出的要求,还了解这些东西在物理世界中的存在方式。

https://cdn.openai.com/sora/videos/train-window.mp4

提示词:穿过东京郊区的火车车窗上的倒影。 这个视频最关键的一点就是在经过桥的时候,玻璃反光透出来了对面的女孩头像,这个实在是太逼真,对细节的把控真的是杠杠的。

https://cdn.openai.com/sora/videos/cat-on-bed.mp4

提示词:一只猫叫醒熟睡的主人,要求吃早餐。主人试图忽视这只猫,但猫尝试了新的策略,最后主人从枕头下拿出秘密藏匿的零食,让猫再呆一会儿。 Sora 在视频上的运动已经非常接近真实的运动了,这就是为什么官方说,Sora 可以理解物理世界中的存在方式了。 Sora 可以在单个生成的视频中创建多个镜头

我们来看这个东京街头的视频:

https://cdn.openai.com/sora/videos/tokyo-in-the-snow.mp4

提示词:美丽、白雪皑皑的东京城熙熙攘攘。镜头穿过熙熙攘攘的城市街道,跟随几个人享受美丽的雪天并在附近的摊位购物。绚丽的樱花花瓣随着雪花随风飘扬。 Sora 的运动幅度和逼真程度都远远远超其他 AI 视频工具的运镜功能,清晰度也大大提升了。这个东京街头的视频中,创建了多个镜头,逼真的让人无法分辨。 Sora 可以准确地保留角色一致性和视觉风格。

https://cdn.openai.com/sora/videos/snow-dogs.mp4

提示词:一窝金毛幼犬在雪地里玩耍。他们的头从雪中探出来,被雪覆盖着。

https://cdn.openai.com/sora/videos/robot-video-game.mp4

提示词:赛博朋克背景下机器人的生活故事。 AI 视频想保持一致性风格,一般都是先用 AI 绘画的种子属性画出一致性的图,然后再用图生视频,再用剪辑工具,今天之前,文生视频的画面一致性并不太理想。但是 Sora 的效果着实令人惊艳。 无论是上图的一窝小金毛,还是下面这个赛博朋克机器人,都保持了一致性和视觉风格,看上去很自然。

Sora模型发布的时候可优化空间

当前的模型存在弱点。它可能难以准确模拟复杂场景的物理原理,并且可能无法理解因果关系的具体实例。例如,一个人可能咬了一口饼干,但之后饼干可能没有咬痕。该模型还可能会混淆提示的空间细节,例如混淆左右,并且可能难以精确描述随着时间推移发生的事件,例如遵循特定的相机轨迹。

https://cdn.openai.com/sora/videos/backward-jogger.mp4

提示词:打印一个人跑步的场景,35 毫米电影胶片。 弱点:Sora 有时会产生身体上难以置信的动作。 这个视频中,Sora 把人和跑步机的方向就搞反了。

再来看看下面这个视频

https://cdn.openai.com/sora/videos/puppy-cloning.mp4

提示词:五只灰狼幼崽在一条偏僻的碎石路上互相嬉戏、追逐,周围都是草。幼崽们又跑又跳,互相追逐、互相咬咬,玩耍着。提示:五只灰狼幼崽在一条偏僻的碎石路上互相嬉戏、追逐,周围都是草。幼崽们又跑又跳,互相追逐、互相咬咬,玩耍着。 弱点:动物或人可能会自发出现,尤其是在包含许多实体的场景中。 这个视频是不是像无限影分身?

https://cdn.openai.com/sora/videos/basketball-explosion.mp4

提示词:篮球穿过篮筐然后爆炸。提示:篮球穿过篮筐然后爆炸。 弱点:不准确的物理建模和不自然的物体“变形”的例子。

https://cdn.openai.com/sora/videos/chair-archaeology.mp4

提示词:考古学家在沙漠中发现了一把普通的塑料椅子,他们小心翼翼地挖掘并除尘。提示:考古学家在沙漠中发现了一把普通的塑料椅子,他们小心翼翼地挖掘并除尘。 弱点:在这个例子中,Sora 未能将椅子建模为刚性物体,导致物理交互不准确。

https://cdn.openai.com/sora/videos/grandma-birthday.mp4

提示词:一位白发梳得整整齐齐的老奶奶站在木质餐桌上的彩色生日蛋糕后面,蛋糕上插着无数蜡烛,脸上的表情是纯粹的喜悦和幸福,眼中闪烁着幸福的光芒。她倾身向前,轻轻地吹灭蜡烛,蛋糕上有粉红色的糖霜和糖珠,蜡烛不再闪烁,祖母穿着一件饰有花卉图案的浅蓝色衬衫,几个幸福的朋友和家人坐在桌边。看到庆祝,失去焦点。该场景拍摄精美,具有电影般的效果,展示了祖母和餐厅的 3/4 视图。温暖的色调和柔和的灯光增强了情绪。提示:一位白发梳得整整齐齐的老奶奶站在木质餐桌上的彩色生日蛋糕后面,蛋糕上插着无数蜡烛,脸上的表情是纯粹的喜悦和幸福,眼中闪烁着幸福的光芒。她倾身向前,轻轻地吹灭蜡烛,蛋糕上有粉红色的糖霜和糖珠,蜡烛不再闪烁,祖母穿着一件饰有花卉图案的浅蓝色衬衫,几个幸福的朋友和家人坐在桌边。看到庆祝,失去焦点。该场景拍摄精美,具有电影般的效果,展示了祖母和餐厅的 3/4 视图。温暖的色调和柔和的灯光增强了情绪。 弱点:模拟对象和多个角色之间的复杂交互通常对模型来说具有挑战性,有时会导致幽默的生成。

但是这些在最新的sora发布的产品中都完美的解决了,超丰富的视频修改与编辑,完美一致性的故事性,画面质量也相当好。

Sora 怎么使用

今日起,ChatGPT Plus和Pro会员即可开始体验Sora模型!

国内想升级ChatGPT Plus和Pro会员微信和支付宝都不能直接使用,信用卡借记卡都不行,智能使用国外的虚拟卡,推荐本人一直使用的WildCard平台,很靠谱和专业: WildCard地址 | 一分钟开卡,轻松订阅海外软件服务 邀请码 JJDPH,有开卡优惠,虚拟卡开好之后,用支付宝充值使用。

几分钟搞定安全可靠,本人的ChatGpt就是这么升级上来的!!!

使用Sora前的准备工作

在开始之前,确保您已经拥有了OpenAI账目,并获得了Sora的访问权限。准备好您想要转化成视频的文本描述,记住越详细越好。

Sora使用步骤一:文本描述

登录您的OpenAI账户,找到Sora的使用界面。在指定区域输入您的文本描述,可以是一个故事概述、场景描述或是具体的动作指令。

Sora使用步骤二:生成视频

完成文本描述和自定义设置后,点击“生成视频”按钮。Sora将开始处理您的请求,这可能需要几分钟时间。完成后,您可以预览生成的视频。

需要注意的是,截止2024年2月28日,OpenAI只向部分专业用户开放了Sora的访问权限。普通用户只能观看其发布的演示视频。

openai sora如何使用的常见问答Q&A

问题:Sora是什么?

  • Sora是由OpenAI开发的AI视频生成模型。
  • Sora可以根据用户提供的描述性文字生成长达60秒的高质量视频。
  • Sora的视频包含精细复杂的场景、生动的角色表情和复杂的镜头运动。

问题:Sora怎么使用?

  • 登录OpenAI账户并找到Sora的使用界面。
  • 在指定区域输入您的文本描述,可以是一个故事概述、场景描述或是具体的动作指令。
  • 点击生成按钮,OpenAI Sora会根据您的文本描述生成视频。

问题:Sora的优势有哪些?

  • Sora具有极强的扩展性,基于Transformer架构,可以应用于各种场景。
  • Sora能够生成高质量、高清的视频,展现复杂场景的光影关系、物体的物理遮挡和碰撞关系。
  • Sora可以创造出包含多个角色、特定动作类型以及与主题和背景相符的详细场景。

问题:Sora的训练原理是什么?

  • Sora的训练分为两个阶段。首先,使用一个标注模型为训练集中的视频生成详细描述。
  • 标注模型生成的描述能够更好地指导Sora生成视频。
  • Sora利用稳定扩散(Stable Diffusion)技术将静态噪声转换为连贯图像。
  • Sora模型采用初步的扩散模型生成视频长度,并逐步消除噪声完成视频。

参考文章:千呼万唤始出来:OpenAI正式上线Sora,Sora是什么?怎么使用?


你好,我是进击的胖虎

亲爱的读者你好!我是进击的胖虎。欢迎扫描二维码关注我们的公众号(最新文章都在公众号里),我将带你从零基础出发,逐步掌握各种AI工具的操作技巧,并为你解读最新的热点新闻!