说实话,挺离谱的,Open AI 的视频生成模型 Sora 前脚刚刚发布,后脚就有人开始卖 Sora 的教程了。
事实上,目前 Open AI 只放出了一些 Sora 生成的视频进行宣传,并邀请了极少数艺术家、影视工作者进行内测,而且这项服务根本没有向国内开放。即便报名了这些课程,用户短期内也不可能访问到 Sora 的服务。而这些所谓“Sora教程”的制作者,自己本身都不可能用 Sora 生成过视频,只是乘着这波热度狠狠“割韭菜”,千万不要上当受骗。
像是教程里说到的提示词工程,课程的作者是不可能实验过的。大家都只能从 OpenAI 给出的少量例子中进行了解。比如上图的视频的提示词是:A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.
翻译成中文,就是:一位时尚的女性走在东京街头,街道上充满了温暖的发光霓虹灯和生动的城市标志。她穿着一件黑色皮夹克,一条长长的红色连衣裙,黑色靴子,还背着一个黑色的手提包。她戴着墨镜,涂着红色口红。她步履自信、悠闲地走着。街道潮湿而反光,营造出五彩缤纷的灯光的镜像效果。许多行人在街上走动。
OpenAI 目前放出的例子提示词都是英文,目前尚不知道 Sora 是否支持其他语言。不过,观察 OpenAI 给出的例子,不难发现给出的提示词都非常接近自然语言。既可以像上面那样详细地描述画面的具体细节,也可以简单描述,比如像 Tour of an art gallery with many beautiful works of art in different styles(艺术画廊之旅,展示了许多不同风格的美丽艺术品)简单一句话也能获得不错的效果。
目前看来,Sora 生成的视频远超其他 AI 生成的效果,基本达到了可用的水准。在做视频时找不到素材的时候,用 Sora 生成一小段素材来填充视频就非常合适。在这种需求明确情况下,其实用几句简单的自然语言描述画面,再稍加调整,或许就能获得不错的效果。预计在未来 Sora 开放后,用户不用专门的训练也能生成符合需求的视频,并不需要花钱报班才能学会。