2024-05-31 21:05
因为前段时间连续更新了几篇跟 AI 相关的公众号,我发现自己的输出能力这些年并没有太多的退化,特别是跟 AI 相关的内容,我本身就特别有好奇心,自己还在做一些 AI 类的产品。
所以在1 月底,我在得到上线了一个内容产品,叫“AI 学习圈”。里面包括每天 1 篇的免费内容更新,嗯,是日更内容,365 天不停,今年是 366 天。另外还有一些订阅用户专享的视频教程,例如 AI 写公文啥的,感兴趣的话可以去看看。这两天,本来在河北崇礼带女儿儿子滑雪,今天早上一睁眼,我就看到了 OpenAI 发布的 Sora 模型,整个人被惊呆了。所以抓紧写一篇。
就在十几个小时之前,OpenAI再一次放出大招,发布了一个有望改变世界的产品,那就是文字生成视频的Sora模型。
很多公司一辈子能发布一个改变世界的产品就非常牛了,而OpenAI团队,就好像没有能力天花板一样。2022年11月,他们发布了ChatGPT,让人工智能成为全世界的焦点;2023年4月,他们发布了GPT4,让全世界见识到了AI的超强能力;今年才刚2月份,他们就发布了Sora模型。我很多从事AI行业的朋友,看到这条消息时感到悲喜交加,悲的是OpenAI一下子就颠覆掉不少创业公司过去一两年的劳动成果,喜的是人家到大年初七才发布,还是让大家过了一个好年。
因为现在还是春节假期,也许你还没有关注到这条新闻。我用比较直白易懂的话给你解释一下Sora模型厉害在哪里。
首先Sora模型是一个文生视频产品,也就是说,你说一句话,AI就会根据你的描述,生成一段视频。无论多天马行空的想法,AI 都可以给你表达出来。
其次,在去年很多顶级人工智能峰会上,国内外不少专家和专业人士都预测,2024年是AI视频的爆发之年。那么你肯定要问了,如果大家都看好今年AI视频会爆发,那为什么面对OpenAI的新产品,大家还这么震惊呢?
那是因为OpenAI现在呈现出来的一大批视频,质量非常高,远远超出了之前所有的AI视频产品。在这之前,全球最火的两家AI视频公司是Runway和Pika,单单是Runway的上一轮融资,就拿了1亿多美金。但是这两家公司的创始人在对外预测2024年的时候,都说有一个核心目标是希望能生成15秒的流畅视频。因为2023年大部分文字生成的AI视频长度都在4-6秒,所以他们都把能生成15秒视频作为一个里程碑。
而这次,Sora直接可以生成60秒的视频,这意味着什么?如果你是篮球迷的话,肯定记得NBA史上最经典的大逆转,麦迪35秒拿下了13分。那60秒可以发生多少事情呢?我们假设Runway,Pika,OpenAI 都是小学二年级同班同学,当Runway和Pika正在努力尝试把一个句子写成300字的记叙文时,坐在角落的一个不起眼的小男孩OpenAI,走上来提前交卷,并且交了一篇1500字的高质量议论文……
至于视频质量,我就不用我贫瘠的文字来描述了。我在文稿里放了一个链接,汇总了一些Sora生成的视频,你可以去看一下视频质量有多高。
你可以重点关注两个视频,一个是一个时尚美女走在东京的街头,不但完美呈现了指令里的穿着,例如“黑色皮夹克,红色长裙,黑色皮靴,黑色提包”,并且镜头从远景到中景到脸部特写,整个视频时长59秒,非常流畅。
另一个视频是在咖啡杯里,两艘海盗船在作战。要知道现实社会是不可能有一大批在咖啡里的海战视频供AI训练的。所以人工智能既要模拟两艘17世纪的海盗船进行海战,又要理解如何在咖啡中掀起惊涛骇浪的物理准则。
说完Sora有多牛之后,作为AI学习圈的同学们,咱们要做的永远不是站在马路边为别人叫好,而是要问自己一个问题:“我该怎么办?”
有人说这个模型的发布对整个AI视频行业是一次暴击。但我不这么认为,因为AI视频公司,全世界也没有太多。而这次的Sora模型,我所看到的,反而是这么几个行业会产生颠覆级的变化,影响不会比AI设计软件Midjourney造成设计师大批失业小。
第一个是传统影视行业。今天我找到年前给AI学习圈同学作过分享的陈坤导演,问他怎么看OpenAI新产品Sora对影视行业的影响。做了20年影视导演的他,跟我说的第一句话是“要变天了”。第二句话是“我直到今天才庆幸自己是个导演”。
第二句话让我很好奇。然后他给我展开讲了讲,因为现在的影视行业,分工极其精细,很多工种和里面的从业者都是阶段式配合,只有导演是需要从前期跟到后期的,然后去不停协调各个工种,从舞美、化妆、道具到灯光、摄像、摄影,从演员、编剧、剧务到动画特。
Copyright © 2002-2024 PG电子·(中国)官方网站旅游有限公司 版权所有 网站地图 备案号: