“
在科技浪潮面前,“打不過(guò)就加入”,用好先進(jìn)的AI工具為產(chǎn)業(yè)賦能,或許是更務(wù)實(shí)的策略。
本文字?jǐn)?shù)4669,閱讀時(shí)長(zhǎng)約14分鐘
文|財(cái)經(jīng)E法 樊朔
編輯 | 郭麗琴
幾天前,好萊塢導(dǎo)演泰勒·派瑞在見(jiàn)證 OpenAI 最新推出的 Sora (人工智能文生視頻大模型)后,擱置了8億美元的工作室擴(kuò)建計(jì)劃。泰勒認(rèn)為,有了Sora,將極大簡(jiǎn)化影視創(chuàng)作流程,對(duì)編輯、剪輯、道具、布景等職位產(chǎn)生重大影響,未來(lái)會(huì)有一大批人失業(yè)。
而在幾個(gè)月前,夢(mèng)工廠創(chuàng)始人杰弗瑞·卡森伯格表示,人工智能將在3年內(nèi)削減90%的動(dòng)畫(huà)電影工作崗位。
顯然,Sora的出現(xiàn),已經(jīng)讓影視和游戲行業(yè)感受到危機(jī)。如果一句話就能生成視頻,視頻剪輯師似乎輕易就會(huì)被取代。
華泰證券研報(bào)顯示,2023年實(shí)際誕生的文生視頻大模型達(dá)到數(shù)十個(gè),全球用戶數(shù)量超過(guò)百萬(wàn)級(jí)別,但目前多數(shù)視頻模型仍處于產(chǎn)品早期階段。2024年各大公司加快了文生視頻模型的研發(fā)步伐。此外,中信證券測(cè)算,中國(guó)國(guó)內(nèi)文生視頻應(yīng)用在短視頻領(lǐng)域2025年潛在市場(chǎng)空間中值達(dá)80億元。
1月2日,Midjourney宣布將在未來(lái)幾個(gè)月加快訓(xùn)練文生視頻模型,1月23日,谷歌推出文生視頻模型Lumiere。在國(guó)內(nèi),字節(jié)跳動(dòng)和騰訊也分別公布了視頻模型MagicVideo V2與VideoCrafter2。除了大公司推出的產(chǎn)品,市場(chǎng)上已公開(kāi)的大多數(shù)模型出自初創(chuàng)公司和小型技術(shù)開(kāi)發(fā)團(tuán)隊(duì),比如Runaway、Pika等,且目前已呈現(xiàn)較為可觀的完成效果和商業(yè)模式。預(yù)計(jì)隨著科技大廠產(chǎn)品的發(fā)布,后續(xù)相關(guān)產(chǎn)品生態(tài)將持續(xù)繁榮。
在與多位影視、游戲、短視頻及短劇行業(yè)的資深人士深入交流之后,財(cái)經(jīng)E法發(fā)現(xiàn),在科技浪潮面前,“打不過(guò)就加入”,用好先進(jìn)的AI工具為產(chǎn)業(yè)賦能,或許是更務(wù)實(shí)的策略。
01
影視:被顛覆只是時(shí)間問(wèn)題
Sora的出現(xiàn)已讓影視從業(yè)者感到了寒意,被顛覆似乎只是時(shí)間問(wèn)題。
在Sora生成的視頻中,一位穿著時(shí)髦的女性走在東京街頭,路面的積水映射著遠(yuǎn)處霓虹都市;而在另一段動(dòng)物視頻中,幾只猛犸象從雪原深處奔來(lái),毛發(fā)與白雪在風(fēng)中飄動(dòng),視頻主角的面部表情和肢體動(dòng)作都自然、生動(dòng)。
文生視頻的美好前景也被逐一展現(xiàn):可媲美人類的場(chǎng)景設(shè)計(jì)、多場(chǎng)景運(yùn)鏡,以及對(duì)物理世界精確的理解。此外,Sora生成的視頻時(shí)長(zhǎng)也遠(yuǎn)超同類產(chǎn)品,據(jù)媒體測(cè)算,在相同的提示詞下,Sora可生成近1分鐘的視頻,Pika僅能生成3秒的視頻,Gen-2video可以生成4秒的視頻。
近日,360集團(tuán)創(chuàng)始人、董事長(zhǎng)周鴻祎在2024亞布力中國(guó)企業(yè)家論壇第二十四屆年會(huì)上分析,Sora的突破在于,它實(shí)現(xiàn)了機(jī)器對(duì)這個(gè)世界的感知、觀察和交互的能力。也就是說(shuō),真正地給人工智能補(bǔ)上了眼睛,但這個(gè)眼睛不是工作在感知層面,而是工作在認(rèn)知層面,能通過(guò)觀察世界,來(lái)了解很多過(guò)去用文字無(wú)法表達(dá)的地方,比如雪花的特性、枕頭的松軟程度。
具體而言,相較此前的文生視頻產(chǎn)品,Sora有著幾大突出特點(diǎn):
一、符合現(xiàn)實(shí)世界的物理規(guī)律;
二、能夠生成一分鐘的高清視頻,并且支持生成不同時(shí)長(zhǎng)、長(zhǎng)寬比和不同分辨率的視頻與圖像;
三、支持文字+圖片生成視頻,且可以基于文本提示,從而改變?cè)曨l的風(fēng)格化和視頻中的元素;
四、Sora可以生成帶有動(dòng)態(tài)攝像機(jī)運(yùn)動(dòng)的視頻。隨著攝像機(jī)的移動(dòng)和旋轉(zhuǎn),人和場(chǎng)景元素在三維空間中一致移動(dòng);
五、Sora可以實(shí)現(xiàn)不同視頻的自然銜接、過(guò)渡,且支持拓展視頻。
根據(jù)OpenAI公布的Sora技術(shù)文檔,Sora將Diffusion model(擴(kuò)散模型)和Transformer兩種技術(shù)架構(gòu)結(jié)合。Diffusion model是一種生成模型,用于圖像的生成。而Transformer是一種深度學(xué)習(xí)模型,可以學(xué)習(xí)文本之間的依賴關(guān)系,也能夠處理圖片和視頻的任務(wù),如圖像分類、視頻理解。在此基礎(chǔ)上,Sora還增添了對(duì)繪畫(huà)意圖標(biāo)簽的理解以及空間與時(shí)間的補(bǔ)丁包,增強(qiáng)對(duì)物理世界的理解。
一些影視行業(yè)資深人士卻仍在細(xì)節(jié)上存有疑問(wèn)。青年導(dǎo)演呂凱源的作品曾入圍第17屆FIRST平面電影展主競(jìng)賽單元,并獲得北京國(guó)際電影節(jié)最具新血潛力項(xiàng)目獎(jiǎng),他認(rèn)為,Sora生成的視頻質(zhì)量確實(shí)不錯(cuò)。但這些視頻更像《文明6》這類游戲的開(kāi)頭,而不像是電影或者廣告的片段。
呂凱源告訴財(cái)經(jīng)E法,在Sora之前發(fā)布的很多文生視頻產(chǎn)品并不符合物理世界規(guī)則,而Sora生成的內(nèi)容已經(jīng)大部分符合物理世界的規(guī)則了。從這一意義上來(lái)說(shuō),Sora是通用人工智能的進(jìn)步?!邦A(yù)期Sora可能會(huì)對(duì)影視行業(yè)顛覆,其實(shí)是人類對(duì)Sora的期望——希望它能理解得更深,但Sora未必能夠達(dá)到人類對(duì)于藝術(shù)、時(shí)尚和文化的理解?!?/strong>呂凱源說(shuō)。
比如,在去年ChatGPT爆火后,呂凱源曾經(jīng)嘗試用ChatGPT寫(xiě)一些故事。他認(rèn)為,AI確實(shí)能提供一些層面的啟發(fā)、幫助,但目前ChatGPT還無(wú)法寫(xiě)出一個(gè)完整的劇本。呂凱源分析,GPT是文字的邏輯,Sora是視頻的邏輯,這是人類的兩種語(yǔ)言,文字語(yǔ)言與視覺(jué)語(yǔ)言是非常不一樣的?!坝梦淖謥?lái)生成視頻,意味著在用一種文字的媒介去轉(zhuǎn)譯成視頻的媒介,這個(gè)過(guò)程是更復(fù)雜的,需要調(diào)用人類的感官、思考,這對(duì)文生視頻而言是一個(gè)亟須克服的障礙” 呂凱源表示。
呂凱源認(rèn)為,目前Sora生成的畫(huà)面精度與真實(shí)的畫(huà)面仍有差距。未來(lái)引入攝像機(jī)參數(shù)后或許能夠生成高質(zhì)量的視頻,但他擔(dān)憂會(huì)產(chǎn)生“恐怖谷效應(yīng)”——聲稱畫(huà)面越像,人類越會(huì)覺(jué)得不真實(shí)。且影視創(chuàng)作極具創(chuàng)造性和隨機(jī)性,AI無(wú)法復(fù)制。比如,后期剪輯的思路其實(shí)是人類出于視覺(jué)上的完形心理,創(chuàng)造了剪輯的各種規(guī)則和玩法。在做一些時(shí)尚片的時(shí)候,他經(jīng)常會(huì)看一些國(guó)外的新時(shí)尚片,發(fā)現(xiàn)影視業(yè)的同行是在不斷創(chuàng)造新剪輯語(yǔ)法的,且需要經(jīng)過(guò)反復(fù)的試驗(yàn)才能生成的一個(gè)好片子。鏡頭長(zhǎng)與短,用什么樣的效果,這些細(xì)節(jié)Sora可能沒(méi)有辦法做到。
“例如,我隨便輸入一個(gè)指令'一個(gè)人在一個(gè)房間里’,導(dǎo)演、編劇對(duì)于這個(gè)畫(huà)面想象都是不一樣的。演員的表情也是非常即興、自我發(fā)揮的,他們有很多經(jīng)驗(yàn)可以調(diào)動(dòng)。但AI只能根據(jù)它對(duì)世界的理解。比如,笑這個(gè)表情,AI可能有1000種選項(xiàng),它不一定會(huì)選擇最對(duì)的,而是會(huì)選擇最合適的。對(duì)于演員而言,可能他們選擇了調(diào)用自己心里的最出其不意的那個(gè)笑,反而獲得了巨大的成功。”呂凱源說(shuō)。
OpenAI官方也指出,Sora可能難以準(zhǔn)確模擬復(fù)雜場(chǎng)景的物理原理,可能無(wú)法理解因果關(guān)系的具體實(shí)例。例如,一個(gè)人咬了一口餅干,但生成畫(huà)面中的餅干上可能會(huì)沒(méi)有咬痕。此外,Sora還可能會(huì)混淆提示的空間細(xì)節(jié),例如混淆左右;并且Sora可能難以精確描述隨著時(shí)間推移發(fā)生的事件,例如畫(huà)面遵循特定的相機(jī)軌跡。
一位CG特效師告訴財(cái)經(jīng)E法,看到Sora的生成效果時(shí)感受到了一些危機(jī)感,自己需要幾天時(shí)間才能完成的設(shè)計(jì),AI可能只需要幾秒鐘就能完成。但Sora的創(chuàng)新性以及是否能夠滿足對(duì)特效的細(xì)節(jié)要求還有待驗(yàn)證。
此外,呂凱源認(rèn)為,并不是技術(shù)越好越能生產(chǎn)出好的作品,好作品是多因素疊加的成果。他以最近爆火的《熱辣滾燙》舉例,電影的敘事與內(nèi)容不見(jiàn)得多么出挑,真正讓其火出圈、獲得高票房的原因是營(yíng)銷端的成功。好萊塢一些大IP的成功在于他們的故事是創(chuàng)新的、縝密的,再加上快餐式或雞湯式的營(yíng)銷,最終實(shí)現(xiàn)成功。
面對(duì)當(dāng)下的不足,資深互聯(lián)網(wǎng)科技行業(yè)分析師陳澤敏告訴財(cái)經(jīng)E法,Sora的突破在于已經(jīng)給出了可以被推演的技術(shù)增長(zhǎng)路徑,而不是要去通過(guò)質(zhì)變來(lái)改善的技術(shù)。假以時(shí)日,Sora生成的視頻有望達(dá)到更高的質(zhì)量和精細(xì)程度。
華策影視董事長(zhǎng)趙依芳公開(kāi)表示,將全面擁抱AIGC和數(shù)字化,以科技創(chuàng)新謀新路,以更大的能量繼續(xù)引領(lǐng)行業(yè)。
02
游戲:更易受到?jīng)_擊
另一個(gè)可能被Sora沖擊的行業(yè)是游戲行業(yè)。OpenAI官方發(fā)布的一段演示視頻還原了視頻游戲《我的世界》。研究人員通過(guò)包含“我的世界”的提示詞還原了一個(gè)與《我的世界》一致的高保真游戲片段。
多位受訪者告訴財(cái)經(jīng)E法,相較影視行業(yè),游戲業(yè)更易受到Sora的沖擊。
一名游戲設(shè)計(jì)師告訴財(cái)經(jīng)E法,一旦Sora具備了穩(wěn)定且成熟的產(chǎn)出能力,CG、過(guò)場(chǎng)動(dòng)畫(huà)等美術(shù)內(nèi)容將極有可能被取代。她表示,游戲的過(guò)場(chǎng)動(dòng)畫(huà)以及宣發(fā)中的CG建模制作時(shí)長(zhǎng)一般較短,Sora如果能夠?qū)崿F(xiàn)成熟且具有一致性的內(nèi)容輸出,這一部分的制作或許能夠完全由AI完成。
陳澤敏也認(rèn)為,目前Sora一分鐘的作品有些細(xì)節(jié)可能不真實(shí),但其實(shí)已經(jīng)可以滿足一些內(nèi)容生產(chǎn)需要。他以游戲行業(yè)舉例:“目前,優(yōu)質(zhì)內(nèi)容的用戶占比在全球都不高。大部分人消費(fèi)的都是一些不用那么精細(xì)的內(nèi)容。比如,一些中腰部的游戲仍然有很多用戶在玩?!?/p>
但一家頭部游戲廠商的產(chǎn)品經(jīng)理則認(rèn)為,同質(zhì)化、低質(zhì)量的內(nèi)容難以開(kāi)拓市場(chǎng),游戲應(yīng)當(dāng)在AIGC的輔助下找到新的打法??梢灶A(yù)見(jiàn)的是,Sora的出現(xiàn)能夠提升游戲的體驗(yàn)。他舉例,用戶也許可以利用Sora在游戲中實(shí)現(xiàn)自己創(chuàng)建場(chǎng)景,過(guò)得更加極致的沉浸式體驗(yàn)。此外,游戲的開(kāi)發(fā)者也可以利用類似的工具減少重復(fù)性勞動(dòng)。個(gè)人開(kāi)發(fā)者可以利用AI工具以相對(duì)較低的成本開(kāi)發(fā)游戲,甚至有可能與游戲廠商競(jìng)爭(zhēng)。
當(dāng)然,前述行業(yè)人士也強(qiáng)調(diào),一款游戲的成功不僅僅在于美術(shù)和設(shè)計(jì),玩法、題材、運(yùn)營(yíng)、宣發(fā)、商業(yè)模式等都是重要的因素。消費(fèi)者對(duì)于好游戲的標(biāo)準(zhǔn)也不斷變化,Sora的出現(xiàn)并不意味著游戲從業(yè)者集體失業(yè)。
一些游戲廠商對(duì)Sora的出現(xiàn)做了積極回應(yīng)。
巨人網(wǎng)絡(luò)在互動(dòng)易平臺(tái)回復(fù)投資者稱,公司關(guān)注到Sora在視頻生成領(lǐng)域取得的突破性進(jìn)展,巨人網(wǎng)絡(luò)作為最早完成大語(yǔ)言模型備案的游戲公司之一,同樣在積極布局多模態(tài)大模型領(lǐng)域,聚焦游戲垂直類創(chuàng)作場(chǎng)景。
游戲公司掌趣科技在互動(dòng)平臺(tái)回復(fù), Sora等新技術(shù)的涌現(xiàn),將有助于提升游戲研發(fā)效率,推進(jìn)游戲創(chuàng)作的創(chuàng)意實(shí)現(xiàn),提升游戲體驗(yàn),促進(jìn)游戲類型的多元化發(fā)展,更好地助力游戲行業(yè)向前發(fā)展。公司在“AI游戲創(chuàng)作平臺(tái)”、LayaAir游戲引擎方面的布局,是游戲工具、平臺(tái)與AI技術(shù)結(jié)合的積極探索,也是后續(xù)AI相關(guān)新技術(shù)(包括文生視頻等)有效的應(yīng)用場(chǎng)景與合作伙伴,同時(shí)相關(guān)3D素材、3D引擎技術(shù)的積累也或?qū)⒂兄谛袠I(yè)內(nèi)相關(guān)技術(shù)的訓(xùn)練或迭代。
實(shí)豐文化回復(fù)投資者稱,公司一直密切關(guān)注行業(yè)最新發(fā)展態(tài)勢(shì)及用戶需求,不斷提升生產(chǎn)創(chuàng)作效率,AI技術(shù)與游戲的進(jìn)一步融合將為游戲業(yè)務(wù)的開(kāi)展降本增效,公司預(yù)期會(huì)使用“Sora”等視頻AI工具進(jìn)行游戲片頭以及視頻投放素材的生成,可以降低研發(fā)及制作成本。
03
短視頻/短?。汉笃谥谱骺赡鼙蝗〈?/strong>
大勢(shì)所趨,影視、游戲以及短視頻領(lǐng)域的資深人士已經(jīng)開(kāi)始積極擁抱Sora帶來(lái)的新浪潮。
華泰證券研報(bào)預(yù)計(jì),Sora能明顯降低影視業(yè)的制作門檻及成本,且可以極大程度豐富影視作品的創(chuàng)造性及風(fēng)格。Sora的出現(xiàn)將重塑影視行業(yè),預(yù)計(jì)擁有核心導(dǎo)演或創(chuàng)意人才,及IP資源的公司更受益。
中信證券研報(bào)認(rèn)為,Sora模型出色的語(yǔ)義理解、視頻編輯和擴(kuò)展能力為創(chuàng)作者提供了靈活和廣泛的創(chuàng)意空間,有望加速文生視頻應(yīng)用在各行業(yè)的滲透率。短視頻的時(shí)長(zhǎng)普遍在60秒及以下,Sora的內(nèi)容生成能力充分適配短視頻時(shí)長(zhǎng)及應(yīng)用場(chǎng)景,可以大幅提高創(chuàng)作效率并降低創(chuàng)作門檻。
呂凱源認(rèn)為,如果Sora能夠發(fā)展到一個(gè)非常厲害的程度,能夠讓影視從業(yè)者直接上手操作,或許可以成為工作流的一部分。在后期工種中,最容易被取代的可能是CG特效,它能夠節(jié)省很多的時(shí)間和空間,替人類把身邊的物理世界復(fù)刻出來(lái)。
在短視頻和短劇領(lǐng)域,Sora的替代效應(yīng)可能更大。陳澤敏告訴財(cái)經(jīng)E法,Sora的出現(xiàn)能夠提升大量中腰部以下的短視頻創(chuàng)作者的產(chǎn)能與產(chǎn)效。Sora可以將每個(gè)角色的樣貌、動(dòng)作甚至口癖導(dǎo)入模型,提升產(chǎn)能?!拔C(jī)是一定出現(xiàn)了,短視頻行業(yè)的一部分內(nèi)容創(chuàng)作者可能會(huì)產(chǎn)生產(chǎn)能壓力。”陳澤敏說(shuō)。
具體而言,呂凱源認(rèn)為,抖音的很多優(yōu)秀創(chuàng)作者的視頻畫(huà)面質(zhì)量并不好,但重要的是他們的視頻是有內(nèi)容和創(chuàng)意的,并不容易被取代。但短視頻的后期制作以及大量的投流號(hào)的內(nèi)容制作,則完全有可能被Sora取代。
陳澤敏總結(jié),Sora大幅降低了行業(yè)試錯(cuò)成本,提高了生產(chǎn)效率,使得行業(yè)有更多的創(chuàng)意冒出來(lái)。他建議,如果能夠利用這一工具大量生產(chǎn)中文視頻內(nèi)容,再鼓勵(lì)有1~2個(gè)類似的平臺(tái),中文AI視頻可能會(huì)出現(xiàn)百花齊放的狀態(tài)。
一位不愿具名的短劇從業(yè)者也告訴財(cái)經(jīng)E法,目前來(lái)看Sora的制作效果遠(yuǎn)超出預(yù)期,未來(lái)或許能夠應(yīng)用于短劇的后期制作,提高產(chǎn)出效率。,
“AI是一個(gè)生產(chǎn)力強(qiáng)于過(guò)去傳統(tǒng)模式的工具。但本身用不用得好,一定要看用它的人怎么樣,或者說(shuō)這個(gè)工具被打磨、被訓(xùn)練得怎么樣。”陳澤敏說(shuō)。
聯(lián)系客服