隨著技術(shù)發(fā)展逐漸從分析型AI(Analytical AI)迭代到創(chuàng)造型AI(Generative AI),機(jī)器們也開始生成本不存在的新事物——寫詩、繪畫、開發(fā)游戲。今年隨著AI繪畫的大火,被稱之為AI繪畫的元年。
那么,這個在紅杉眼里能夠產(chǎn)生數(shù)萬億美元經(jīng)濟(jì)價值的產(chǎn)業(yè)究竟是怎么回事?它又將如何層層遞進(jìn)顛覆如今的內(nèi)容產(chǎn)業(yè)?
本期研究視角讓我們聚焦于人工智能的新魔法——AIGC(AI Generated Content,人工智能創(chuàng)作內(nèi)容)。
什么是AIGC?在探討AIGC為什么現(xiàn)在火了之前,先對AIGC做更精確的概念定義。
所謂AIGC即基于人工智能技術(shù)自動生成內(nèi)容的新型生產(chǎn)范式,其中,兩大核心關(guān)鍵詞是AI+新型內(nèi)容生成方式。
一、新型內(nèi)容生產(chǎn)方式——有望引領(lǐng)內(nèi)容產(chǎn)業(yè)的新一輪工業(yè)革命
對于計算機(jī)來說,內(nèi)容=信息(數(shù)據(jù))+載體(音頻、視頻、文字等),只要輸入信息,選好載體,AIGC就能自動生成與之對應(yīng)的內(nèi)容。
典型場景即目前大火的AI作畫,用戶可以通過簡短的文字描述(prompt)來生成與之相應(yīng)的圖像,而且隨著文字描述的顆粒度不斷細(xì)化,生成的圖像也會越來越精準(zhǔn)。
除了文字轉(zhuǎn)圖片之外,目前AIGC已經(jīng)可以勝任圖像、視頻、文本間的跨載體生成。
從內(nèi)容生產(chǎn)方式的發(fā)展歷程來看,可以大致分為專家生成內(nèi)容(PGC)、用戶生成內(nèi)容(UGC)、AI生產(chǎn)內(nèi)容(AIGC)三大階段。
PGC、UGC 分別被產(chǎn)能與質(zhì)量所束,難以滿足快速增長的內(nèi)容需求;
而基于AIGC,內(nèi)容生產(chǎn)的門檻顯著降低(比如,毫無繪畫基礎(chǔ)的用戶,也可以通過AI作畫,畫出高質(zhì)量的作品)、內(nèi)容生產(chǎn)的效率顯著提升(可以快速批量生產(chǎn)大量內(nèi)容),將有望引領(lǐng)內(nèi)容產(chǎn)業(yè)的新一輪工業(yè)革命。
AIGC可以涉及多方面的內(nèi)容載體和應(yīng)用場景,資料來源:量子位
AIGC是繼PGC和UGC后又一內(nèi)容生成范式,資料來源:A16Z,中金公司
二、生成式AI——不只是模仿,更多是創(chuàng)造
AIGC背后的核心技術(shù)是生成式AI。通常意義上,我們了解的AI更多是分析型AI(Analytical AI),比如人臉識別、短視頻的算法推送等。
而AIGC背后用的AI技術(shù)則是生成式AI(Generative AI),不再只是分析,而是開始嘗試創(chuàng)造新的東西。
如果把AI比作小孩學(xué)習(xí)的話,基于生成式AI技術(shù)的成熟意味著AI不僅是會模仿,更可以在學(xué)習(xí)的基礎(chǔ)上創(chuàng)造出新的東西。
我們?nèi)匀灰訟I作畫為例,基于生成式AI的技術(shù),AI不僅能從人類過去數(shù)千年的畫作中汲取相關(guān)的經(jīng)驗(yàn),融會貫通更大繪畫流派,
而且基于AI生成圖像的隨機(jī)性(涌現(xiàn)性)的特點(diǎn),更可以創(chuàng)造出全新的繪畫風(fēng)格,也就是說AI在學(xué)習(xí)一千種人類繪畫的方式,甚至創(chuàng)造出“第一千零一種可能”。
為什么是現(xiàn)在爆發(fā)?技術(shù)已經(jīng)初步成熟。
AIGC背后的技術(shù)本質(zhì)上是使用AI算法對大量訓(xùn)練數(shù)據(jù)集進(jìn)行學(xué)習(xí),尋找已有數(shù)據(jù)的規(guī)律并將其適當(dāng)泛化,進(jìn)而使得AI獲得孿生能力、編輯能力、創(chuàng)作能力。
之所以現(xiàn)在可以在產(chǎn)業(yè)中大火,離不開背后的AI技術(shù)的成熟。
眾所周知,AI技術(shù)的核心三要素是——數(shù)據(jù)、算法、算力,這一次快速迭代的是算法。
1)第一代算法GAN
生成式AI最早的算法模型可以追溯到2014年的“對抗生成網(wǎng)絡(luò)”GAN(Generative Adverserial Network)。
GAN 最知名的應(yīng)用是人臉生成:模型去看海量的人臉照片,知道人臉是一種分布,然后學(xué)習(xí)到人臉的特征。
作為第一代生成式AI模型,GAN的問題是其生成的圖像只是對現(xiàn)有作品的模仿,而非創(chuàng)新,因此依托GAN模型難以創(chuàng)作出新圖像。
此外,GAN也不能通過文字提示生成新圖像,這導(dǎo)致他的應(yīng)用局限性比較明顯。
2)第二代算法CLIP
2021年,OpenAI團(tuán)隊(duì)將跨模態(tài)深度學(xué)習(xí)模型CLIP(Contrastive Language-Image Pre-Training)進(jìn)行開源。
CLIP模型能夠?qū)⑽淖趾蛨D像進(jìn)行關(guān)聯(lián),比如將文字“狗”和狗的圖像進(jìn)行關(guān)聯(lián),并且關(guān)聯(lián)的特征非常豐富,AI的學(xué)習(xí)能力、創(chuàng)造能力更加泛化。
因此,相對于GAN,他可以實(shí)現(xiàn)“輸入文本——輸出圖像”的功能,而且通過輸入-輸出的內(nèi)容是可控制的。
3)第三代Diffusion擴(kuò)散化模型
Diffusion 擴(kuò)散化模型的原理類似給照片去噪點(diǎn),通過學(xué)習(xí)給一張圖片去噪的過程來理解有意義的圖像是如何生成。
因此Diffusion 模型可以基于更少的數(shù)據(jù)做訓(xùn)練,同時模型生成的圖片相比 GAN 模型精度更高,更符合人類視覺和審美邏輯,同時隨著樣本數(shù)量和深度學(xué)習(xí)時長的累積,Diffusion 模型展現(xiàn)出對藝術(shù)表達(dá)風(fēng)格較好的模仿和創(chuàng)造能力。
資料來源:騰訊科技
AIGC在文字—>圖像、圖像—>視頻、文字—>文字領(lǐng)域的技術(shù)已然成熟。
根據(jù)紅杉以及量子位的分析判斷,不同應(yīng)用場景的技術(shù)成熟度和規(guī)?;瘧?yīng)用時間可能會有差異。
以AI作畫為例,早期AI作畫的效果還不盡如人意,往往不夠擬真,容易激發(fā)“恐怖谷”效應(yīng),但隨著技術(shù)層面上的不斷進(jìn)化,不僅可以達(dá)到 “以假亂真”的程度,更是可以在創(chuàng)造力達(dá)到類人的水平。
目前在文字—>圖像、圖像—>視頻、文字—>文字領(lǐng)域,AIGC技術(shù)已經(jīng)基本成熟,后續(xù)產(chǎn)業(yè)發(fā)展則依賴于商業(yè)化開發(fā),具體如下:
1)文字—>圖像領(lǐng)域,底層技術(shù)明確,預(yù)計在1-2年將實(shí)現(xiàn)規(guī)?;瘧?yīng)用。
2)圖像—>視頻領(lǐng)域,底層技術(shù)明確,預(yù)計在1-2年將實(shí)現(xiàn)規(guī)模化應(yīng)用。
3)文字—>視頻領(lǐng)域,底層技術(shù)待完善。
4)圖像—>文字領(lǐng)域,底層技術(shù)待完善。
5)文字—>文字領(lǐng)域,底層技術(shù)明確,已經(jīng)實(shí)現(xiàn)規(guī)模化應(yīng)用。
AIGC的技術(shù)發(fā)展階段預(yù)測,資料來源:量子位
AIGC產(chǎn)業(yè)的上中游。根據(jù)量子位的梳理,可以把AIGC產(chǎn)業(yè)分為上游(數(shù)據(jù)供給方、開源算法社區(qū)、創(chuàng)造者生態(tài)層等)——中游(文字、圖像、音頻、視頻等垂直賽道)——下游(應(yīng)用場景和終端客戶)。
上游,國內(nèi)AIGC產(chǎn)業(yè)還有眾多欠缺,以數(shù)據(jù)標(biāo)注為重點(diǎn)體現(xiàn)。
中游,由于技術(shù)發(fā)展不足以及投資環(huán)境的影響,AIGC大多被作為公司的部分業(yè)務(wù)、乃至相對邊緣化的功能進(jìn)行研發(fā)開發(fā),獨(dú)立運(yùn)行的初創(chuàng)公司數(shù)量明顯少于國外,也導(dǎo)致國內(nèi)對于AIGC場景開發(fā)較少。
整體上,更為常見的是研究機(jī)構(gòu)對AIGC能力進(jìn)行理論研究,實(shí)際效果開發(fā)較少。
AIGC產(chǎn)業(yè)圖譜,資料來源:量子位
典型玩家分析
1)國外玩家代表——Jasper.ai,主打以“AI 文字生成”
Jasper.ai可能是目前估值最高的AIGC獨(dú)角獸,就在22年10月份,公司官宣完成了 1.25 億美金的 A 輪融資,估值達(dá)到了 15 億美金。
公司提供的核心產(chǎn)品是通過 AIGC幫企業(yè)和個人寫營銷推廣文案以及博客等各種文字內(nèi)容。
從商業(yè)化模式來看,Jasper主要是通過SaaS付費(fèi)的模式,根據(jù)其 CEO 透露,目前公司已經(jīng)有 7 萬名付費(fèi)客戶,
其中包括了像 Airbnb、HubSpot、Autodesk 以及 IBM 等企業(yè)客戶,21年收入已經(jīng)超過了 4000 萬美金,預(yù)計22年年底整個收入會增加一倍以上,也就是可能達(dá)到 9000 萬美金到 1 億美金左右。
基于Jasper.ai創(chuàng)造文字,資料來源:百度,附注:左邊是用戶輸入情節(jié)和文字風(fēng)格;右邊是Jasper自動輸出對應(yīng)的文字
2)國內(nèi)玩家代表——百度,全方面布局AIGC應(yīng)用場景
在9月23日舉辦的2022萬象·百度移動生態(tài)大會上,百度發(fā)布了AI助理,堪稱AI打工天團(tuán),覆蓋了各種AIGC應(yīng)用,包括AI自動生成文字、圖片,圖片轉(zhuǎn)換成視頻。
用百度的話來說,這個團(tuán)隊(duì) 里不僅有文案、插畫師,還有視頻制作人,創(chuàng)作者熬夜加班的活兒都可以交給AI了。
基于AIGC的新風(fēng)口,百度希望掀起一場內(nèi)容生產(chǎn)革命。
換言之,為百度現(xiàn)有的500多萬百家號創(chuàng)作者帶來一套AI生產(chǎn)內(nèi)容工具,幫助他們更快、更好地產(chǎn)出視頻內(nèi)容,從而增加百度百家號等產(chǎn)品的用戶粘性。
根據(jù)公司披露,目前其AIGC生產(chǎn)內(nèi)容的良品率已經(jīng)超過50%,未來大規(guī)模商用后,公司的內(nèi)容會更為豐富,帶動整個百度的廣告變現(xiàn)能力提升。
百度針對創(chuàng)作者發(fā)布AI助理團(tuán),資料來源:百度
AIGC不只是“科技炫技”,更是“新生產(chǎn)力”。
上一輪AI帶給我們的震撼可能要回溯到2016年,谷歌AlphaGo戰(zhàn)勝世界圍棋冠軍李世石,但在驚嘆過后,大家發(fā)現(xiàn)AlphaGo在圍棋領(lǐng)域的突破可能只是一次“科技炫技”,其本身并沒有創(chuàng)造出太多的產(chǎn)業(yè)價值。
而這一次以AI作畫為代表的AIGC的出圈,我們認(rèn)為絕不止是“科技炫技”,更代表著未來的先進(jìn)生產(chǎn)力。
簡單的說,AIGC,它可以以十分之一甚至更低的成本,千百倍的生產(chǎn)速度,創(chuàng)造出有獨(dú)特價值和獨(dú)立視角的內(nèi)容,這絕對會為內(nèi)容生產(chǎn)領(lǐng)域帶來巨大變革。在AIGC的時代,人人都可以快速創(chuàng)造出有質(zhì)量的內(nèi)容,無論是內(nèi)容創(chuàng)造者還是內(nèi)容消費(fèi)者都將顯著受益。
商業(yè)化方式——自用or商用?
1)自用——內(nèi)容廠商的技術(shù)自用
典型的例子就是百度,“自己生產(chǎn)的降落傘自己先跳”,百度22年發(fā)布的AIGC技術(shù)棧,將幫助百度內(nèi)容生態(tài)的創(chuàng)造者們,解決的是創(chuàng)作成本過高、重復(fù)勞動的問題,顯著提高生產(chǎn)效率。
2)商用——內(nèi)容創(chuàng)造者付費(fèi)
AIGC的潛在客戶包括兩類:1)內(nèi)容生產(chǎn)公司:如資訊媒體、音樂流媒體、游戲公司、視頻平臺、影視制作公司等;2)專業(yè)C端用戶:個人畫家、個人寫手等。
典型的付費(fèi)模式,如前文所介紹的Jasper,主要是通過按照賬號進(jìn)行SaaS付費(fèi)的模式(Jasper定價是40-80美金/月)。
AIGC市場潛力估算——存量內(nèi)容產(chǎn)業(yè)市場潛力在千億級別,更大價值在增量市
1)AIGC對存量內(nèi)容產(chǎn)業(yè)改造的市場潛力——千億級別
對于內(nèi)容產(chǎn)業(yè),內(nèi)容制作成本往往是產(chǎn)業(yè)成本的大頭。
我們按照內(nèi)容市場的規(guī)模、內(nèi)容制作成本的比重、有多少比重的內(nèi)容可被AIGC化來做假設(shè),可以簡單估算出AIGC對存量內(nèi)容產(chǎn)業(yè)改造的市場潛力至少是千億級別。
AIGC對存量內(nèi)容產(chǎn)業(yè)改造的市場潛力
2)內(nèi)容產(chǎn)業(yè)的本質(zhì)是供給創(chuàng)造需求,AIGC更大的價值在于對增量市場的創(chuàng)造
內(nèi)容產(chǎn)業(yè)的本質(zhì)是供給創(chuàng)造需求,AIGC作為全新的內(nèi)容生產(chǎn)方式,可以為內(nèi)容產(chǎn)業(yè)帶來更新的內(nèi)容風(fēng)格、更快的生產(chǎn)速度,更低的生產(chǎn)成本,這無疑會驅(qū)動內(nèi)容產(chǎn)業(yè)的大爆發(fā)。
更進(jìn)一步,讓我們打開腦洞,在未來的元宇宙中,AIGC有望成為數(shù)字世界的“夢幻編輯器”,只需要用戶描述出想要的場景,AI就可以生產(chǎn)與之對應(yīng)的數(shù)字場景,所謂“言出法隨”,這將是多么震撼的體驗(yàn)。
總之,我們非常看好AIGC為內(nèi)容產(chǎn)業(yè)帶來的全新增量。
對于新技術(shù),人們常高估一年的變化,低估十年的變化。雖然AIGC仍然是處于萌芽期,但是其所展現(xiàn)出來的創(chuàng)造能力已經(jīng)足以讓人驚嘆。
在未來世界中,我們期待AIGC持續(xù)顛覆內(nèi)容生產(chǎn)的方式,將創(chuàng)造和知識工作的邊際成本降低至零,全面變革電影、游戲、元宇宙等產(chǎn)業(yè),讓子彈飛一會兒!
文章作者:和諧匯一
聯(lián)系客服