中文字幕理论片,69视频免费在线观看,亚洲成人app,国产1级毛片,刘涛最大尺度戏视频,欧美亚洲美女视频,2021韩国美女仙女屋vip视频

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
AI 已死?不,AIGC 給我們帶來了新的希望 | 氪記 2022

2022 年的熱門詞匯有什么?AIGC 當(dāng)之無愧位列其中,甚至將名列前茅。

從 5 月的 Disco Diffusion 和 DALLE2 引起的 AI 作畫潮流,到 11 月的 chatGPT 在一周內(nèi)完成了百萬用戶注冊,期間海內(nèi)外出現(xiàn)了無數(shù)個 AIGC 的產(chǎn)品和創(chuàng)業(yè)公司,共同掀起了 AI 創(chuàng)作的熱潮。

不得不說,在整個 AIGC 浪潮中,美國一直主導(dǎo)著技術(shù),并將其開源;中國的產(chǎn)品和技術(shù)更多在跟隨美國的步伐。其實,AIGC 的概念也來自于中國本土——在美國,更常見的說法是Generative AI,即生成式AI。

其實,AIGC 是 Generative AI 的子集。因此在本文中,我們將用 GA 來統(tǒng)稱這一年的生成式 AI 的進展。

AI 領(lǐng)域還有一個名詞叫做 AGI(通用人工智能),可以被理解為一個強人工智能的終極目標(biāo),其目的是系統(tǒng)性地解決方案,執(zhí)行人類能夠完成的“任何”任務(wù)。而想要實現(xiàn) AGI,生成式 AI 是不可或缺的一步?;蛘哒f,當(dāng)下人類最有可能接近創(chuàng)造 AGI 的方式,就是將一個個碎片化的生成式 AI 能力,集成在一個智能平臺上,來模擬 AI 的智力和高度適應(yīng)性。

AGI 早在幾十年前的科幻作品中就已經(jīng)有了很多不同的展現(xiàn)形式,其共同的特點是有著強大的自然語言理解(NLU)能力,這就是今天掀起生成式 AI 風(fēng)浪的主要技術(shù)。

其實,AIGC 也好,生成式 AI 也好,雖然是在今2022年獲得關(guān)注,但并不是2022年才出現(xiàn)的。

底層技術(shù)已經(jīng)默默突破了幾年,之所以生成式 AI 會在2022年出現(xiàn)在更多普羅大眾面前,歸根結(jié)底是背后的技術(shù)再上了一步臺階,可以向公眾發(fā)布以供廣泛使用。

以大語言模型(large language models,以下簡稱“LLM”)為基礎(chǔ)的 text-to-X(文本到任意)技術(shù)再在2022年有了突破性進展,分別在 text- to-image(文本到圖片)、AI-generated-text(AI 生成文字)、text-to-video(文本到視頻)、generative code(生成式代碼)等領(lǐng)域出現(xiàn)了值得全球關(guān)注的應(yīng)用。

技術(shù)在2022年取得突破性進展,并將其開源,將 AI 結(jié)果產(chǎn)出的時間大大縮短,產(chǎn)出精度更強。比如 OpenAI 所用的 GPT 技術(shù),其 GPT1 在 2017 年就已經(jīng)出現(xiàn),現(xiàn)在 chatGPT 所采用的 GPT3.5 則是在2022年出現(xiàn)。

盡管從 2014 年 AlphaGO 戰(zhàn)勝柯潔開始,人類對于 AI 就抱有最大的希望,此后不停出現(xiàn)“AI 元年”的說法,但過去幾年,AI 的應(yīng)用和底層技術(shù)都沒有實現(xiàn)更大的突破,這又讓大家對于 AI 心灰意冷。

到 2022 年,AI 成為生產(chǎn)工具,帶來了商業(yè)化價值,或許才終將迎來“AI 元年”。

生成式AI 2022大事年表,36氪制圖

一、創(chuàng)投:燒錢的未來,注定是少數(shù)人的游戲

在 GPT-3 發(fā)布的兩年內(nèi),風(fēng)投資本對 AIGC 的投資增長了四倍,在 2022 年更是達到了 21 億美元。

正如前文所說,GA 底層技術(shù)的突破,創(chuàng)造出了更多細分賽道,比如 Disco Diffuison 和 Stable Diffusion 正在加快藝術(shù)創(chuàng)作的速度,copy.ai 和 Jasper 在通過 AI 完成文案寫作,Mutable.ai 和 Github Co-pilot 以 AI Coding 的方式提高編程效率。

細分賽道越多,意味著想象空間越大。而一級市場最擅長為想象空間買單。

當(dāng)然,其中一部分取得融資的公司采用的的確是時下最先鋒的 GA 模型,比如種子輪獲得 1.01 億美元的 StabilityAI,但很多獲得融資的公司,也不過是用以往的 AI 模型蹭上了熱度而已。這加大了投資人和機構(gòu)的判斷難度,自然會導(dǎo)致一級市場在短期內(nèi),比如 2023 年的混亂。

來源:PitchBook

之所以使用最新模型的 GA 創(chuàng)業(yè)公司比例不高,除了一部分公司想要“走捷徑”直接偷換概念外,大模型的訓(xùn)練,原本就是燒錢、砸人還不一定有成效的事情。以2022年先后推出 AI Art 賽道明星項目 DALLE2 和對話式 AI 爆款的 chatGPT 的母公司 openAI 來說,其大模型 GPT1 從 2017 年就開始訓(xùn)練,直到 GPT3 出現(xiàn)才逐漸變得易用、好用。而 chatGPT 之所以風(fēng)靡全球,是因為其背后是比 GPT3 更高級的 GPT3.5。

根據(jù)公開資料,GPT-3 訓(xùn)練的僅是硬件和電力成本高達 1200 萬美元(約 7500 萬人民幣),GPT3.5 只高不少。

如此高額的投入、大量的迭代時間,顯然并不是初創(chuàng)公司能夠完成的。

這就決定了,初創(chuàng)公司只能依靠開源的模型,進行在具體應(yīng)用側(cè)的創(chuàng)新。可是這樣一來,壁壘變低,對于客戶和用戶來說,選項也變多了,那么應(yīng)用創(chuàng)新的商業(yè)價值就會變低。技術(shù)價值和商業(yè)價值都不夠的情況下,一級市場自然不會買單。

其實在 2022 年,就已經(jīng)出現(xiàn)了此類現(xiàn)象,在國內(nèi)在 AI Art 領(lǐng)域出現(xiàn)了不少用戶量大的創(chuàng)業(yè)項目,但是融資情況并不容樂觀。

2023 年或許會延續(xù) 2022 年的創(chuàng)投趨勢:創(chuàng)業(yè)項目層出不窮,但是一級市場只買單有技術(shù)壁壘和商業(yè)前景的個別項目;當(dāng)然,總體數(shù)量會比前些年更多。

GAmapping,來源 Leonis Capital 風(fēng)險投資基金

二、AI Art:從高門檻變成無門檻

2023 年趨勢

  • AI Art 成為越來越多應(yīng)用的“標(biāo)配”,C 端觸達門檻降低,每個用戶都可以在自己熟悉的 App 或平臺內(nèi)直接使用這項功能,與此同時,越來越普遍的 AI Art 也不會再成為核心競爭力或功能亮點;
  • 從創(chuàng)投視角來看,由于訓(xùn)練模型的成本更低,加上服務(wù)商的涌現(xiàn)與競爭,會導(dǎo)致用戶數(shù)據(jù)和模型更分散,降低了跑出下一個獨角獸的可能性,并且導(dǎo)致 VC 很難選擇投資標(biāo)的;
  • 從生態(tài)視角來看,將會形成更多社區(qū),開發(fā)者、設(shè)計師、用戶將共同探索需求和趨勢,從而實現(xiàn)創(chuàng)作端的良性循環(huán)。

2 月,Disco Diffusion 開始流行,Diffusion 底層技術(shù)對 GAN 徹底革新

Disco Diffusion 是在2022年 2 月初開始流行的一個 AI 圖像生成程序,可以根據(jù)描述場景的關(guān)鍵詞渲染出對應(yīng)的圖像,可以在 Google Drive 直接運行,也可以部署到本地運行。

但在那時,人們尚未意識到,Disco Diffusion 的出現(xiàn),是 2022 年一整年 AI Art 狂熱潮的開始。

圖為國內(nèi)最大的平面設(shè)計師社區(qū) UISDC 上首次出現(xiàn)關(guān)于 Disco Diffusion 的科普文章

上圖為國內(nèi)最大的平面設(shè)計師社區(qū) UISDC 上首次出現(xiàn)關(guān)于 Disco Diffusion 的科普文章,設(shè)計師是對圖像創(chuàng)作工具最敏感的群體之一,彼時大多數(shù) C 端用戶還并不知道這一“黑科技”的存在,即使知道,也會因為它復(fù)雜的調(diào)試環(huán)境失去參與測試的欲望。

但之后,隨著更多 AI Art 模型和工具的成熟,門檻越來越低,越來越多 C 端用戶開始了解并使用相關(guān)的工具。

AI Art在2022年以來的熱度,是因為一種呈現(xiàn)為文字轉(zhuǎn)圖像(text-to-image)特性的嶄新交互方式,正在向大眾宣告 AI Art 正在進入一個“民主化”的時代。使用文字描述,或者基于畫面意象和故事,或者基于藝術(shù)家風(fēng)格、構(gòu)圖、色彩、透視方法等專業(yè)名詞,就能在數(shù)十秒內(nèi)生成完整的繪畫作品,這讓藝術(shù)創(chuàng)作成為了一件像跑步一樣的事:人人都會跑步,只不過是專業(yè)的人跑得更快。

還原到底層技術(shù)方面,則是一場 Diffusion 對 GAN 的徹底革新。

傳統(tǒng) AI Art 的的技術(shù)原理是生成對抗網(wǎng)絡(luò)(GAN)或 VAE 等,目前,GAN 作為上一代 AI Art 工具與平臺最主流的圖像生成模型,在模型訓(xùn)練方面已經(jīng)有了很大的突破,但在實際應(yīng)用的過程中仍然擁有嚴(yán)重的結(jié)構(gòu)性問題。

隨著熱度升溫,可能會取而代之的是 Diffusion。Denoising Diffusion Models(去躁擴散模型)作為一種基于分?jǐn)?shù)的生成模型,是一種非常強大的新型生成模型。其工作原理就是通過反復(fù)地向訓(xùn)練數(shù)據(jù)添加高斯噪聲來破壞訓(xùn)練數(shù)據(jù),然后通過反轉(zhuǎn)添加噪聲的過程來學(xué)習(xí)如何取回數(shù)據(jù)。Diffusion 還提供大量樣本多樣性和學(xué)習(xí)數(shù)據(jù)分布的準(zhǔn)確模式覆蓋,這意味著 Diffusion 適用于具有大量不同和復(fù)雜數(shù)據(jù)的學(xué)習(xí)模型,從而解決了 GAN 的問題。Diffusion 緩慢改變輸入數(shù)據(jù)將數(shù)據(jù)映射到噪聲的正向變換,通過學(xué)習(xí)的、參數(shù)化的反向過程來完成數(shù)據(jù)生成。該過程從隨機噪聲開始,一次一步地進行清理。

圖源網(wǎng)絡(luò)

Diffusion 對圖像生成效果的提升十分顯著,數(shù)字生成的痕跡也得到了有效削弱,用戶自己可選執(zhí)行步數(shù),步數(shù)越多圖像越精細的特點也激起了更多的“硬核”需求。

Diffusion 對圖像生成步驟

這也就是為什么 AI Art 工具其實從很早之前就有了,但此前的圖像效果經(jīng)常會有“太假”或者不夠完整等種種問題,甚至不如直接用 Photoshop 做一些風(fēng)格化處理,因此這些作品也就失去了如今 Diffusion 時代作為藝術(shù)品的收藏與分享價值。

通過指數(shù)級爆發(fā)的帖子和作品展示,以 Disco Diffusion、Stable Diffusion、DALL-E2、MidJourney 這些算法和工具為代表的生成器,已經(jīng)成為了 AI 生成向 C 端落地、以及更廣闊的元宇宙世界的先發(fā)力量。

4 月,DALLE2 被推出

DALLE2 可以從自然語言的描述中創(chuàng)建逼真的圖像和藝術(shù),上線于 2022 年 4 月 6 日,由 OpenAI 開發(fā)。

OpenAI 在四月份推出了 DALL-E 2,DALLE2 可以從自然語言的描述中創(chuàng)建逼真的圖像和藝術(shù),超過 150 萬用戶測試了這個模型,2022年 9 月,公司將它推向了市場。

微軟為 OpenAI 提供資金,以換取其作品的獨家商業(yè)版權(quán),并將該模式整合到 Azure AI-as-a-service 平臺中。

8 月,Stability Diffusion 上線

作為解決了 DiscoDifusion 的技術(shù)痛點的追隨者,Stability AI 也加大了賭注,于 8 月 22 日上線。并推出了開源的擴散模型(Stable Diffusion)。

StabilityAI 是一家創(chuàng)立于 2019 年的人工智能初創(chuàng)公司,總部位于倫敦,致力于構(gòu)建以 AI 為技術(shù)載體的解決方案。

Stable Diffusion 是時下最先鋒、也是最流行的 AI 繪畫機器學(xué)習(xí)模型,由 StabilityAI 開發(fā),Web 演示版本搭載于 AI 開源社區(qū) Huggingface。Stable Diffusion 的預(yù)訓(xùn)練模型是一個文本至圖像的 AI 模型。根據(jù)文本提示,Stable Diffusion 能夠生成逼真的 512x512 像素的圖像以描述提示中的場景。

在模型權(quán)重公開發(fā)布之前,它的代碼已經(jīng)發(fā)布,模型權(quán)重也有限發(fā)布給了研究社區(qū)。在最新的版本中,任何用戶都可以在消費者級別的硬件中下載并運行 Stable Diffusion。除了文本至圖像的生成,該模型還支持圖像至圖像的風(fēng)格轉(zhuǎn)換以及圖像質(zhì)量提升。在發(fā)布該版本的同時,Stable AI 還發(fā)布了 beta 版本的 API 以及模型的 Web UI,名為 DreamStudio。

Stable Diffusion 基于名為潛在擴散模型(latent diffusion models,LDMs)的圖像生成技術(shù)。與其他的流行的圖像合成方法不同,如生成對抗網(wǎng)絡(luò)(generative adversarial networks,GANs)和 DALL-E 使用的自動回歸技術(shù),LDMs 通過在一個潛在表示空間中迭代“去噪”數(shù)據(jù)來生成圖像,然后將表示結(jié)果解碼為完整的圖像。

LDM 是由 Ludwig Maximilian University of Munich 的機器視覺與學(xué)習(xí)(Machine Vision and Learning)研究組開發(fā)的,并在最近的 IEEE / CVF 計算機視覺和模式識別會議(Computer Vision and Pattern Recognition Conference)上發(fā)表的一篇論文中進行了闡述。在2022年早些時候,InfoQ 曾經(jīng)報道過 Google 的 Imagen 模型,它是另一個基于擴散的圖像生成 AI。

Stable Diffusion 模型支持多種操作。與 DALL-E 類似,它能夠根據(jù)所需圖像的文本描述,生成符合匹配該描述的高質(zhì)量圖像。它還可以根據(jù)一個簡單的草圖再加上所需圖像的文本描述,生成一個看起來更逼真的圖像。

Meta AI 也發(fā)布了名為 Make-A-Scene 的模型,具有類似的圖像至圖像的功能。

10 月 18 日,Stability AI 融資成為獨角獸,更掀起熱潮

10 月 18 日,在上線不足兩月的時間里,StabilityAI 獲得由在 Coatue 和 Lightspeed Venture Partners 領(lǐng)投的 1.01 億美元融資,投后估值超過 10 億美元。

上線兩個月就成為獨角獸,足以見得市場對于 StabilityAI 以及 AI 作畫的認可。這也引發(fā)了一級市場對于 AI 作畫的強關(guān)注。

同樣在 10 月,微軟開始將由 DALLE2 提供支持的生成人工智能技術(shù),集成到其 Bing 搜索引擎、Edge 瀏覽器和新的
MicrosoftDesignerforOffice。

2022 年的商業(yè)化進展:欲速則不達

由于 AI Art 在受到越來越多關(guān)注的同時,開發(fā)門檻越來越低,全球范圍內(nèi) AI Art 的創(chuàng)業(yè)公司和產(chǎn)品也在 10 月、11 月密集出現(xiàn)。

在 11 月初打開 Product Hunt(一個發(fā)現(xiàn)新產(chǎn)品的平臺,開發(fā)者可以提交自己的產(chǎn)品,網(wǎng)站會依據(jù)大眾的投票數(shù)量產(chǎn)生每日榜單),會發(fā)現(xiàn)每天都有新的 AI 作畫產(chǎn)品上線,并且這些 AI 作畫產(chǎn)品,都在每天榜單的前幾名。

2022 年 11 月 3 號,Product Hunt 榜單第一名就是 AI 作畫產(chǎn)品

2022 年 11 月 2 號,Product Hunt 第二名是需要付費的 AI 作畫產(chǎn)品

其中,Avatar AI 推出 10 天以來,銷售額已經(jīng)突破 10 萬美元(銷量為 2943,平均售價 33 美元)。

Avatar AI 銷售額

不僅美國如此,在中國也是這樣,盜夢師、無界、皮卡智能、TIAMAT 等也在 10~11 月里受到了廣泛關(guān)注,盜夢師小程序甚至達到了日增 5 萬用戶的規(guī)模。

層出不窮的 AI 作畫產(chǎn)品背后,是全球從業(yè)者和 C 端群眾對于新技術(shù)的好奇和熱捧。從 Google Trends 和百度指數(shù)上,在 10 月 AI 作畫搜索指數(shù)的暴漲,就可見一斑。

Google Trends 美國區(qū)“AI Art”熱度

AI Art,火燒得太快、來得太突然,法規(guī)完善、生態(tài)體系、用戶認知等等一個賽道長期發(fā)展所要具備的要素,在 AI 作畫賽道都稍顯空白,這或許會帶來商業(yè)化短期的混亂。

一類玩家,以 Avatar AI 這類產(chǎn)品為例,30 美元打包一沓頭像,固然能賺到快錢,但是如何在不傷害獵奇心理消費者的情況下保持長期商業(yè)價值是 Avatar AI 不得不考慮的問題。

另一類玩家,不以收費為前提,僅是提供工具免費給用戶使用,那么在早期獲得病毒式增長后,又該如何獲得收入維持后續(xù)發(fā)展?

還有一類玩家,或許并沒有明確的商業(yè)化目標(biāo),其出發(fā)點或許只是熱愛,但部分 AI Art 產(chǎn)品已經(jīng)傷害了藝術(shù)家的版權(quán),正在全球范圍內(nèi)引起相關(guān)討論。

而目前的混亂,或許是由于這個原本技術(shù)突破困難、應(yīng)該有較高門檻的行業(yè),因為開源,而變得低門檻,投機者幾乎能以零成本去“追逐風(fēng)口”。作為長期具有 ToC 價值的領(lǐng)域,開源一定程度上“放縱”了 AI Art 在商品層面的混亂。

未來,AI Art 想要獲得更長久的商業(yè)發(fā)展,需要在 C 端用戶有足夠的認知的同時,玩家探索 toB 的商業(yè)價值。

三、AI-Generated Text:基于真實需求,最有想象力的商業(yè)應(yīng)用

2023 年趨勢

  • 從當(dāng)下商業(yè)環(huán)境來看,對話式 AI 的應(yīng)用場景比其他生成式 AI 都要基礎(chǔ)和廣泛,比如和 MarTech 進一步結(jié)合,應(yīng)用于各行各業(yè)的營銷與服務(wù)環(huán)節(jié);
  • 相較于“圖像無國界”的 AI Art,在 AI 生成文字領(lǐng)域,來自語言和領(lǐng)域的差異化需求,將吸引更多技術(shù)服務(wù)商各展所長,資本加持也有望在2023年集中爆發(fā);
  • 2023 年,會出現(xiàn)更多市場亂象,比如可能會有一些營銷服務(wù)商會套上 AI 技術(shù)商的新概念以博眼球、求客戶、騙融資。

LaMDA:當(dāng) AI 有了意識,搜索引擎也可以“說人話”

2022年 6 月,Google 的一名工程師聲稱 LaMDA 可能有自己的感覺,可能“還隱藏著一個感知的心靈”。這讓 LaMDA 一度陷入爭議。

LaMDA 在 2021 年 I/O 大會上首次亮相,是 Google“迄今為止最先進的對話式人工智能”,即與2022年 12 月紅遍全球的 ChatGPT 有著相同的語言模型技術(shù)和原生應(yīng)用場景。2022 年 5 月 11 日,Google 在 2022 年 I/O 大會上公布了 LaMDA2。作為 Google 一直在研究的最先進的大數(shù)據(jù)模型之一,與 GPT-3 不同的是,LaMDA 沒有被配置為執(zhí)行任何特定任務(wù),LaMDA 是“對話訓(xùn)練”,本質(zhì)上是一個以聊天機器人為導(dǎo)向的 LLMs。

在引起了不少社會上的討論后,Google 回應(yīng)到:LaMDA 和公司近幾年的大型 AI 項目一樣,都經(jīng)過了多次嚴(yán)格的 AI 道德方面的審核,對其內(nèi)容、質(zhì)量、系統(tǒng)安全性等進行了多方面的考量。

2022年早些時候,Google 也專門發(fā)表了一篇論文,公開了 LaMDA 開發(fā)過程當(dāng)中的合規(guī)細節(jié)。其中提到,“在 AI 群體內(nèi),對于具備感知的 AI/通用 AI 的長期可能性,確實有一些研究。然而在今天把對話模型來擬人化,這樣做是沒有意義的,因為這些模型是沒有知覺的。不過,這些系統(tǒng)能夠基于數(shù)以百萬計的句子來模仿交流的方式,并且在任何有趣的話題上都能夠扯出有意思的內(nèi)容?!?/p>

在 ChatGPT 趕在 2023 年到來之前意料之外地迅速爆發(fā)之后,LaMDA 只能以其競爭對手的形式在市場上被動出現(xiàn)。正如在另一個 AI 賽道內(nèi),Google 強大的 AI Art 模型 DreamBooth,也是幾乎在 Stability AI 獲得融資成為獨角獸的前夕,才以一個定制化編碼功能更強大的標(biāo)準(zhǔn)曝光在公眾視野之下。同樣,從技術(shù)上來說,LaMDA 被認為擁有“對抗 ChatGPT 所需的一切”。

在一些投資人與用戶高呼 ChatGPT 能夠“殺死傳統(tǒng)搜索引擎”之后,另一群人寄托在 LaMDA 身上的希望,情節(jié)變得更加跌宕起伏。

Google 和 OpenAI 都是全球久負盛名的 AI 夢工廠,區(qū)別是前者成為科技巨頭已久,且在壟斷用戶搜索查詢流量的同時,也主導(dǎo)了多個 AI 生成賽道的誕生和迭代。而后者則在2022年連續(xù)推出了 DALLE2 和 ChatGPT 兩個現(xiàn)象級生成式 AI 工具,未來幾年內(nèi)有望做出最龐大的 AI 生成平臺。

因此,LaMDA 和 ChatGPT 的競爭更有可能是生態(tài)級別的。拋開前文所討論的人工智能恐怖谷、科技倫理學(xué)等問題,從長期來看,作為“巨頭之子”,LaMDA 的機會很可能集中在以下幾點:

首先,“打敗 Google 的,只可能是 Google”。就像社交帝國騰訊用微信“打敗”了 QQ 一樣,Google 幾十年來在搜索引擎領(lǐng)域的絕對話語權(quán),使其在對話式 AI 在搜索領(lǐng)域的應(yīng)用上,也具有不可撼動的優(yōu)勢。

目前,Google 在搜索引擎中使用 Featured Snippets(精選片段)為用戶的問題引用答案,這是其商業(yè)化手段之一,也是廣受用戶詬病的一點。

相比來說,ChatGPT 之所以被列入“殺死 Google 搜索”的候補名單,是因為其擅長為更復(fù)雜、更完整的問題生成答案,同時不會像 Google 一樣試圖將用戶引導(dǎo)到其他頁面,提供了更清爽的用戶體驗。但極致的用戶體驗有些時候也會成為商業(yè)化的阻礙,由于對話式 AI 中的“競價廣告”可能要比 Google 的 SEO 要隱蔽得多,且不直接顯示數(shù)據(jù)引用來源的 AI 表面上無需對搜索結(jié)果負責(zé),因此潛在威脅也是可想而知的。

前兩天,全球最大產(chǎn)品發(fā)現(xiàn)社區(qū) ProductHunt 上已經(jīng)出現(xiàn)了導(dǎo)購項目,專門收集 ChatGPT 回答的“某一分類下最好的品牌”。如果對話式 AI 未來更加泛濫地應(yīng)用于品牌營銷,或者商家發(fā)明出一套規(guī)則能讓自己的品牌名更多地被 AI 模型抓取,它的內(nèi)容可信度會不會成為曇花一現(xiàn)呢?如果堅持“真實”和“專業(yè)”,又怎樣實現(xiàn)在搜索領(lǐng)域的變現(xiàn)?

在這個問題上,LaMDA 和 ChatGPT 面對的商業(yè)化難題是一樣的,但毫無疑問作為搜索巨頭的 Google,會有更完善的解決方案。

其二,MUM(Multitask Unified Model,多任務(wù)統(tǒng)一模型)、PaLM(路徑語言模型)等其他 Google 自研 AI 模型的支持和集成。ChatGPT 之所以現(xiàn)在看起來更像是一個工具或者“寫郵件神器”,是因為技術(shù)和模型已經(jīng)是時下最先進的了,服務(wù)和體驗卻仍然是單點維度的,距離生態(tài)利器還有很長的路要走。

而在這一點上,Google 已經(jīng)有所考慮。比如,除了 LaMDA 之外,Google 還強調(diào)了 MUM 的重要性。多模式模型允許人們“跨不同類型的信息進行提問”,也就是說,將圖片、音頻、視頻等媒介形式結(jié)合文字來提問。

Google 提供的一個搜索示例:用戶給自己的登山靴拍了張照片,問“我可以穿這個登富士山嗎?”MUM 則能夠通過理解圖像等內(nèi)容和查詢背后的意圖進行判斷,并推薦裝備列表和博客文章。

目前,Google 已經(jīng)將 MUM 技術(shù)添加到了 Google Lens,后者為 Google 推出的一款支持圖片對象檢索的現(xiàn)實搜索應(yīng)用。

總體來說,在 LaMDA 始終位于技術(shù)前列的情況下,至少在搜索和對話式領(lǐng)域,Google 將比一切競爭對手都更接近產(chǎn)品化和商業(yè)化。

其實,AI 自然對話的能力基于對人類說話口吻的模仿,本就是為了讓信息和計算從根本上更易于被人們訪問和使用,這種軟性提效與工業(yè)硬件升級等硬性提效的最大區(qū)別,就是它與人類的行為和語言體系是一種寄生關(guān)系。換句話說,不具備商業(yè)能力的 AI 模型代表著長期投入能力差,缺少時效性價值,從而損害“搜索”的核心價值。

早在2022年 5 月份,Google CEO Sundar Pichai 就重申了對話式自然語言處理的最大價值是“數(shù)字民主化”。至少在研發(fā)轉(zhuǎn)產(chǎn)品的目標(biāo)上,LaMDA 比2022年大多數(shù)生成式 AI 工具都要明確,那就是讓 Google 搜索未來能夠像人類一樣回答問題。

“倉促行事對于搜索領(lǐng)域來說似乎并不明智,因為世界需要始終如一的正確?!?/p>

OpenAI 的 chatGPT 引起全球狂熱

11 月 30 日,人工智能實驗室 OpenAI 發(fā)布了自研的聊天機器人——ChatGPT,它比其他任何可供公眾互動的聊天機器人都要先進,在聊天外,可以當(dāng)成搜索引擎、論文生成器、代碼生成器、翻譯等多個實用角色,成為人類的生活工作助手。

其價值被廣泛認可,上線 5 天后,注冊人數(shù)突破百萬,而到達這個數(shù)字,推特用了兩年。

因為 ChatGPT 的火爆,OpenAI 在大語言訓(xùn)練模型領(lǐng)域的積累也逐漸被看到——ChatGPT采用最新的GPT3.5模型,模型中首次采用 RLHF(從人類反饋中強化學(xué)習(xí))方式。

OpenAI 最初于 2017 年提出的 GPT1,其采取的是生成式預(yù)訓(xùn)練 Transform 模型(一種采用自注意力機制的深度學(xué)習(xí)模型)。GPT1 的方法包含預(yù)訓(xùn)練和微調(diào)兩個階段,預(yù)訓(xùn)練遵循的是語言模型的目標(biāo),微調(diào)過程遵循的是文本生成任務(wù)的目的。2020 年的 GPT3,訓(xùn)練參數(shù)是 GPT-2 的 10 倍以上,給 GPT 訓(xùn)練讀過文字和句子后可接續(xù)問題的能力,同時包含了更為廣泛的主題。

圖源:Medium GPT 系列模型的數(shù)據(jù)集訓(xùn)練規(guī)模

現(xiàn)在的 ChatGPT 則是由效果比 GPT3 更強大的 GPT-3.5 系列模型提供支持,這些模型使用微軟 Azure AI 超級計算基礎(chǔ)設(shè)施上的文本和代碼數(shù)據(jù)進行訓(xùn)練。

具體來說,ChatGPT 在一個開源數(shù)據(jù)集上進行訓(xùn)練,訓(xùn)練參數(shù)也是前代 GPT3 的 10 倍以上,還多引入了兩項功能:人工標(biāo)注數(shù)據(jù)和強化學(xué)習(xí),相當(dāng)于拿回了被 GPT3 去掉的微調(diào)步驟,實現(xiàn)了在與人類互動時從反饋中強化學(xué)習(xí)。

ChatGPT 自己回答與前代 GPT3 的能力區(qū)別

盡管目前 ChatGPT 還存在很多語言模型中常見的局限性和不準(zhǔn)確問題,但毋庸置疑的是,其在語言識別、判斷和交互層面存在巨大優(yōu)勢。

Notion AI:一個更加 AGI 的可能性

2022年 11 月,全球獨角獸 Notion 發(fā)布了 Notion AI 的 Alpha 版本,這也是知識管理工具與生成式 AI 工具的進一步結(jié)合。

從功能上來說,Notion AI 與 ChatGPT、Jasper 等工具類似,都是根植于 LLM 在2022年的技術(shù)爆發(fā),服務(wù)于 text-to-text 應(yīng)用下的重復(fù)性或創(chuàng)造性寫作。而從應(yīng)用環(huán)境來看,Notion AI 的創(chuàng)新性在于,它完全融合于 Notion 文檔內(nèi)部,這也就意味著人工智能協(xié)作又少了一步“冷啟動”的時間。

圖片來自 Notion AI 官網(wǎng)

圖片來自 Notion AI 官網(wǎng),可以看出,Notion 用戶在文檔中輸入“/”(也是 Notion 區(qū)塊式筆記的基礎(chǔ)基礎(chǔ)邏輯)即可調(diào)用不同功能的 Notion AI,包括 Continue writing(續(xù)寫)、Help me write(text-to-text 生成內(nèi)容)、Brainstorm ideas(列出 bullet points)等。在功能定位上,Notion 將 AI 列為了寫作助手的角色,比起 ChatGPT 更加接近 Grammarly。

其實,無論是 ChatGPT 還是 Notion AI,目前為止都還沒有辦法直接生成一篇原創(chuàng)且可發(fā)表的內(nèi)容,但它們能夠很好地幫助用戶“跳過初稿階段”,直接進入對文字的改進和完善階段。與此同時,所有 LLM 的應(yīng)用工具都在迅速改進,使得語義理解能夠從句子到段落,再到邏輯關(guān)系更加復(fù)雜的語境,從而更好地理解和編寫各種文本。

Notion AI 的機會有三點:

第一,Notion 的平臺特性能夠與 LLM 的技術(shù)特性更好地融合。眾所周知,目前的生成式 AI 最需要的就是更多更詳細的語境。在我們使用 ChatGPT 的時候,得到的文字內(nèi)容經(jīng)常會以“由于沒有更詳細的數(shù)據(jù)支持,我只能嘗試?yán)斫庑枨蟆敝惖穆暶髯鳛殚_頭。

而作為一個綜合了筆記、項目管理等用戶個人知識內(nèi)容的 Workspace(工作區(qū)),Notion 為每位用戶存儲了大量邏輯結(jié)構(gòu)和關(guān)聯(lián)性更強的文本內(nèi)容,比 ChatGPT 等聊天式 AI 更容易獲取大量的上下文語境素材,從而實現(xiàn)更精準(zhǔn)的需求理解和對于用戶語言風(fēng)格的模仿等。

第二,Notion AI 符合生成式 AI 目前最重要的兩個競爭條件。盡管 Notion 計劃“緩慢而謹(jǐn)慎”地推出他們的 AI 工具,但由于 AI 并不是一項一勞永逸的技術(shù),其核心競爭壁壘來自于數(shù)據(jù)質(zhì)變、用戶需求理解和模型的完善性,因此用戶量和在時間上占先,對于生成式 AI 來說是非常重要的兩點。

作為數(shù)字協(xié)作領(lǐng)域的獨角獸,用戶量和 C 端口碑是 Notion 一直以來引以為傲的亮點。從入局時間來看,ChatGPT 在 11 月底引發(fā)了 AI 寫作的全球熱潮,Notion AI 與之基本同期,沒有錯過時間紅利。

第三,存在于知識庫內(nèi)部的 AI 工具有更多呈現(xiàn)形式。從應(yīng)用場景來看,以聊天機器人形式出現(xiàn)的 ChatGPT 似乎更像是一個用來展現(xiàn)技術(shù)能力的 demo,它還在尋找廣泛的領(lǐng)域場景和合作商。與之相比,Notion 在協(xié)作領(lǐng)域的巨大影響力,則已經(jīng)為 Notion AI 注腳好了未來的可能性。在一個巨大的知識管理工作區(qū)內(nèi)部,AI 除了輔助寫作的用途,還能集成搜索、連接日歷與任務(wù)管理、回答用戶的問題并粘貼知識庫中的信息等。

用 Notion AI 生成表格

綜上,剛剛被“交到用戶手中”就立刻引發(fā)了熱議的 Notion AI,也讓我們重新想起了 AGI 的概念。其實,Notion 本身能夠從一眾產(chǎn)品精度做得越來越“卷”的筆記應(yīng)用中取得不可忽視的地位,并建立最龐大的第三方模版市場和社區(qū),就是基于其一體化文本協(xié)作的理念和高度集成性。

四、Video AI:創(chuàng)業(yè)公司層出不窮

2023 年趨勢

  • 各大視頻平臺都將迭代以 AI 能力為主的集成型創(chuàng)作平臺,或?qū)⒊霈F(xiàn)視頻制作或動畫領(lǐng)域的爆款,在低門檻用戶群中挑戰(zhàn) After Effects 的權(quán)威;
  • 創(chuàng)投領(lǐng)域,videoAI 在2022年獲得非常多一級市場的關(guān)注,因為目前并未跑出獨角獸且商業(yè)前景明晰,因此,2023 年該領(lǐng)域會延續(xù)一級市場的熱度;
  • 2023 年,text-to-video 的 AI 生成技術(shù)不一定能成熟到支持低成本的 C 端應(yīng)用,因此可能會涉及到投資回報期更長的問題。

雖然文本到圖像的生成式 AI 是2022年 AI 領(lǐng)域的最大新聞之一,但“文本到視頻”無疑將會接班成為 2023 年的新技術(shù)焦點。目前,在 AI 視頻領(lǐng)域,捕捉遠程依賴關(guān)系等決定性的技術(shù)仍具有挑戰(zhàn)性,但 AI 視頻在2022年年底已經(jīng)實現(xiàn)了對于部分短視頻的覆蓋。2023年,也許“我們將無法區(qū)分視頻是由人還是 AI 生成的。”

此外,2022年以來,生成式 AI 在影音技術(shù)方面的應(yīng)用,也越來越詳細地描述著元宇宙將如何出現(xiàn)。雖然在 C 端沒有出現(xiàn)像 Stable Diffusion 和 ChatGPT 一樣現(xiàn)象級的工具,且各 AI Art 廠家圍繞 text-to-video 所做的布局,常常被看作是 text-to-image 的形態(tài)拓展,但在各類短視頻、長視頻占據(jù)用戶大量時間的互聯(lián)網(wǎng)環(huán)境下,AI 視頻工具的商業(yè)化路徑也要比前者清晰得多,比如應(yīng)用在營銷等領(lǐng)域。

雖然制作最好的視頻總是需要創(chuàng)造力和人性化的觸覺,但人工智能軟件可以用來減少處理所占用的大量時間。

也因此,不少 Video AI 賽道的公司在2022年獲得一級市場的關(guān)注。

2 月,以色列 AI 技術(shù)研發(fā)商 Hour One 宣布完成 2000 萬美元 A 輪融資,該公司計劃利用這筆資金擴大其自助服務(wù)平臺 Reals,允許企業(yè)在幾分鐘內(nèi)從文本中自動創(chuàng)建以人為主導(dǎo)的視頻。

10 月,Descript 宣布完成了由 OpenAI 領(lǐng)投的新一輪融資,估值達到了 5.5 億美金。Descript 是一家音頻轉(zhuǎn)錄編輯器,會將音頻轉(zhuǎn)錄下來的文字放到 Word 文檔中,然后編輯人員或音頻制作人可以像修文檔一樣剪輯音頻。

12 月,圖片和視頻 AI 編輯軟件提供商 runway 完成 5000 萬美元 C 輪融資,投后估值達到 5 億美元。

同樣在 12 月,家視頻搜索和分析云基礎(chǔ)設(shè)施提供商 Twelve Labs 宣布獲 1200 萬美元種子輪追加融資,該公司推出一套云原生 API,可與該公司的人工智能視頻搜索工具集成,使開發(fā)人員能夠?qū)A恳曨l進行搜索。

不過,拋去對于技術(shù)層在2023年能夠?qū)崿F(xiàn)爆發(fā)的樂觀預(yù)期,如果基于文本的視頻生成模型仍然需要 1-2 年才能達到以假亂真的效果,那么此類模型也許需要 2-3 年才能在商業(yè)應(yīng)用和企服領(lǐng)域真正發(fā)揮作用。在此之前,這些模型可能適用于對保真度和可控性要求較低的場景,如 C 端用戶在娛樂創(chuàng)作平臺上的獵奇式創(chuàng)作。

五、AI Coding:開始小規(guī)模應(yīng)用

2023 年趨勢

  • 科技互聯(lián)網(wǎng)巨頭的 AI 編碼占比增加,因此巨頭孵化的項目會增多,進而開放給中小公司使用。
  • 創(chuàng)投視角來看,AI 編程或許沒有投資前景,但是如 AI 代碼糾錯、優(yōu)化等細分領(lǐng)域,或許會涌現(xiàn)針對垂直行業(yè)的創(chuàng)業(yè)公司。
  • AI coding 的最大競爭對手是無代碼產(chǎn)品,二者可能會在 2023 年開始搶占市場。

當(dāng)今世界,毫無疑問不僅僅由物理世界組成,由代碼組成的互聯(lián)網(wǎng)世界已經(jīng)成為人類賴以生存的世界之一,這從中美等各個國家互聯(lián)網(wǎng)公司位列前沿的市值可見一斑。

因此,AI 編寫代碼也被傾注了最大的期望。

AI 對工業(yè)的“妄圖染指”,開啟了 AI 在良莠不齊的生產(chǎn)環(huán)境中漫長的應(yīng)用過程,而這也是 AI 回報周期過長的原因之一。由于人類只能從已經(jīng)存在的歷史中去提煉參照系,在被稱為“信息革命”、“數(shù)字革命”的新世紀(jì)洪流中,代碼一直以來所對應(yīng)的就是像蒸汽、電力一樣的工業(yè)生產(chǎn)力新單位。

不過,與以往不同,開發(fā)在科技世界的構(gòu)建中比以往的工人取得了更高的地位和經(jīng)濟話語權(quán)。隨著數(shù)字經(jīng)濟的發(fā)展,編程人才逐漸被細化到各行各業(yè)、各個技術(shù)體系中去,從價值層級來分,他們的工作也可以被拆分為創(chuàng)造和解決需求兩個部分。

近年來,隨著科技門檻一再降級,每當(dāng)有 CRM、無代碼等看似“反程序員價值”的產(chǎn)品出現(xiàn),人們就會熱議“程序員的工作很快就要被替代了”。2022年跟隨 LLM 掀起水花的 AI Coding 也是同理。

在過去,這種“不再被需要”也許只是一種烏托邦式的幻想或自嘲,大多數(shù)人都明白,更多的數(shù)字生產(chǎn)力被解放,就會有更多的創(chuàng)造導(dǎo)向型領(lǐng)域出現(xiàn)人才缺口??芍钡?022年,飄蕩在全球互聯(lián)網(wǎng)上空的裁員危機,似乎是在倒逼著這一口號重新回到了從業(yè)者的焦慮范圍內(nèi)。

AI Coding 則正是在這種情況下開始小規(guī)模地應(yīng)用于業(yè)界。

2022年 2 月,DeepMind 推出了 AlphaCode,這是一款用 12 種編程語言對 8600 萬個程序進行預(yù)訓(xùn)練的 Transformer,并針對編碼競賽的內(nèi)容進行了微調(diào)。

通過推理,它產(chǎn)生了一百萬種可能的解決方案,并過濾掉了不佳的解決方案。通過這種方式,它在 10 次編程競賽中擊敗了一半以上的參賽者。

6 月,GitHub 開放了 Copilot 的訪問權(quán)限,這是一個能夠?qū)崟r提供代碼建議的自動完成系統(tǒng)。雖然學(xué)生和經(jīng)過驗證的開源開發(fā)者可以免費訪問,但用戶需要支付訂閱費。

11 月,“萬能助手”chatGPT 出現(xiàn),不少用戶開始嘗試用 chatGPT 編寫代碼。像簡單的 shell 腳本,makefile 等,ChatGPT 確實能處理,但更復(fù)雜的編程需求,chatGPT 會給出錯誤答案。開發(fā)者可以把 AI 生成的代碼拿來進行修改,以節(jié)省時間。

但同時,AI coding 的隱患也在隨著技術(shù)門檻降低而攀升。

The Register 的一份報告顯示,斯坦福大學(xué)計算機科學(xué)家發(fā)現(xiàn),與完全靠自己做事的程序員相比,使用 Github Copilot 等人工智能編碼工具的程序員創(chuàng)建的代碼安全性較低。

除了已經(jīng)暴露出的版權(quán)問題、安全隱患之外,AI 編程還有很多已知或未知的痛點,比如提高了人才篩選難度,

比起 AI Art、AI 寫作等領(lǐng)域,AI 編程主要有如下三個特點:

1. 其應(yīng)用環(huán)境往往不是 C 端用戶的獵奇心理和“科技民主化”的目的,而是用于實際的工作項目中,準(zhǔn)確性要求更高,對版權(quán)等商業(yè)信息更敏感;

2. 編寫結(jié)果可能會涉及到復(fù)雜的函數(shù),無法像 AI Art 一樣讓任何人都能夠以肉眼判斷,有較大的應(yīng)用和試錯成本;

3. 編程本身可以說是一個比較龐大復(fù)雜的母領(lǐng)域,而是多個語言領(lǐng)域的泛概念,因此所針對的領(lǐng)域、需求和實現(xiàn)難度也不同。

這些特點決定了 AI Coding 在短期內(nèi)會更多地用于科技巨頭的內(nèi)部構(gòu)建,并且由于代碼是這些公司的主要商業(yè)資產(chǎn),其內(nèi)部孵化或投資的項目,可能并不會被競爭對手所接受。雖然目前以 DeepMind 為代表的頭部服務(wù)商呼聲很高,但 AI Coding 本質(zhì)來說也并不是一件具有技術(shù)壁壘的事,大公司各筑城池的局面不難想象。

此外,由于 AI Coding 和無碼化趨勢的現(xiàn)階段目的,同樣都是為企業(yè)的 IT 部門解放生產(chǎn)力,其對于大多數(shù)業(yè)務(wù)類型的公司來說,降本增效的空間也難免會被進行對比。AI Coding 雖然是自動生成代碼,但其商業(yè)邏輯也是主要服務(wù)于程序員,目前還很難做到離開“人腦”工作。就像 AI Art 在熱潮退去之后,也會逐漸成為藝術(shù)家等專業(yè)人員的靈感工具一樣。

但其降本矛盾在于,如果是 freelancer 或獨立開發(fā)者,AI Coding 工具毫無疑問能夠幫助他們提高效率,但大多數(shù)程序員作為企業(yè)員工,可能自身并不會愿意被“人工智能”間接降薪。但從長期來看,隨著數(shù)字經(jīng)濟下的編程基礎(chǔ)教育進一步完善,各類開發(fā)工程師的分工也趨于細化,屆時 AI Coding 將大有可為。只不過,這一點希冀很難惠及到即將到來的 2023 年。

相比來說,無碼化工具的出現(xiàn)則是為了解構(gòu)程序員的價值和工作屬性。畢竟在程序員普遍“高薪”的情況下,在同一個業(yè)務(wù)需求下,把程序員換成業(yè)務(wù)運營人員,至少在人力方面就已經(jīng)做到了降本。

不過,好消息是,2022 年的最后一個季度,AlphaCode 等 AI 編碼工具似乎遭受了前所未有的業(yè)界爭議。在科技和創(chuàng)投界,法律、商業(yè)、社會道德對于新生事物的爭議通常代表著希望,雖然 AI 編碼在2023年也不可能直接代替那些“螺絲釘型”碼農(nóng),但大面積的智能優(yōu)化代碼服務(wù),可能會成為另一個企業(yè)服務(wù)的熱點。

六、LLM:作為底層技術(shù),沒有巨頭缺席

沒有一家巨頭缺席 LLM,更加說明了 LLM 進入較為成熟的階段。

11 月 15 日,Meta 公司發(fā)布大型語言模型 Galactica,并宣稱它“可以總結(jié)學(xué)術(shù)論文,解決數(shù)學(xué)問題,生成維基百科文章,編寫科學(xué)代碼,標(biāo)記分子和蛋白質(zhì),以及更多功能。”

但上線僅 3 天,該模型就在巨大爭議中撤回。它雖然能生成一些貌似通順的學(xué)術(shù)文本,但文本中的信息是完全錯誤的——貌似合理的化學(xué)方程,描述的是實際上并不會發(fā)生的化學(xué)反應(yīng);格式合規(guī)的引文參考的是子虛烏有的文獻;甚而種族主義、性別歧視的觀點,也能通過模型生成的文本而被包裝成 ' 科學(xué)研究 '。

Google 于去年推出“LaMDA”(對話應(yīng)用程序語言模型)。LaMDA 是 Google 一直在研究的最先進的 LLMs 之一,與 GPT-3 不同的是,它沒有被配置為執(zhí)行任何特定任務(wù),LaMDA 是“對話訓(xùn)練”。

它本質(zhì)上是一個以聊天機器人為導(dǎo)向的 LLMs,2022年 6 月,Google 的一名工程師聲稱 LaMDA 可能有自己的感覺,可能“還隱藏著一個感知的心靈”。這讓 LaMDA 一度陷入爭議。

由于 LaMDA 仍處于封閉測試階段,只有少數(shù)用戶可以使用,因此關(guān)于它的性能幾乎沒有披露。但是 LaMDA 只有 1370 億個參數(shù),與前面討論的 GPT-3 的 1750 億個參數(shù)相差甚遠。雖然用于訓(xùn)練 LLMs 的數(shù)據(jù)量并不是其性能和準(zhǔn)確性的唯一驅(qū)動因素,特別是考慮到 GPT-3 和 LaMDA 是為不同的功能而創(chuàng)建的,但兩者中參數(shù)數(shù)量的差異確實引起了人們對 LaMDA 是否是 ChatGPT 或廣義上的 GPT-3 的有力競爭者的更大審查。

LaMDA 證明了 Google 在 LLM 競賽中并沒有完全出局。

2021 年 10 月,微軟和英偉達正式推出由 DeepSpeed 和 Megatron 驅(qū)動的 Megatron-Turing 自然語言生成模型(MT-NLG),聲稱有 5300 億參數(shù),在當(dāng)時宣傳這是訓(xùn)練的最大最強的解碼語言模型。不過在2022年并沒有取得更新的進展。

微軟在生成式 AI 方面始終參與度不低。2022年大火的 chatGPT,其背后模型 GPT3.5 就是在微軟 Azure AI 超算基礎(chǔ)設(shè)施(由英偉達 V100GPU 組成的高帶寬集群)上進行訓(xùn)練,同時微軟在考慮對 OpenAI 進行新一輪投資。

圖源網(wǎng)絡(luò)

國內(nèi),互聯(lián)網(wǎng)大廠也走在大模型訓(xùn)練的前沿,各大廠在超大規(guī)模 AI 模型訓(xùn)練的爆發(fā)主要集中在 2021 年,國內(nèi)超大模型研發(fā)雖然比國外公司晚,但是發(fā)展卻異常的迅速。在2022年,也有一些進展。

百度文心大模型已經(jīng)形成“模型層+工具與平臺層+產(chǎn)品與社區(qū)層”的整體布局,于2022年全新發(fā)布 11 個大模型,包括 5 個基礎(chǔ)大模型、1 個任務(wù)大模型、5 個行業(yè)大模型;全面升級文心大模型開發(fā)套件、文心 API;新發(fā)布和升級基于文心大模型的 2 大產(chǎn)品,AI 作畫產(chǎn)品“文心一格”和產(chǎn)業(yè)級搜索系統(tǒng)“文心百中”。

去年,阿里達摩院先后發(fā)布多個版本的多模態(tài)及語言大模型,在超大模型、低碳訓(xùn)練技術(shù)、平臺化服務(wù)、落地應(yīng)用等方面實現(xiàn)突破。其中使用 512 卡 V100 GPU 實現(xiàn)全球最大規(guī)模 10 萬億參數(shù)多模態(tài)大模型 M6,同等參數(shù)規(guī)模能耗僅為此前業(yè)界標(biāo)桿的 1%,極大降低大模型訓(xùn)練門檻。2022年 9 月,阿里巴巴 fault 最新「通義」大模型系列,其打造了國內(nèi)首個 AI 統(tǒng)一底座,并構(gòu)建了通用與專業(yè)模型協(xié)同的層次化人工智能體系。

近年來,大型語言模型的參數(shù)數(shù)量保持著指數(shù)增長勢頭。據(jù)預(yù)測,OpenAI 開發(fā)中的最新大型語言模型 GPT-4 將包含約 100 萬億的參數(shù),與人腦的突觸在同一數(shù)量級。由此,出現(xiàn)了一個新的人工智能口號:' 規(guī)模就是一切 '。

大數(shù)據(jù)模型花銷

七、結(jié)語:商業(yè)化,生成式 AI 在 2023 年最大的課題

在生成式 AI 技術(shù)取得突破性進展、應(yīng)用井噴式出現(xiàn)、用戶與其距離越來越近的 2022,我們不得不關(guān)心,GA 到底是未來 AI 進入人類生活的開始,還是如此前一樣曇花一現(xiàn)。

目前,不少人對生成式 AI 的質(zhì)疑主要在以下幾點

1、現(xiàn)在 AI 的生成內(nèi)容大多數(shù)還達不到直接商用的標(biāo)準(zhǔn),仍然需要大量的模型微調(diào),以及人的行業(yè)經(jīng)驗的輔助、補充、加工。

2、AI 生成控制方式相對普通人來說,還有一定門檻。

3、AI 的生成結(jié)果在版權(quán)方面存在模糊性。

4、行業(yè)過熱,會導(dǎo)致不成熟的 AI 激增,良莠不齊的應(yīng)用和魚龍混雜的市場很可能會讓 C 端用戶和企業(yè)客戶失去判斷信心,同時帶來數(shù)據(jù)安全隱患。

但以上問題只能限制生成式 AI 無法在短期內(nèi)成為普惠的技術(shù),并不代表生成式 AI 沒有價值。其評判標(biāo)準(zhǔn)應(yīng)該是,AI 技術(shù)能否變現(xiàn),能否帶來商業(yè)價值,使其成為一個成熟的產(chǎn)業(yè)。

在技術(shù)方面,2023 年,更好的基礎(chǔ)模型值得期待,比如能夠以更高效或更緊湊的方式表示復(fù)雜數(shù)據(jù)的稀疏模型。它可以更快計算且需要更少的內(nèi)存來儲存,從而帶來成本上的進一步普惠化。除此之外,更精準(zhǔn)的數(shù)據(jù)收集能力也意味著在審核、消除偏見信息等方面投入更大的努力。

在2022年,技術(shù)開源盡管帶來了一些不必要的混亂,但毋庸置疑,這也讓更多原本沒有能力的開發(fā)者加入了戰(zhàn)場,加快了生成式 AI 的商業(yè)化步伐。

在目前最大的、每天更新的 AI 應(yīng)用目錄 FUTUREPEDIA 網(wǎng)站里可以發(fā)現(xiàn),目前最受關(guān)注的 AI 應(yīng)用多是文本生成和圖片生成相關(guān)的應(yīng)用。這和2022年的風(fēng)口趨勢一致。

36氪截圖于2022年12月底

但同時我們也注意到,在文本和圖像之外,最受關(guān)注的 AI 應(yīng)用,是市場營銷工具。如果說文本、圖像應(yīng)用是普適的、不對 toBtoC 進行區(qū)分的應(yīng)用方向,那么市場營銷是商業(yè)價值更加明確的 toB 方向。

FUTUREPEDIA 營銷方面的應(yīng)用

或許我們可以判斷,生成式 AI 接下來一年的商業(yè)化進展,將有三條路:

一,成為用戶量足夠大的 C 端工具,如 Google,依靠流量賺錢;

二,成為足夠好用的細分工具,如 Adobe,靠特定人群的固定需求賺錢;

三,成為特定賽道的企業(yè)服務(wù)軟件,比如服務(wù)營銷、開發(fā)等需求量極大的賽道。

無論是哪條路,在2022年都已有雛形和早期沉淀。

時間不對

是不是商業(yè)化應(yīng)用沒有突破更準(zhǔn)確些?

這個點文章沒有證明

本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊舉報
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
2023年讓人驚艷的10個ChatGPT替代品 這些AI聊天機器人值得收藏
ChatGPT背后:一個天才、百億融資和1億月活|全球獨角獸
ChatGPT vs Bard:有什么區(qū)別?
人工智能的80年進化編年史:從想象到現(xiàn)實
人工智能和ChatGPT深度學(xué)習(xí)資源列表
萬字長文:LLM - 大語言模型發(fā)展簡史
更多類似文章 >>
生活服務(wù)
熱點新聞
分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!

聯(lián)系客服