韩国美女免费视频看高清,美女视频是黄的免费是黄的,美女视频福利在线

2022 年的熱門詞匯有什么？AIGC 當(dāng)之無愧位列其中，甚至將名列前茅。

從 5 月的 Disco Diffusion 和 DALLE2 引起的 AI 作畫潮流，到 11 月的 chatGPT 在一周內(nèi)完成了百萬用戶注冊，期間海內(nèi)外出現(xiàn)了無數(shù)個 AIGC 的產(chǎn)品和創(chuàng)業(yè)公司，共同掀起了 AI 創(chuàng)作的熱潮。

不得不說，在整個 AIGC 浪潮中，美國一直主導(dǎo)著技術(shù)，并將其開源；中國的產(chǎn)品和技術(shù)更多在跟隨美國的步伐。其實，AIGC 的概念也來自于中國本土——在美國，更常見的說法是Generative AI，即生成式AI。

其實，AIGC 是 Generative AI 的子集。因此在本文中，我們將用 GA 來統(tǒng)稱這一年的生成式 AI 的進展。

AI 領(lǐng)域還有一個名詞叫做 AGI（通用人工智能），可以被理解為一個強人工智能的終極目標(biāo)，其目的是系統(tǒng)性地解決方案，執(zhí)行人類能夠完成的“任何”任務(wù)。而想要實現(xiàn) AGI，生成式 AI 是不可或缺的一步?；蛘哒f，當(dāng)下人類最有可能接近創(chuàng)造 AGI 的方式，就是將一個個碎片化的生成式 AI 能力，集成在一個智能平臺上，來模擬 AI 的智力和高度適應(yīng)性。

AGI 早在幾十年前的科幻作品中就已經(jīng)有了很多不同的展現(xiàn)形式，其共同的特點是有著強大的自然語言理解（NLU）能力，這就是今天掀起生成式 AI 風(fēng)浪的主要技術(shù)。

其實，AIGC 也好，生成式 AI 也好，雖然是在今2022年獲得關(guān)注，但并不是2022年才出現(xiàn)的。

底層技術(shù)已經(jīng)默默突破了幾年，之所以生成式 AI 會在2022年出現(xiàn)在更多普羅大眾面前，歸根結(jié)底是背后的技術(shù)再上了一步臺階，可以向公眾發(fā)布以供廣泛使用。

以大語言模型（large language models，以下簡稱“LLM”）為基礎(chǔ)的 text-to-X（文本到任意）技術(shù)再在2022年有了突破性進展，分別在 text- to-image（文本到圖片）、AI-generated-text（AI 生成文字）、text-to-video（文本到視頻）、generative code（生成式代碼）等領(lǐng)域出現(xiàn)了值得全球關(guān)注的應(yīng)用。

技術(shù)在2022年取得突破性進展，并將其開源，將 AI 結(jié)果產(chǎn)出的時間大大縮短，產(chǎn)出精度更強。比如 OpenAI 所用的 GPT 技術(shù)，其 GPT1 在 2017 年就已經(jīng)出現(xiàn)，現(xiàn)在 chatGPT 所采用的 GPT3.5 則是在2022年出現(xiàn)。

盡管從 2014 年 AlphaGO 戰(zhàn)勝柯潔開始，人類對于 AI 就抱有最大的希望，此后不停出現(xiàn)“AI 元年”的說法，但過去幾年，AI 的應(yīng)用和底層技術(shù)都沒有實現(xiàn)更大的突破，這又讓大家對于 AI 心灰意冷。

到 2022 年，AI 成為生產(chǎn)工具，帶來了商業(yè)化價值，或許才終將迎來“AI 元年”。

生成式AI 2022大事年表，36氪制圖

一、創(chuàng)投：燒錢的未來，注定是少數(shù)人的游戲

在 GPT-3 發(fā)布的兩年內(nèi)，風(fēng)投資本對 AIGC 的投資增長了四倍，在 2022 年更是達到了 21 億美元。

正如前文所說，GA 底層技術(shù)的突破，創(chuàng)造出了更多細分賽道，比如 Disco Diffuison 和 Stable Diffusion 正在加快藝術(shù)創(chuàng)作的速度，copy.ai 和 Jasper 在通過 AI 完成文案寫作，Mutable.ai 和 Github Co-pilot 以 AI Coding 的方式提高編程效率。

細分賽道越多，意味著想象空間越大。而一級市場最擅長為想象空間買單。

當(dāng)然，其中一部分取得融資的公司采用的的確是時下最先鋒的 GA 模型，比如種子輪獲得 1.01 億美元的 StabilityAI，但很多獲得融資的公司，也不過是用以往的 AI 模型蹭上了熱度而已。這加大了投資人和機構(gòu)的判斷難度，自然會導(dǎo)致一級市場在短期內(nèi)，比如 2023 年的混亂。

來源：PitchBook

之所以使用最新模型的 GA 創(chuàng)業(yè)公司比例不高，除了一部分公司想要“走捷徑”直接偷換概念外，大模型的訓(xùn)練，原本就是燒錢、砸人還不一定有成效的事情。以2022年先后推出 AI Art 賽道明星項目 DALLE2 和對話式 AI 爆款的 chatGPT 的母公司 openAI 來說，其大模型 GPT1 從 2017 年就開始訓(xùn)練，直到 GPT3 出現(xiàn)才逐漸變得易用、好用。而 chatGPT 之所以風(fēng)靡全球，是因為其背后是比 GPT3 更高級的 GPT3.5。

根據(jù)公開資料，GPT-3 訓(xùn)練的僅是硬件和電力成本高達 1200 萬美元（約 7500 萬人民幣），GPT3.5 只高不少。

如此高額的投入、大量的迭代時間，顯然并不是初創(chuàng)公司能夠完成的。

這就決定了，初創(chuàng)公司只能依靠開源的模型，進行在具體應(yīng)用側(cè)的創(chuàng)新。可是這樣一來，壁壘變低，對于客戶和用戶來說，選項也變多了，那么應(yīng)用創(chuàng)新的商業(yè)價值就會變低。技術(shù)價值和商業(yè)價值都不夠的情況下，一級市場自然不會買單。

其實在 2022 年，就已經(jīng)出現(xiàn)了此類現(xiàn)象，在國內(nèi)在 AI Art 領(lǐng)域出現(xiàn)了不少用戶量大的創(chuàng)業(yè)項目，但是融資情況并不容樂觀。

2023 年或許會延續(xù) 2022 年的創(chuàng)投趨勢：創(chuàng)業(yè)項目層出不窮，但是一級市場只買單有技術(shù)壁壘和商業(yè)前景的個別項目；當(dāng)然，總體數(shù)量會比前些年更多。

GAmapping，來源 Leonis Capital 風(fēng)險投資基金

二、AI Art：從高門檻變成無門檻

2023 年趨勢

AI Art 成為越來越多應(yīng)用的“標(biāo)配”，C 端觸達門檻降低，每個用戶都可以在自己熟悉的 App 或平臺內(nèi)直接使用這項功能，與此同時，越來越普遍的 AI Art 也不會再成為核心競爭力或功能亮點；
從創(chuàng)投視角來看，由于訓(xùn)練模型的成本更低，加上服務(wù)商的涌現(xiàn)與競爭，會導(dǎo)致用戶數(shù)據(jù)和模型更分散，降低了跑出下一個獨角獸的可能性，并且導(dǎo)致 VC 很難選擇投資標(biāo)的；
從生態(tài)視角來看，將會形成更多社區(qū)，開發(fā)者、設(shè)計師、用戶將共同探索需求和趨勢，從而實現(xiàn)創(chuàng)作端的良性循環(huán)。

2 月，Disco Diffusion 開始流行，Diffusion 底層技術(shù)對 GAN 徹底革新

Disco Diffusion 是在2022年 2 月初開始流行的一個 AI 圖像生成程序，可以根據(jù)描述場景的關(guān)鍵詞渲染出對應(yīng)的圖像，可以在 Google Drive 直接運行，也可以部署到本地運行。

但在那時，人們尚未意識到，Disco Diffusion 的出現(xiàn)，是 2022 年一整年 AI Art 狂熱潮的開始。

圖為國內(nèi)最大的平面設(shè)計師社區(qū) UISDC 上首次出現(xiàn)關(guān)于 Disco Diffusion 的科普文章

上圖為國內(nèi)最大的平面設(shè)計師社區(qū) UISDC 上首次出現(xiàn)關(guān)于 Disco Diffusion 的科普文章，設(shè)計師是對圖像創(chuàng)作工具最敏感的群體之一，彼時大多數(shù) C 端用戶還并不知道這一“黑科技”的存在，即使知道，也會因為它復(fù)雜的調(diào)試環(huán)境失去參與測試的欲望。

但之后，隨著更多 AI Art 模型和工具的成熟，門檻越來越低，越來越多 C 端用戶開始了解并使用相關(guān)的工具。

AI Art在2022年以來的熱度，是因為一種呈現(xiàn)為文字轉(zhuǎn)圖像（text-to-image）特性的嶄新交互方式，正在向大眾宣告 AI Art 正在進入一個“民主化”的時代。使用文字描述，或者基于畫面意象和故事，或者基于藝術(shù)家風(fēng)格、構(gòu)圖、色彩、透視方法等專業(yè)名詞，就能在數(shù)十秒內(nèi)生成完整的繪畫作品，這讓藝術(shù)創(chuàng)作成為了一件像跑步一樣的事：人人都會跑步，只不過是專業(yè)的人跑得更快。

還原到底層技術(shù)方面，則是一場 Diffusion 對 GAN 的徹底革新。

傳統(tǒng) AI Art 的的技術(shù)原理是生成對抗網(wǎng)絡(luò)（GAN）或 VAE 等，目前，GAN 作為上一代 AI Art 工具與平臺最主流的圖像生成模型，在模型訓(xùn)練方面已經(jīng)有了很大的突破，但在實際應(yīng)用的過程中仍然擁有嚴(yán)重的結(jié)構(gòu)性問題。

隨著熱度升溫，可能會取而代之的是 Diffusion。Denoising Diffusion Models（去躁擴散模型）作為一種基于分?jǐn)?shù)的生成模型，是一種非常強大的新型生成模型。其工作原理就是通過反復(fù)地向訓(xùn)練數(shù)據(jù)添加高斯噪聲來破壞訓(xùn)練數(shù)據(jù)，然后通過反轉(zhuǎn)添加噪聲的過程來學(xué)習(xí)如何取回數(shù)據(jù)。Diffusion 還提供大量樣本多樣性和學(xué)習(xí)數(shù)據(jù)分布的準(zhǔn)確模式覆蓋，這意味著 Diffusion 適用于具有大量不同和復(fù)雜數(shù)據(jù)的學(xué)習(xí)模型，從而解決了 GAN 的問題。Diffusion 緩慢改變輸入數(shù)據(jù)將數(shù)據(jù)映射到噪聲的正向變換，通過學(xué)習(xí)的、參數(shù)化的反向過程來完成數(shù)據(jù)生成。該過程從隨機噪聲開始，一次一步地進行清理。

圖源網(wǎng)絡(luò)

Diffusion 對圖像生成效果的提升十分顯著，數(shù)字生成的痕跡也得到了有效削弱，用戶自己可選執(zhí)行步數(shù)，步數(shù)越多圖像越精細的特點也激起了更多的“硬核”需求。

Diffusion 對圖像生成步驟

這也就是為什么 AI Art 工具其實從很早之前就有了，但此前的圖像效果經(jīng)常會有“太假”或者不夠完整等種種問題，甚至不如直接用 Photoshop 做一些風(fēng)格化處理，因此這些作品也就失去了如今 Diffusion 時代作為藝術(shù)品的收藏與分享價值。

通過指數(shù)級爆發(fā)的帖子和作品展示，以 Disco Diffusion、Stable Diffusion、DALL-E2、MidJourney 這些算法和工具為代表的生成器，已經(jīng)成為了 AI 生成向 C 端落地、以及更廣闊的元宇宙世界的先發(fā)力量。

4 月，DALLE2 被推出

DALLE2 可以從自然語言的描述中創(chuàng)建逼真的圖像和藝術(shù)，上線于 2022 年 4 月 6 日，由 OpenAI 開發(fā)。

OpenAI 在四月份推出了 DALL-E 2，DALLE2 可以從自然語言的描述中創(chuàng)建逼真的圖像和藝術(shù)，超過 150 萬用戶測試了這個模型，2022年 9 月，公司將它推向了市場。

微軟為 OpenAI 提供資金，以換取其作品的獨家商業(yè)版權(quán)，并將該模式整合到 Azure AI-as-a-service 平臺中。

8 月，Stability Diffusion 上線

作為解決了 DiscoDifusion 的技術(shù)痛點的追隨者，Stability AI 也加大了賭注，于 8 月 22 日上線。并推出了開源的擴散模型（Stable Diffusion）。

StabilityAI 是一家創(chuàng)立于 2019 年的人工智能初創(chuàng)公司，總部位于倫敦，致力于構(gòu)建以 AI 為技術(shù)載體的解決方案。

Stable Diffusion 是時下最先鋒、也是最流行的 AI 繪畫機器學(xué)習(xí)模型，由 StabilityAI 開發(fā)，Web 演示版本搭載于 AI 開源社區(qū) Huggingface。Stable Diffusion 的預(yù)訓(xùn)練模型是一個文本至圖像的 AI 模型。根據(jù)文本提示，Stable Diffusion 能夠生成逼真的 512x512 像素的圖像以描述提示中的場景。

在模型權(quán)重公開發(fā)布之前，它的代碼已經(jīng)發(fā)布，模型權(quán)重也有限發(fā)布給了研究社區(qū)。在最新的版本中，任何用戶都可以在消費者級別的硬件中下載并運行 Stable Diffusion。除了文本至圖像的生成，該模型還支持圖像至圖像的風(fēng)格轉(zhuǎn)換以及圖像質(zhì)量提升。在發(fā)布該版本的同時，Stable AI 還發(fā)布了 beta 版本的 API 以及模型的 Web UI，名為 DreamStudio。

Stable Diffusion 基于名為潛在擴散模型（latent diffusion models，LDMs）的圖像生成技術(shù)。與其他的流行的圖像合成方法不同，如生成對抗網(wǎng)絡(luò)（generative adversarial networks，GANs）和 DALL-E 使用的自動回歸技術(shù)，LDMs 通過在一個潛在表示空間中迭代“去噪”數(shù)據(jù)來生成圖像，然后將表示結(jié)果解碼為完整的圖像。

LDM 是由 Ludwig Maximilian University of Munich 的機器視覺與學(xué)習(xí)（Machine Vision and Learning）研究組開發(fā)的，并在最近的 IEEE / CVF 計算機視覺和模式識別會議（Computer Vision and Pattern Recognition Conference）上發(fā)表的一篇論文中進行了闡述。在2022年早些時候，InfoQ 曾經(jīng)報道過 Google 的 Imagen 模型，它是另一個基于擴散的圖像生成 AI。

Stable Diffusion 模型支持多種操作。與 DALL-E 類似，它能夠根據(jù)所需圖像的文本描述，生成符合匹配該描述的高質(zhì)量圖像。它還可以根據(jù)一個簡單的草圖再加上所需圖像的文本描述，生成一個看起來更逼真的圖像。

Meta AI 也發(fā)布了名為 Make-A-Scene 的模型，具有類似的圖像至圖像的功能。

10 月 18 日，Stability AI 融資成為獨角獸，更掀起熱潮

10 月 18 日，在上線不足兩月的時間里，StabilityAI 獲得由在 Coatue 和 Lightspeed Venture Partners 領(lǐng)投的 1.01 億美元融資，投后估值超過 10 億美元。

上線兩個月就成為獨角獸，足以見得市場對于 StabilityAI 以及 AI 作畫的認可。這也引發(fā)了一級市場對于 AI 作畫的強關(guān)注。

同樣在 10 月，微軟開始將由 DALLE2 提供支持的生成人工智能技術(shù)，集成到其 Bing 搜索引擎、Edge 瀏覽器和新的
MicrosoftDesignerforOffice。

2022 年的商業(yè)化進展：欲速則不達

由于 AI Art 在受到越來越多關(guān)注的同時，開發(fā)門檻越來越低，全球范圍內(nèi) AI Art 的創(chuàng)業(yè)公司和產(chǎn)品也在 10 月、11 月密集出現(xiàn)。

在 11 月初打開 Product Hunt（一個發(fā)現(xiàn)新產(chǎn)品的平臺，開發(fā)者可以提交自己的產(chǎn)品，網(wǎng)站會依據(jù)大眾的投票數(shù)量產(chǎn)生每日榜單），會發(fā)現(xiàn)每天都有新的 AI 作畫產(chǎn)品上線，并且這些 AI 作畫產(chǎn)品，都在每天榜單的前幾名。

2022 年 11 月 3 號，Product Hunt 榜單第一名就是 AI 作畫產(chǎn)品

2022 年 11 月 2 號，Product Hunt 第二名是需要付費的 AI 作畫產(chǎn)品

其中，Avatar AI 推出 10 天以來，銷售額已經(jīng)突破 10 萬美元（銷量為 2943，平均售價 33 美元）。

Avatar AI 銷售額

不僅美國如此，在中國也是這樣，盜夢師、無界、皮卡智能、TIAMAT 等也在 10~11 月里受到了廣泛關(guān)注，盜夢師小程序甚至達到了日增 5 萬用戶的規(guī)模。

層出不窮的 AI 作畫產(chǎn)品背后，是全球從業(yè)者和 C 端群眾對于新技術(shù)的好奇和熱捧。從 Google Trends 和百度指數(shù)上，在 10 月 AI 作畫搜索指數(shù)的暴漲，就可見一斑。

Google Trends 美國區(qū)“AI Art”熱度

AI Art，火燒得太快、來得太突然，法規(guī)完善、生態(tài)體系、用戶認知等等一個賽道長期發(fā)展所要具備的要素，在 AI 作畫賽道都稍顯空白，這或許會帶來商業(yè)化短期的混亂。

一類玩家，以 Avatar AI 這類產(chǎn)品為例，30 美元打包一沓頭像，固然能賺到快錢，但是如何在不傷害獵奇心理消費者的情況下保持長期商業(yè)價值是 Avatar AI 不得不考慮的問題。

另一類玩家，不以收費為前提，僅是提供工具免費給用戶使用，那么在早期獲得病毒式增長后，又該如何獲得收入維持后續(xù)發(fā)展？

還有一類玩家，或許并沒有明確的商業(yè)化目標(biāo)，其出發(fā)點或許只是熱愛，但部分 AI Art 產(chǎn)品已經(jīng)傷害了藝術(shù)家的版權(quán)，正在全球范圍內(nèi)引起相關(guān)討論。

而目前的混亂，或許是由于這個原本技術(shù)突破困難、應(yīng)該有較高門檻的行業(yè)，因為開源，而變得低門檻，投機者幾乎能以零成本去“追逐風(fēng)口”。作為長期具有 ToC 價值的領(lǐng)域，開源一定程度上“放縱”了 AI Art 在商品層面的混亂。

未來，AI Art 想要獲得更長久的商業(yè)發(fā)展，需要在 C 端用戶有足夠的認知的同時，玩家探索 toB 的商業(yè)價值。

三、AI-Generated Text：基于真實需求，最有想象力的商業(yè)應(yīng)用

2023 年趨勢

從當(dāng)下商業(yè)環(huán)境來看，對話式 AI 的應(yīng)用場景比其他生成式 AI 都要基礎(chǔ)和廣泛，比如和 MarTech 進一步結(jié)合，應(yīng)用于各行各業(yè)的營銷與服務(wù)環(huán)節(jié)；
相較于“圖像無國界”的 AI Art，在 AI 生成文字領(lǐng)域，來自語言和領(lǐng)域的差異化需求，將吸引更多技術(shù)服務(wù)商各展所長，資本加持也有望在2023年集中爆發(fā)；
2023 年，會出現(xiàn)更多市場亂象，比如可能會有一些營銷服務(wù)商會套上 AI 技術(shù)商的新概念以博眼球、求客戶、騙融資。

LaMDA：當(dāng) AI 有了意識，搜索引擎也可以“說人話”

2022年 6 月，Google 的一名工程師聲稱 LaMDA 可能有自己的感覺，可能“還隱藏著一個感知的心靈”。這讓 LaMDA 一度陷入爭議。

LaMDA 在 2021 年 I/O 大會上首次亮相，是 Google“迄今為止最先進的對話式人工智能”，即與2022年 12 月紅遍全球的 ChatGPT 有著相同的語言模型技術(shù)和原生應(yīng)用場景。2022 年 5 月 11 日，Google 在 2022 年 I/O 大會上公布了 LaMDA2。作為 Google 一直在研究的最先進的大數(shù)據(jù)模型之一，與 GPT-3 不同的是，LaMDA 沒有被配置為執(zhí)行任何特定任務(wù)，LaMDA 是“對話訓(xùn)練”，本質(zhì)上是一個以聊天機器人為導(dǎo)向的 LLMs。

在引起了不少社會上的討論后，Google 回應(yīng)到：LaMDA 和公司近幾年的大型 AI 項目一樣，都經(jīng)過了多次嚴(yán)格的 AI 道德方面的審核，對其內(nèi)容、質(zhì)量、系統(tǒng)安全性等進行了多方面的考量。

2022年早些時候，Google 也專門發(fā)表了一篇論文，公開了 LaMDA 開發(fā)過程當(dāng)中的合規(guī)細節(jié)。其中提到，“在 AI 群體內(nèi)，對于具備感知的 AI/通用 AI 的長期可能性，確實有一些研究。然而在今天把對話模型來擬人化，這樣做是沒有意義的，因為這些模型是沒有知覺的。不過，這些系統(tǒng)能夠基于數(shù)以百萬計的句子來模仿交流的方式，并且在任何有趣的話題上都能夠扯出有意思的內(nèi)容?！?/p>

在 ChatGPT 趕在 2023 年到來之前意料之外地迅速爆發(fā)之后，LaMDA 只能以其競爭對手的形式在市場上被動出現(xiàn)。正如在另一個 AI 賽道內(nèi)，Google 強大的 AI Art 模型 DreamBooth，也是幾乎在 Stability AI 獲得融資成為獨角獸的前夕，才以一個定制化編碼功能更強大的標(biāo)準(zhǔn)曝光在公眾視野之下。同樣，從技術(shù)上來說，LaMDA 被認為擁有“對抗 ChatGPT 所需的一切”。

在一些投資人與用戶高呼 ChatGPT 能夠“殺死傳統(tǒng)搜索引擎”之后，另一群人寄托在 LaMDA 身上的希望，情節(jié)變得更加跌宕起伏。

Google 和 OpenAI 都是全球久負盛名的 AI 夢工廠，區(qū)別是前者成為科技巨頭已久，且在壟斷用戶搜索查詢流量的同時，也主導(dǎo)了多個 AI 生成賽道的誕生和迭代。而后者則在2022年連續(xù)推出了 DALLE2 和 ChatGPT 兩個現(xiàn)象級生成式 AI 工具，未來幾年內(nèi)有望做出最龐大的 AI 生成平臺。

因此，LaMDA 和 ChatGPT 的競爭更有可能是生態(tài)級別的。拋開前文所討論的人工智能恐怖谷、科技倫理學(xué)等問題，從長期來看，作為“巨頭之子”，LaMDA 的機會很可能集中在以下幾點：

首先，“打敗 Google 的，只可能是 Google”。就像社交帝國騰訊用微信“打敗”了 QQ 一樣，Google 幾十年來在搜索引擎領(lǐng)域的絕對話語權(quán)，使其在對話式 AI 在搜索領(lǐng)域的應(yīng)用上，也具有不可撼動的優(yōu)勢。

目前，Google 在搜索引擎中使用 Featured Snippets（精選片段）為用戶的問題引用答案，這是其商業(yè)化手段之一，也是廣受用戶詬病的一點。

相比來說，ChatGPT 之所以被列入“殺死 Google 搜索”的候補名單，是因為其擅長為更復(fù)雜、更完整的問題生成答案，同時不會像 Google 一樣試圖將用戶引導(dǎo)到其他頁面，提供了更清爽的用戶體驗。但極致的用戶體驗有些時候也會成為商業(yè)化的阻礙，由于對話式 AI 中的“競價廣告”可能要比 Google 的 SEO 要隱蔽得多，且不直接顯示數(shù)據(jù)引用來源的 AI 表面上無需對搜索結(jié)果負責(zé)，因此潛在威脅也是可想而知的。

前兩天，全球最大產(chǎn)品發(fā)現(xiàn)社區(qū) ProductHunt 上已經(jīng)出現(xiàn)了導(dǎo)購項目，專門收集 ChatGPT 回答的“某一分類下最好的品牌”。如果對話式 AI 未來更加泛濫地應(yīng)用于品牌營銷，或者商家發(fā)明出一套規(guī)則能讓自己的品牌名更多地被 AI 模型抓取，它的內(nèi)容可信度會不會成為曇花一現(xiàn)呢？如果堅持“真實”和“專業(yè)”，又怎樣實現(xiàn)在搜索領(lǐng)域的變現(xiàn)？

在這個問題上，LaMDA 和 ChatGPT 面對的商業(yè)化難題是一樣的，但毫無疑問作為搜索巨頭的 Google，會有更完善的解決方案。

其二，MUM（Multitask Unified Model，多任務(wù)統(tǒng)一模型）、PaLM（路徑語言模型）等其他 Google 自研 AI 模型的支持和集成。ChatGPT 之所以現(xiàn)在看起來更像是一個工具或者“寫郵件神器”，是因為技術(shù)和模型已經(jīng)是時下最先進的了，服務(wù)和體驗卻仍然是單點維度的，距離生態(tài)利器還有很長的路要走。

而在這一點上，Google 已經(jīng)有所考慮。比如，除了 LaMDA 之外，Google 還強調(diào)了 MUM 的重要性。多模式模型允許人們“跨不同類型的信息進行提問”，也就是說，將圖片、音頻、視頻等媒介形式結(jié)合文字來提問。

Google 提供的一個搜索示例：用戶給自己的登山靴拍了張照片，問“我可以穿這個登富士山嗎？”MUM 則能夠通過理解圖像等內(nèi)容和查詢背后的意圖進行判斷，并推薦裝備列表和博客文章。

目前，Google 已經(jīng)將 MUM 技術(shù)添加到了 Google Lens，后者為 Google 推出的一款支持圖片對象檢索的現(xiàn)實搜索應(yīng)用。

總體來說，在 LaMDA 始終位于技術(shù)前列的情況下，至少在搜索和對話式領(lǐng)域，Google 將比一切競爭對手都更接近產(chǎn)品化和商業(yè)化。

其實，AI 自然對話的能力基于對人類說話口吻的模仿，本就是為了讓信息和計算從根本上更易于被人們訪問和使用，這種軟性提效與工業(yè)硬件升級等硬性提效的最大區(qū)別，就是它與人類的行為和語言體系是一種寄生關(guān)系。換句話說，不具備商業(yè)能力的 AI 模型代表著長期投入能力差，缺少時效性價值，從而損害“搜索”的核心價值。

早在2022年 5 月份，Google CEO Sundar Pichai 就重申了對話式自然語言處理的最大價值是“數(shù)字民主化”。至少在研發(fā)轉(zhuǎn)產(chǎn)品的目標(biāo)上，LaMDA 比2022年大多數(shù)生成式 AI 工具都要明確，那就是讓 Google 搜索未來能夠像人類一樣回答問題。

“倉促行事對于搜索領(lǐng)域來說似乎并不明智，因為世界需要始終如一的正確?！?/p>

OpenAI 的 chatGPT 引起全球狂熱

11 月 30 日，人工智能實驗室 OpenAI 發(fā)布了自研的聊天機器人——ChatGPT，它比其他任何可供公眾互動的聊天機器人都要先進，在聊天外，可以當(dāng)成搜索引擎、論文生成器、代碼生成器、翻譯等多個實用角色，成為人類的生活工作助手。

其價值被廣泛認可，上線 5 天后，注冊人數(shù)突破百萬，而到達這個數(shù)字，推特用了兩年。

因為 ChatGPT 的火爆，OpenAI 在大語言訓(xùn)練模型領(lǐng)域的積累也逐漸被看到——ChatGPT采用最新的GPT3.5模型，模型中首次采用 RLHF（從人類反饋中強化學(xué)習(xí)）方式。

OpenAI 最初于 2017 年提出的 GPT1，其采取的是生成式預(yù)訓(xùn)練 Transform 模型（一種采用自注意力機制的深度學(xué)習(xí)模型）。GPT1 的方法包含預(yù)訓(xùn)練和微調(diào)兩個階段，預(yù)訓(xùn)練遵循的是語言模型的目標(biāo)，微調(diào)過程遵循的是文本生成任務(wù)的目的。2020 年的 GPT3，訓(xùn)練參數(shù)是 GPT-2 的 10 倍以上，給 GPT 訓(xùn)練讀過文字和句子后可接續(xù)問題的能力，同時包含了更為廣泛的主題。

圖源：Medium GPT 系列模型的數(shù)據(jù)集訓(xùn)練規(guī)模

現(xiàn)在的 ChatGPT 則是由效果比 GPT3 更強大的 GPT-3.5 系列模型提供支持，這些模型使用微軟 Azure AI 超級計算基礎(chǔ)設(shè)施上的文本和代碼數(shù)據(jù)進行訓(xùn)練。

具體來說，ChatGPT 在一個開源數(shù)據(jù)集上進行訓(xùn)練，訓(xùn)練參數(shù)也是前代 GPT3 的 10 倍以上，還多引入了兩項功能：人工標(biāo)注數(shù)據(jù)和強化學(xué)習(xí)，相當(dāng)于拿回了被 GPT3 去掉的微調(diào)步驟，實現(xiàn)了在與人類互動時從反饋中強化學(xué)習(xí)。

ChatGPT 自己回答與前代 GPT3 的能力區(qū)別

盡管目前 ChatGPT 還存在很多語言模型中常見的局限性和不準(zhǔn)確問題，但毋庸置疑的是，其在語言識別、判斷和交互層面存在巨大優(yōu)勢。

Notion AI：一個更加 AGI 的可能性

2022年 11 月，全球獨角獸 Notion 發(fā)布了 Notion AI 的 Alpha 版本，這也是知識管理工具與生成式 AI 工具的進一步結(jié)合。

從功能上來說，Notion AI 與 ChatGPT、Jasper 等工具類似，都是根植于 LLM 在2022年的技術(shù)爆發(fā)，服務(wù)于 text-to-text 應(yīng)用下的重復(fù)性或創(chuàng)造性寫作。而從應(yīng)用環(huán)境來看，Notion AI 的創(chuàng)新性在于，它完全融合于 Notion 文檔內(nèi)部，這也就意味著人工智能協(xié)作又少了一步“冷啟動”的時間。

圖片來自 Notion AI 官網(wǎng)

圖片來自 Notion AI 官網(wǎng)，可以看出，Notion 用戶在文檔中輸入“/”（也是 Notion 區(qū)塊式筆記的基礎(chǔ)基礎(chǔ)邏輯）即可調(diào)用不同功能的 Notion AI，包括 Continue writing（續(xù)寫）、Help me write（text-to-text 生成內(nèi)容）、Brainstorm ideas（列出 bullet points）等。在功能定位上，Notion 將 AI 列為了寫作助手的角色，比起 ChatGPT 更加接近 Grammarly。

其實，無論是 ChatGPT 還是 Notion AI，目前為止都還沒有辦法直接生成一篇原創(chuàng)且可發(fā)表的內(nèi)容，但它們能夠很好地幫助用戶“跳過初稿階段”，直接進入對文字的改進和完善階段。與此同時，所有 LLM 的應(yīng)用工具都在迅速改進，使得語義理解能夠從句子到段落，再到邏輯關(guān)系更加復(fù)雜的語境，從而更好地理解和編寫各種文本。

Notion AI 的機會有三點：

第一，Notion 的平臺特性能夠與 LLM 的技術(shù)特性更好地融合。眾所周知，目前的生成式 AI 最需要的就是更多更詳細的語境。在我們使用 ChatGPT 的時候，得到的文字內(nèi)容經(jīng)常會以“由于沒有更詳細的數(shù)據(jù)支持，我只能嘗試?yán)斫庑枨蟆敝惖穆暶髯鳛殚_頭。

而作為一個綜合了筆記、項目管理等用戶個人知識內(nèi)容的 Workspace（工作區(qū)），Notion 為每位用戶存儲了大量邏輯結(jié)構(gòu)和關(guān)聯(lián)性更強的文本內(nèi)容，比 ChatGPT 等聊天式 AI 更容易獲取大量的上下文語境素材，從而實現(xiàn)更精準(zhǔn)的需求理解和對于用戶語言風(fēng)格的模仿等。

第二，Notion AI 符合生成式 AI 目前最重要的兩個競爭條件。盡管 Notion 計劃“緩慢而謹(jǐn)慎”地推出他們的 AI 工具，但由于 AI 并不是一項一勞永逸的技術(shù)，其核心競爭壁壘來自于數(shù)據(jù)質(zhì)變、用戶需求理解和模型的完善性，因此用戶量和在時間上占先，對于生成式 AI 來說是非常重要的兩點。

作為數(shù)字協(xié)作領(lǐng)域的獨角獸，用戶量和 C 端口碑是 Notion 一直以來引以為傲的亮點。從入局時間來看，ChatGPT 在 11 月底引發(fā)了 AI 寫作的全球熱潮，Notion AI 與之基本同期，沒有錯過時間紅利。

第三，存在于知識庫內(nèi)部的 AI 工具有更多呈現(xiàn)形式。從應(yīng)用場景來看，以聊天機器人形式出現(xiàn)的 ChatGPT 似乎更像是一個用來展現(xiàn)技術(shù)能力的 demo，它還在尋找廣泛的領(lǐng)域場景和合作商。與之相比，Notion 在協(xié)作領(lǐng)域的巨大影響力，則已經(jīng)為 Notion AI 注腳好了未來的可能性。在一個巨大的知識管理工作區(qū)內(nèi)部，AI 除了輔助寫作的用途，還能集成搜索、連接日歷與任務(wù)管理、回答用戶的問題并粘貼知識庫中的信息等。

用 Notion AI 生成表格

綜上，剛剛被“交到用戶手中”就立刻引發(fā)了熱議的 Notion AI，也讓我們重新想起了 AGI 的概念。其實，Notion 本身能夠從一眾產(chǎn)品精度做得越來越“卷”的筆記應(yīng)用中取得不可忽視的地位，并建立最龐大的第三方模版市場和社區(qū)，就是基于其一體化文本協(xié)作的理念和高度集成性。

四、Video AI：創(chuàng)業(yè)公司層出不窮

2023 年趨勢

各大視頻平臺都將迭代以 AI 能力為主的集成型創(chuàng)作平臺，或?qū)⒊霈F(xiàn)視頻制作或動畫領(lǐng)域的爆款，在低門檻用戶群中挑戰(zhàn) After Effects 的權(quán)威；
創(chuàng)投領(lǐng)域，videoAI 在2022年獲得非常多一級市場的關(guān)注，因為目前并未跑出獨角獸且商業(yè)前景明晰，因此，2023 年該領(lǐng)域會延續(xù)一級市場的熱度；
2023 年，text-to-video 的 AI 生成技術(shù)不一定能成熟到支持低成本的 C 端應(yīng)用，因此可能會涉及到投資回報期更長的問題。

雖然文本到圖像的生成式 AI 是2022年 AI 領(lǐng)域的最大新聞之一，但“文本到視頻”無疑將會接班成為 2023 年的新技術(shù)焦點。目前，在 AI 視頻領(lǐng)域，捕捉遠程依賴關(guān)系等決定性的技術(shù)仍具有挑戰(zhàn)性，但 AI 視頻在2022年年底已經(jīng)實現(xiàn)了對于部分短視頻的覆蓋。2023年，也許“我們將無法區(qū)分視頻是由人還是 AI 生成的。”

此外，2022年以來，生成式 AI 在影音技術(shù)方面的應(yīng)用，也越來越詳細地描述著元宇宙將如何出現(xiàn)。雖然在 C 端沒有出現(xiàn)像 Stable Diffusion 和 ChatGPT 一樣現(xiàn)象級的工具，且各 AI Art 廠家圍繞 text-to-video 所做的布局，常常被看作是 text-to-image 的形態(tài)拓展，但在各類短視頻、長視頻占據(jù)用戶大量時間的互聯(lián)網(wǎng)環(huán)境下，AI 視頻工具的商業(yè)化路徑也要比前者清晰得多，比如應(yīng)用在營銷等領(lǐng)域。

雖然制作最好的視頻總是需要創(chuàng)造力和人性化的觸覺，但人工智能軟件可以用來減少處理所占用的大量時間。

也因此，不少 Video AI 賽道的公司在2022年獲得一級市場的關(guān)注。

2 月，以色列 AI 技術(shù)研發(fā)商 Hour One 宣布完成 2000 萬美元 A 輪融資，該公司計劃利用這筆資金擴大其自助服務(wù)平臺 Reals，允許企業(yè)在幾分鐘內(nèi)從文本中自動創(chuàng)建以人為主導(dǎo)的視頻。

10 月，Descript 宣布完成了由 OpenAI 領(lǐng)投的新一輪融資，估值達到了 5.5 億美金。Descript 是一家音頻轉(zhuǎn)錄編輯器，會將音頻轉(zhuǎn)錄下來的文字放到 Word 文檔中，然后編輯人員或音頻制作人可以像修文檔一樣剪輯音頻。

12 月，圖片和視頻 AI 編輯軟件提供商 runway 完成 5000 萬美元 C 輪融資，投后估值達到 5 億美元。

同樣在 12 月，家視頻搜索和分析云基礎(chǔ)設(shè)施提供商 Twelve Labs 宣布獲 1200 萬美元種子輪追加融資，該公司推出一套云原生 API，可與該公司的人工智能視頻搜索工具集成，使開發(fā)人員能夠?qū)Ａ恳曨l進行搜索。

不過，拋去對于技術(shù)層在2023年能夠?qū)崿F(xiàn)爆發(fā)的樂觀預(yù)期，如果基于文本的視頻生成模型仍然需要 1-2 年才能達到以假亂真的效果，那么此類模型也許需要 2-3 年才能在商業(yè)應(yīng)用和企服領(lǐng)域真正發(fā)揮作用。在此之前，這些模型可能適用于對保真度和可控性要求較低的場景，如 C 端用戶在娛樂創(chuàng)作平臺上的獵奇式創(chuàng)作。

五、AI Coding：開始小規(guī)模應(yīng)用

2023 年趨勢

科技互聯(lián)網(wǎng)巨頭的 AI 編碼占比增加，因此巨頭孵化的項目會增多，進而開放給中小公司使用。
創(chuàng)投視角來看，AI 編程或許沒有投資前景，但是如 AI 代碼糾錯、優(yōu)化等細分領(lǐng)域，或許會涌現(xiàn)針對垂直行業(yè)的創(chuàng)業(yè)公司。
AI coding 的最大競爭對手是無代碼產(chǎn)品，二者可能會在 2023 年開始搶占市場。

當(dāng)今世界，毫無疑問不僅僅由物理世界組成，由代碼組成的互聯(lián)網(wǎng)世界已經(jīng)成為人類賴以生存的世界之一，這從中美等各個國家互聯(lián)網(wǎng)公司位列前沿的市值可見一斑。

因此，AI 編寫代碼也被傾注了最大的期望。

AI 對工業(yè)的“妄圖染指”，開啟了 AI 在良莠不齊的生產(chǎn)環(huán)境中漫長的應(yīng)用過程，而這也是 AI 回報周期過長的原因之一。由于人類只能從已經(jīng)存在的歷史中去提煉參照系，在被稱為“信息革命”、“數(shù)字革命”的新世紀(jì)洪流中，代碼一直以來所對應(yīng)的就是像蒸汽、電力一樣的工業(yè)生產(chǎn)力新單位。

不過，與以往不同，開發(fā)在科技世界的構(gòu)建中比以往的工人取得了更高的地位和經(jīng)濟話語權(quán)。隨著數(shù)字經(jīng)濟的發(fā)展，編程人才逐漸被細化到各行各業(yè)、各個技術(shù)體系中去，從價值層級來分，他們的工作也可以被拆分為創(chuàng)造和解決需求兩個部分。

近年來，隨著科技門檻一再降級，每當(dāng)有 CRM、無代碼等看似“反程序員價值”的產(chǎn)品出現(xiàn)，人們就會熱議“程序員的工作很快就要被替代了”。2022年跟隨 LLM 掀起水花的 AI Coding 也是同理。

在過去，這種“不再被需要”也許只是一種烏托邦式的幻想或自嘲，大多數(shù)人都明白，更多的數(shù)字生產(chǎn)力被解放，就會有更多的創(chuàng)造導(dǎo)向型領(lǐng)域出現(xiàn)人才缺口?？芍钡?022年，飄蕩在全球互聯(lián)網(wǎng)上空的裁員危機，似乎是在倒逼著這一口號重新回到了從業(yè)者的焦慮范圍內(nèi)。

AI Coding 則正是在這種情況下開始小規(guī)模地應(yīng)用于業(yè)界。

2022年 2 月，DeepMind 推出了 AlphaCode，這是一款用 12 種編程語言對 8600 萬個程序進行預(yù)訓(xùn)練的 Transformer，并針對編碼競賽的內(nèi)容進行了微調(diào)。

通過推理，它產(chǎn)生了一百萬種可能的解決方案，并過濾掉了不佳的解決方案。通過這種方式，它在 10 次編程競賽中擊敗了一半以上的參賽者。

6 月，GitHub 開放了 Copilot 的訪問權(quán)限，這是一個能夠?qū)崟r提供代碼建議的自動完成系統(tǒng)。雖然學(xué)生和經(jīng)過驗證的開源開發(fā)者可以免費訪問，但用戶需要支付訂閱費。

11 月，“萬能助手”chatGPT 出現(xiàn)，不少用戶開始嘗試用 chatGPT 編寫代碼。像簡單的 shell 腳本，makefile 等，ChatGPT 確實能處理，但更復(fù)雜的編程需求，chatGPT 會給出錯誤答案。開發(fā)者可以把 AI 生成的代碼拿來進行修改，以節(jié)省時間。

但同時，AI coding 的隱患也在隨著技術(shù)門檻降低而攀升。

The Register 的一份報告顯示，斯坦福大學(xué)計算機科學(xué)家發(fā)現(xiàn)，與完全靠自己做事的程序員相比，使用 Github Copilot 等人工智能編碼工具的程序員創(chuàng)建的代碼安全性較低。

除了已經(jīng)暴露出的版權(quán)問題、安全隱患之外，AI 編程還有很多已知或未知的痛點，比如提高了人才篩選難度，

比起 AI Art、AI 寫作等領(lǐng)域，AI 編程主要有如下三個特點：

1. 其應(yīng)用環(huán)境往往不是 C 端用戶的獵奇心理和“科技民主化”的目的，而是用于實際的工作項目中，準(zhǔn)確性要求更高，對版權(quán)等商業(yè)信息更敏感；

2. 編寫結(jié)果可能會涉及到復(fù)雜的函數(shù)，無法像 AI Art 一樣讓任何人都能夠以肉眼判斷，有較大的應(yīng)用和試錯成本；

3. 編程本身可以說是一個比較龐大復(fù)雜的母領(lǐng)域，而是多個語言領(lǐng)域的泛概念，因此所針對的領(lǐng)域、需求和實現(xiàn)難度也不同。

這些特點決定了 AI Coding 在短期內(nèi)會更多地用于科技巨頭的內(nèi)部構(gòu)建，并且由于代碼是這些公司的主要商業(yè)資產(chǎn)，其內(nèi)部孵化或投資的項目，可能并不會被競爭對手所接受。雖然目前以 DeepMind 為代表的頭部服務(wù)商呼聲很高，但 AI Coding 本質(zhì)來說也并不是一件具有技術(shù)壁壘的事，大公司各筑城池的局面不難想象。

此外，由于 AI Coding 和無碼化趨勢的現(xiàn)階段目的，同樣都是為企業(yè)的 IT 部門解放生產(chǎn)力，其對于大多數(shù)業(yè)務(wù)類型的公司來說，降本增效的空間也難免會被進行對比。AI Coding 雖然是自動生成代碼，但其商業(yè)邏輯也是主要服務(wù)于程序員，目前還很難做到離開“人腦”工作。就像 AI Art 在熱潮退去之后，也會逐漸成為藝術(shù)家等專業(yè)人員的靈感工具一樣。

但其降本矛盾在于，如果是 freelancer 或獨立開發(fā)者，AI Coding 工具毫無疑問能夠幫助他們提高效率，但大多數(shù)程序員作為企業(yè)員工，可能自身并不會愿意被“人工智能”間接降薪。但從長期來看，隨著數(shù)字經(jīng)濟下的編程基礎(chǔ)教育進一步完善，各類開發(fā)工程師的分工也趨于細化，屆時 AI Coding 將大有可為。只不過，這一點希冀很難惠及到即將到來的 2023 年。

相比來說，無碼化工具的出現(xiàn)則是為了解構(gòu)程序員的價值和工作屬性。畢竟在程序員普遍“高薪”的情況下，在同一個業(yè)務(wù)需求下，把程序員換成業(yè)務(wù)運營人員，至少在人力方面就已經(jīng)做到了降本。

不過，好消息是，2022 年的最后一個季度，AlphaCode 等 AI 編碼工具似乎遭受了前所未有的業(yè)界爭議。在科技和創(chuàng)投界，法律、商業(yè)、社會道德對于新生事物的爭議通常代表著希望，雖然 AI 編碼在2023年也不可能直接代替那些“螺絲釘型”碼農(nóng)，但大面積的智能優(yōu)化代碼服務(wù)，可能會成為另一個企業(yè)服務(wù)的熱點。

六、LLM：作為底層技術(shù)，沒有巨頭缺席

沒有一家巨頭缺席 LLM，更加說明了 LLM 進入較為成熟的階段。

11 月 15 日，Meta 公司發(fā)布大型語言模型 Galactica，并宣稱它“可以總結(jié)學(xué)術(shù)論文，解決數(shù)學(xué)問題，生成維基百科文章，編寫科學(xué)代碼，標(biāo)記分子和蛋白質(zhì)，以及更多功能。”

但上線僅 3 天，該模型就在巨大爭議中撤回。它雖然能生成一些貌似通順的學(xué)術(shù)文本，但文本中的信息是完全錯誤的——貌似合理的化學(xué)方程，描述的是實際上并不會發(fā)生的化學(xué)反應(yīng)；格式合規(guī)的引文參考的是子虛烏有的文獻；甚而種族主義、性別歧視的觀點，也能通過模型生成的文本而被包裝成 ' 科學(xué)研究 '。

Google 于去年推出“LaMDA”（對話應(yīng)用程序語言模型）。LaMDA 是 Google 一直在研究的最先進的 LLMs 之一，與 GPT-3 不同的是，它沒有被配置為執(zhí)行任何特定任務(wù)，LaMDA 是“對話訓(xùn)練”。

它本質(zhì)上是一個以聊天機器人為導(dǎo)向的 LLMs，2022年 6 月，Google 的一名工程師聲稱 LaMDA 可能有自己的感覺，可能“還隱藏著一個感知的心靈”。這讓 LaMDA 一度陷入爭議。

由于 LaMDA 仍處于封閉測試階段，只有少數(shù)用戶可以使用，因此關(guān)于它的性能幾乎沒有披露。但是 LaMDA 只有 1370 億個參數(shù)，與前面討論的 GPT-3 的 1750 億個參數(shù)相差甚遠。雖然用于訓(xùn)練 LLMs 的數(shù)據(jù)量并不是其性能和準(zhǔn)確性的唯一驅(qū)動因素，特別是考慮到 GPT-3 和 LaMDA 是為不同的功能而創(chuàng)建的，但兩者中參數(shù)數(shù)量的差異確實引起了人們對 LaMDA 是否是 ChatGPT 或廣義上的 GPT-3 的有力競爭者的更大審查。

LaMDA 證明了 Google 在 LLM 競賽中并沒有完全出局。

2021 年 10 月，微軟和英偉達正式推出由 DeepSpeed 和 Megatron 驅(qū)動的 Megatron-Turing 自然語言生成模型(MT-NLG)，聲稱有 5300 億參數(shù)，在當(dāng)時宣傳這是訓(xùn)練的最大最強的解碼語言模型。不過在2022年并沒有取得更新的進展。

微軟在生成式 AI 方面始終參與度不低。2022年大火的 chatGPT，其背后模型 GPT3.5 就是在微軟 Azure AI 超算基礎(chǔ)設(shè)施（由英偉達 V100GPU 組成的高帶寬集群）上進行訓(xùn)練，同時微軟在考慮對 OpenAI 進行新一輪投資。

圖源網(wǎng)絡(luò)

國內(nèi)，互聯(lián)網(wǎng)大廠也走在大模型訓(xùn)練的前沿，各大廠在超大規(guī)模 AI 模型訓(xùn)練的爆發(fā)主要集中在 2021 年，國內(nèi)超大模型研發(fā)雖然比國外公司晚，但是發(fā)展卻異常的迅速。在2022年，也有一些進展。

百度文心大模型已經(jīng)形成“模型層+工具與平臺層+產(chǎn)品與社區(qū)層”的整體布局，于2022年全新發(fā)布 11 個大模型，包括 5 個基礎(chǔ)大模型、1 個任務(wù)大模型、5 個行業(yè)大模型；全面升級文心大模型開發(fā)套件、文心 API；新發(fā)布和升級基于文心大模型的 2 大產(chǎn)品，AI 作畫產(chǎn)品“文心一格”和產(chǎn)業(yè)級搜索系統(tǒng)“文心百中”。

去年，阿里達摩院先后發(fā)布多個版本的多模態(tài)及語言大模型，在超大模型、低碳訓(xùn)練技術(shù)、平臺化服務(wù)、落地應(yīng)用等方面實現(xiàn)突破。其中使用 512 卡 V100 GPU 實現(xiàn)全球最大規(guī)模 10 萬億參數(shù)多模態(tài)大模型 M6，同等參數(shù)規(guī)模能耗僅為此前業(yè)界標(biāo)桿的 1%，極大降低大模型訓(xùn)練門檻。2022年 9 月，阿里巴巴 fault 最新「通義」大模型系列，其打造了國內(nèi)首個 AI 統(tǒng)一底座，并構(gòu)建了通用與專業(yè)模型協(xié)同的層次化人工智能體系。

近年來，大型語言模型的參數(shù)數(shù)量保持著指數(shù)增長勢頭。據(jù)預(yù)測，OpenAI 開發(fā)中的最新大型語言模型 GPT-4 將包含約 100 萬億的參數(shù)，與人腦的突觸在同一數(shù)量級。由此，出現(xiàn)了一個新的人工智能口號：' 規(guī)模就是一切 '。

大數(shù)據(jù)模型花銷

七、結(jié)語：商業(yè)化，生成式 AI 在 2023 年最大的課題

在生成式 AI 技術(shù)取得突破性進展、應(yīng)用井噴式出現(xiàn)、用戶與其距離越來越近的 2022，我們不得不關(guān)心，GA 到底是未來 AI 進入人類生活的開始，還是如此前一樣曇花一現(xiàn)。

目前，不少人對生成式 AI 的質(zhì)疑主要在以下幾點：

1、現(xiàn)在 AI 的生成內(nèi)容大多數(shù)還達不到直接商用的標(biāo)準(zhǔn)，仍然需要大量的模型微調(diào)，以及人的行業(yè)經(jīng)驗的輔助、補充、加工。

2、AI 生成控制方式相對普通人來說，還有一定門檻。

3、AI 的生成結(jié)果在版權(quán)方面存在模糊性。

4、行業(yè)過熱，會導(dǎo)致不成熟的 AI 激增，良莠不齊的應(yīng)用和魚龍混雜的市場很可能會讓 C 端用戶和企業(yè)客戶失去判斷信心，同時帶來數(shù)據(jù)安全隱患。

但以上問題只能限制生成式 AI 無法在短期內(nèi)成為普惠的技術(shù)，并不代表生成式 AI 沒有價值。其評判標(biāo)準(zhǔn)應(yīng)該是，AI 技術(shù)能否變現(xiàn)，能否帶來商業(yè)價值，使其成為一個成熟的產(chǎn)業(yè)。

在技術(shù)方面，2023 年，更好的基礎(chǔ)模型值得期待，比如能夠以更高效或更緊湊的方式表示復(fù)雜數(shù)據(jù)的稀疏模型。它可以更快計算且需要更少的內(nèi)存來儲存，從而帶來成本上的進一步普惠化。除此之外，更精準(zhǔn)的數(shù)據(jù)收集能力也意味著在審核、消除偏見信息等方面投入更大的努力。

在2022年，技術(shù)開源盡管帶來了一些不必要的混亂，但毋庸置疑，這也讓更多原本沒有能力的開發(fā)者加入了戰(zhàn)場，加快了生成式 AI 的商業(yè)化步伐。

在目前最大的、每天更新的 AI 應(yīng)用目錄 FUTUREPEDIA 網(wǎng)站里可以發(fā)現(xiàn)，目前最受關(guān)注的 AI 應(yīng)用多是文本生成和圖片生成相關(guān)的應(yīng)用。這和2022年的風(fēng)口趨勢一致。

36氪截圖于2022年12月底

但同時我們也注意到，在文本和圖像之外，最受關(guān)注的 AI 應(yīng)用，是市場營銷工具。如果說文本、圖像應(yīng)用是普適的、不對 toBtoC 進行區(qū)分的應(yīng)用方向，那么市場營銷是商業(yè)價值更加明確的 toB 方向。

FUTUREPEDIA 營銷方面的應(yīng)用

或許我們可以判斷，生成式 AI 接下來一年的商業(yè)化進展，將有三條路：

一，成為用戶量足夠大的 C 端工具，如 Google，依靠流量賺錢；

二，成為足夠好用的細分工具，如 Adobe，靠特定人群的固定需求賺錢；

三，成為特定賽道的企業(yè)服務(wù)軟件，比如服務(wù)營銷、開發(fā)等需求量極大的賽道。

無論是哪條路，在2022年都已有雛形和早期沉淀。

時間不對

是不是商業(yè)化應(yīng)用沒有突破更準(zhǔn)確些？

這個點文章沒有證明

本站僅提供存儲服務(wù)，所有內(nèi)容均由用戶發(fā)布，如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請點擊舉報。

中文字幕理论片,69视频免费在线观看,亚洲成人app,国产1级毛片,刘涛最大尺度戏视频,欧美亚洲美女视频,2021韩国美女仙女屋vip视频

一、創(chuàng)投：燒錢的未來，注定是少數(shù)人的游戲

二、AI Art：從高門檻變成無門檻

2023 年趨勢

2 月，Disco Diffusion 開始流行，Diffusion 底層技術(shù)對 GAN 徹底革新

4 月，DALLE2 被推出

8 月，Stability Diffusion 上線

10 月 18 日，Stability AI 融資成為獨角獸，更掀起熱潮

三、AI-Generated Text：基于真實需求，最有想象力的商業(yè)應(yīng)用

2023 年趨勢

LaMDA：當(dāng) AI 有了意識，搜索引擎也可以“說人話”

OpenAI 的 chatGPT 引起全球狂熱

Notion AI：一個更加 AGI 的可能性

四、Video AI：創(chuàng)業(yè)公司層出不窮

2023 年趨勢

五、AI Coding：開始小規(guī)模應(yīng)用

2023 年趨勢

六、LLM：作為底層技術(shù)，沒有巨頭缺席

七、結(jié)語：商業(yè)化，生成式 AI 在 2023 年最大的課題

一、創(chuàng)投：燒錢的未來，注定是少數(shù)人的游戲

二、AI Art：從高門檻變成無門檻

2 月，Disco Diffusion 開始流行，Diffusion 底層技術(shù)對 GAN 徹底革新

4 月，DALLE2 被推出

10 月 18 日，Stability AI 融資成為獨角獸，更掀起熱潮

三、AI-Generated Text：基于真實需求，最有想象力的商業(yè)應(yīng)用

四、Video AI：創(chuàng)業(yè)公司層出不窮

五、AI Coding：開始小規(guī)模應(yīng)用

六、LLM：作為底層技術(shù)，沒有巨頭缺席

七、結(jié)語：商業(yè)化，生成式 AI 在 2023 年最大的課題