聊聊近期大模型界的一些轟動(dòng)性進(jìn)展。還記得年初,我在那次熱鬧的風(fēng)馬牛大會(huì)上做的預(yù)測(cè)嗎?我列出了關(guān)于大模型未來(lái)的十大趨勢(shì),結(jié)果還沒(méi)等到年末,我們就親眼見(jiàn)證了其中幾個(gè)預(yù)言成真。不論是Gemini,還是英偉達(dá)的 Chat With RTX,抑或是OpenAI最近放出的Sora,每一次發(fā)布都讓人眼前一亮,感覺(jué)未來(lái)已來(lái)。
朋友們都好奇,我對(duì)Sora有什么看法。簡(jiǎn)單說(shuō),我堅(jiān)信人工智能的終極形態(tài)——AGI(通用人工智能)的到來(lái)指日可待,而且就在這幾年之內(nèi)。
首先得說(shuō),技術(shù)競(jìng)爭(zhēng)的核心永遠(yuǎn)是人才的聚集和深耕。看看Sora,它的表現(xiàn)遠(yuǎn)超其他同類產(chǎn)品,這并不令人意外。OpenAI這樣擁有核心技術(shù)和強(qiáng)大團(tuán)隊(duì)的公司,其實(shí)力自然不容小覷。有觀點(diǎn)認(rèn)為,有了AI技術(shù)后,小公司只需做些零星生意即可。但最新的進(jìn)展再次證明,這種看法實(shí)在是太天真了。
其次,盡管AI技術(shù)發(fā)展迅猛,但并不意味著它會(huì)立即顛覆所有行業(yè)。相反,它更有可能激發(fā)人們的創(chuàng)造力。拿Sora來(lái)說(shuō),雖然有人擔(dān)心它會(huì)沖擊傳統(tǒng)影視制作,但我看法不同。一個(gè)優(yōu)秀的視頻作品,不僅僅是畫面的堆砌,還需要有創(chuàng)意的主題、精心編排的劇本和對(duì)白。Sora的確可能會(huì)改變廣告、電影預(yù)告片和短視頻等領(lǐng)域的游戲規(guī)則,但它更可能成為這些領(lǐng)域創(chuàng)作的有力工具。
再來(lái)看國(guó)內(nèi)的大模型發(fā)展。雖然表面上看似已接近GPT-3.5的水平,但實(shí)際上與GPT-4.0相比,仍有一段不小的距離。我相信OpenAI手中還有更多牌未亮出,無(wú)論是GPT-5還是其他更先進(jìn)的技術(shù)。他們懂得如何控制節(jié)奏,保持領(lǐng)先。
大語(yǔ)言模型最厲害的地方,在于它們不僅僅是簡(jiǎn)單的信息填充機(jī)器,而是能深入理解這個(gè)世界的知識(shí)。Sora的技術(shù)突破不僅僅在于它能生成視頻,而是它能夠模擬自然界和物理規(guī)律,真正理解和再現(xiàn)世界。這種技術(shù)的進(jìn)步,使得Sora不僅僅是在二維平面上操作圖像,而是能夠在三維世界中創(chuàng)造出符合物理定律的真實(shí)場(chǎng)景,這是大模型技術(shù)的一大飛躍。
擁有強(qiáng)大大模型作為基礎(chǔ),結(jié)合深刻的人類語(yǔ)言理解與對(duì)世界模型的洞察,我們正站在創(chuàng)造跨領(lǐng)域超級(jí)工具的門檻上。想象一下,在生物醫(yī)學(xué)、蛋白質(zhì)工程、基因研究,乃至物理、化學(xué)、數(shù)學(xué)等學(xué)科領(lǐng)域,大模型如何能夠大放異彩,帶來(lái)前所未有的進(jìn)步和發(fā)現(xiàn)。
Sora的案例,特別是其對(duì)物理世界模擬的能力,預(yù)示著對(duì)機(jī)器人學(xué)和自動(dòng)駕駛等領(lǐng)域的深遠(yuǎn)影響。傳統(tǒng)自動(dòng)駕駛技術(shù)的側(cè)重點(diǎn)在于感知技術(shù),而忽略了更為關(guān)鍵的認(rèn)知層面——那種基于對(duì)世界深刻理解的判斷能力。正是這種對(duì)世界的理解,讓未來(lái)的自動(dòng)駕駛不僅僅是機(jī)械地反應(yīng)環(huán)境,而是能夠像人類駕駛員一樣,做出復(fù)雜的判斷和決策。
此外,Sora的成功不僅僅體現(xiàn)在其視頻制作能力上,更重要的是它標(biāo)志著大模型開始真正理解并模擬真實(shí)世界,開啟了人工智能新的成果和突破的大門。
第五個(gè)觀點(diǎn)更是令人振奮:為了訓(xùn)練如Sora這樣的模型,OpenAI必須讓它觀看大量的視頻資料。結(jié)合Diffusion技術(shù),這一過(guò)程將使得AI對(duì)這個(gè)世界的理解更加深刻和全面。一旦AI開始“觀看”世界,從所有電影到Y(jié)ouTube、TikTok上的視頻內(nèi)容,它對(duì)世界的理解將遠(yuǎn)超過(guò)純文字學(xué)習(xí)。因?yàn)橐环鶊D片的信息量就已經(jīng)超過(guò)千言萬(wàn)語(yǔ),視頻的信息量更是遠(yuǎn)遠(yuǎn)超出圖片。這樣的技術(shù)進(jìn)步意味著,通用人工智能(AGI)的實(shí)現(xiàn),可能不再是十年或二十年的話題,而是在未來(lái)一兩年內(nèi)就可能成為現(xiàn)實(shí)。
我們正處于技術(shù)革新的黃金時(shí)代,AI的每一次進(jìn)步都在推動(dòng)我們更接近于一個(gè)前所未有的未來(lái)。Sora的案例僅僅是開始,未來(lái)還有更多的奇跡等待我們?nèi)ヌ剿骱蛯?shí)現(xiàn)。
我是一位75歲以上的老人!本站主要是些學(xué)習(xí)體驗(yàn)與分享(其中會(huì)引用一些作品的原話并結(jié)合我的一生體會(huì)與經(jīng)驗(yàn)加工整理而成!在此一并感謝!如有不妥之處敬請(qǐng)與我聯(lián)系,我會(huì)妥善處理,謝謝!)我寫的主要是中老年人各方面應(yīng)注意的事兒!退休后我希望通過(guò)這個(gè)平臺(tái)廣交朋友,互助交流,共筑美好生活??!
聯(lián)系客服