大模型的技術(shù)能力,和它影響世界的能力,都在光速進化。
作者 | Founder Park
真是瘋狂的一周。
GPT-4、Microsoft 365 Copilot、Midjourney V5、Google PaLM API、文心一言,一顆顆 AI 大模型領(lǐng)域的重磅炸彈,扎堆在這周引爆。
GPT 開啟了大模型的多模態(tài)應(yīng)用,微軟說讓工具回歸工具,Midjourney 解決了 AI 作畫的手指問題,學(xué)術(shù)界與開源勢力也不甘落后,中國互聯(lián)網(wǎng)公司總算有了第一個大模型產(chǎn)品......
像創(chuàng)世紀一樣,日新月異。
我們從沒有像今天這樣,好奇兩個月后的世界會變得如何。
但我們首先要做的,是記住這不尋常的一周。
注:封面圖片由 DreamStudio 生成,prompt:god。產(chǎn)品發(fā)布時間以北京時間為準。
周一
暴風(fēng)雨前的平靜。
圖片由 DreamStudio 生成
周二
低門檻:斯坦福大學(xué)發(fā)布 Alpaca7B
成本降到超低,性能匹敵 GPT-3.5
斯坦福大學(xué)推出了由 Meta 的 LLaMA 7B 微調(diào)而來的全新模型 Alpaca。僅用 52k 數(shù)據(jù),性能約等于 GPT-3.5。關(guān)鍵是訓(xùn)練成本奇低,不到 600 美元,評估效果與 GPT-3.5 相當。
這意味著人們可以以更低的成本獲得與 GPT-3.5 相當?shù)男阅堋?/span>
低門檻:清華發(fā)布 ChatGLM-6B
消費級顯卡就能部署,準確度接近 GPT-3 175B (davinci)
下面是 ChatGLM 的自我介紹:
由清華技術(shù)成果轉(zhuǎn)化的公司智譜 AI 開源了 GLM 系列模型的新成員——中英雙語對話模型 ChatGLM-6B,支持在單張消費級顯卡上進行推理使用。雖然依然會有和 ChatGPT 一樣的事實錯誤、胡說八道的問題,但作為開源模型,ChatGLM-6B 可以在消費級顯卡上部署使用。
周三
OpenAI:GPT-4 來了!
人類歷史上最慌的一天
我們之前的文章里有更詳細的信息:GPT-4 發(fā)布后的 20 個小時
一個可能不太恰當?shù)念惐?,在擁有了多模態(tài)能力后,GPT-4 的發(fā)布可能就是大模型產(chǎn)業(yè)的 iPhone 4 時刻。
能夠與人類正常對話,又能夠看懂圖片,輸出和推理能力更強大,你應(yīng)該擔(dān)心的不是會不會被取代,而是如何更快學(xué)會使用它。
高素質(zhì):Anthropic 發(fā)布 Claude
在適當?shù)臅r候,學(xué)會沉默
由前 OpenAI 研究副總裁 Dario Amodei 創(chuàng)立,谷歌投資的人工智能公司 Anthropic 宣布聊天機器人 Claude 開放公測。它具有 ChatGPT 的對話推理能力,同時又可以像 New Bing 一樣調(diào)整 AI 的語氣、個性和行為。
Anthropic 聲稱 Claude 不太容易產(chǎn)生有害的輸出,因為它使用的是「以人為本」的語言建模方法,并根據(jù)語言的「深層結(jié)構(gòu)」來構(gòu)建模型。當被問及超出其知識領(lǐng)域的話題時,Claude 會推遲回答,降低產(chǎn)生虛假信息的風(fēng)險。
Google:PaLM API 開放以及更多
AI 屆汪峰:明明周三是我先來的
谷歌在 3 月 14 日晚間開放了其大語言模型 API——PaLM API。開發(fā)人員可以通過 API 訪問谷歌的基礎(chǔ)模型,并可以使用開箱即用的模板,在幾分鐘或幾小時內(nèi)啟動生成式應(yīng)用程序的創(chuàng)建。谷歌還推出了 MakerSuite 工具和 Generative AI App Builder 平臺等人工智能企業(yè)工具。
PaLM API 的另一應(yīng)用場景是 Gmail 和 Google Docs。用戶只需鍵入您想要寫的主題,即可立即生成草稿。MakerSuite 工具是簡化開發(fā)人員在模型流程制作、迭代等領(lǐng)域的工具。MakerSuite 可以簡化此工作流程,讓用戶將能夠根據(jù) prompt 進行迭代,使用合成數(shù)據(jù)擴充數(shù)據(jù)集,并輕松調(diào)整自定義模型。當你準備好編程時,MakerSuite 允許將 prompt 導(dǎo)出為你最喜歡的語言和框架(如 Python 和 Node.js)的代碼。
然而,同一天更晚的時間,OpenAI 推出了多模態(tài)的 GPT4,引起了科技圈轟動。
Google 一度是互聯(lián)網(wǎng)公司在 AI 領(lǐng)域的半壁江山,但在這瘋狂的一周里,它的發(fā)布卻沒有引起預(yù)期中的關(guān)注(推特互動數(shù)與 OpenAI 相差 20 倍)。
周四
訓(xùn)練速度:Pytorch 2.0 正式版發(fā)布
一行代碼,訓(xùn)練模型 2 倍速!
PyTorch 是一個開源的 Python 機器學(xué)習(xí)庫,用于構(gòu)建和訓(xùn)練深度學(xué)習(xí)模型,比如各類 GPT 預(yù)訓(xùn)練語言模型,目前 TensorFlow、PyTorch 是國際兩大主流深度學(xué)習(xí)框架,不少產(chǎn)品都在利用 PyTorch 培訓(xùn)大模型,比如 Salesforce。
2.0 相比 1.0 編譯時間縮短 43%,簡單來說,人類制造 AI 大模型的速度更快了。
圖像生成:Midjourney V5 發(fā)布
AI 畫不好手指?那是上周的事。
這是最新發(fā)布的 Midjourney V5 生產(chǎn)的作品。大概用到的提示詞是:一位在越南街頭市場賣河粉的婦女的街頭風(fēng)格照片, 日落, 使用 fujifilm --ar 16:9 --v 5 拍攝。
注意看,一直被詬病的「AI 不會畫手指」的問題,被解決了。
不是每個人都能成為攝影家,但未來每個人都能利用 AI 生成這樣一張高質(zhì)量的圖片。
大規(guī)模應(yīng)用:Microsoft 365 Copilot
48 歲的巨頭靠 AI 再次走上巔峰!
微軟王炸發(fā)布 Microsoft 365 Copilot,一夜之間在中外互聯(lián)網(wǎng)上刷屏。
Copilot 應(yīng)用了最新的 GPT-4 技術(shù),能夠幫助用戶在 Word、Excel、PowerPoint、Outlook 和 Teams 等軟件中進行寫作、編輯、總結(jié)、創(chuàng)作、演示文稿等工作。
Copilot 在 Microsoft 365 界面中和其他應(yīng)用程序并排出現(xiàn)在側(cè)邊欄,用戶可以通過聊天對話,讓 Copilot 幫助進行工作生產(chǎn)。微軟計劃將這些產(chǎn)品接入 GPT-4,以提高人工智能軟件的開發(fā)速度和質(zhì)量。微軟正在與 20 位客戶一起測試 Microsoft 365 Copilot,并將在未來幾個月內(nèi)擴展預(yù)覽版。此外,微軟正在開發(fā)在客戶數(shù)據(jù)上訓(xùn)練這些模型,而不會泄露給其他客戶或落入不良行為者手中。
「Word,你是個成熟的軟件了,該學(xué)會自己碼字了?!?/span>
微軟:「在做... 不對,做好了?!?/span>
中文大模型:百度發(fā)布文心一言
沒見過這么緊張的 Robin
在文心一言發(fā)布會上,百度董事長李彥宏展示了文心一言在文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解、多模態(tài)生成五個使用場景中的綜合能力。此外,百度智能云即將面向企業(yè)客戶開放文心一言 API 接口調(diào)用服務(wù)。
在股價和梗圖之外,有個事實是:
文心一言是目前 AI 商業(yè)化產(chǎn)品浪潮中唯一的中國互聯(lián)網(wǎng)大廠代表。
也許最著急的是 Robin。
周五
提示詞:Stable Diffusion Reimagine
人人都是 prompt 工程師的時代,還沒開始就結(jié)束了
在 Stability.AI 宣布收購圖片工具 Clipdrop 開發(fā)商的短短一周后,它發(fā)布了新工具 Stable Diffusion Reimagine。SDR 允許用戶無限制地生成單個圖像的多種變體。用戶只需將圖像上傳到算法中,就可以創(chuàng)建他們想要的盡可能多的變體,而不需要復(fù)雜的 prompt。這個工具基于 Stability.AI 創(chuàng)建的一種新算法。
最后,你當然會猜到,
這篇文章大部分是使用 AI 工具生成的,
可你又怎么會在意呢?
Is there anything else you would like to know?
*頭圖來源:DreamStudio
聯(lián)系客服