本資料來源于公司公告,相關(guān)新聞,機構(gòu)公開研究報告以及社交媒體網(wǎng)絡(luò)等,對文中提到的行業(yè)及個股不構(gòu)成投資建議,圖文如有侵權(quán)或違反信批請后臺留言聯(lián)系刪除。專家表示下一代大模型正在研發(fā)中,原計劃是近期發(fā)布,但在準確率方面遇到了一些阻力,沒有達到標準,所以重新開始返工,包括重新標注和再次訓(xùn)練。同時在多模態(tài)和視頻圖像方面也遇到了一些困難,原計劃是年底發(fā)布,但現(xiàn)在看可能會延至明年年初。具體問題在于如何理解圖像,目前在這方面遇到了一些問題。因為原有的圖像理解是基于已有的圖像素材和標庫,但目前要做的是理解更廣泛范圍的圖像。比如Bing上的圖像大部分都有標簽,是基本可以理解的,但對于些抽象的圖片,如摳圖和實時路面信息等,這些邊緣Case在Bing上的圖片庫就無法支撐,因為它們僅包含原始圖像,沒有進行大量的摳圖和其他標注,所以當(dāng)前面臨的問題是這些原始圖像無法滿足GPT模型的要求,準確率無法達到標準。原本計劃是使用一種特殊的算法模型進行語義理解,但實際上沒有達到要求,所以研發(fā)部分重新推翻了理論,重新進行摳圖標注與市面上一些圖像模型,如difusion相比,OpenAl主要是希望找到圖像之間的內(nèi)在關(guān)聯(lián),而不僅僅是通過標簽的形式。因此,除了標注還需要進行二次訓(xùn)練,所以整體時間延長了。相應(yīng)工作更偏向工程和算法邏輯方面,因此不確定是否能按原計劃進行發(fā)布,目前看來可能會延期。2、在模型研發(fā)方面,微軟針對通用大模型及行業(yè)相關(guān)模型的發(fā)展策略微軟之前與行業(yè)結(jié)合較少,許多公司沒有充分利用微軟的GPT能力。然而隨著微軟云服務(wù)的加 入,許多科技公司和傳統(tǒng)公司都開始接入微軟的云上GPT。一些代表性的企業(yè)也已經(jīng)接入了微軟的服務(wù),在這種情況下,據(jù)專家了解,微軟已經(jīng)選出了大約20多家企業(yè),將首先與他們整合數(shù)據(jù),然后一起探索算法上的突破。除此之外還是延續(xù)之前的研發(fā)思路進行研發(fā)工作3、微軟之前單獨為OpenAI建立了算力的供給,目前相應(yīng)算力供給的增長情況微軟目前給Open Al的算力供給基本保持不變,之前供給的算力目前來看是足夠支撐當(dāng)前的研發(fā)情況。然而目前的算力并不足以支撐GPT5的強化訓(xùn)練和后續(xù)的上線運行,因此微軟正在準備組裝一個超級計算平臺,以進一步滿足未來的需求。目前大約有8萬個A100芯片,但到今年年底預(yù)計就不夠用了。所以計劃擴展供給額外提供3萬個英偉達芯片的算力,對應(yīng)年底可能會達到11萬個A100芯片實際上OpenAl的需求是增加10萬個芯片,但由于合作中涉及到許多資源和成本,所以最終的判斷是先增加3萬個,這是基于微軟現(xiàn)有算力的實際使用情況和未來的增長預(yù)測。之所以O(shè)penAl希望更多,是因為他們認為可以在更多領(lǐng)域進行嘗試,擴大范圍,包括提升整體的運算速度。但實際上,微軟的科學(xué)家判斷提升可能并不會太多。因此最終與他們商定的是先提供3萬塊。5、GPT5相對于GPT4具體的更新(參數(shù)數(shù)據(jù)量能力更新等)GPT4的參數(shù)量大約是1.9萬億,模型層數(shù)是100多層。GPT5目前正在開發(fā)中,參數(shù)量預(yù)計將達到10萬億級別,層數(shù)將超過1000層,大概是1300多層。目前在視頻數(shù)據(jù)量方面仍然比較有限,因為使用的是經(jīng)過壓縮的視頻進行訓(xùn)練,所以整體上相對較小。同時正在不斷增加數(shù)據(jù)量,當(dāng)前大約使用了5800億個視頻作為訓(xùn)練數(shù)據(jù),大約110萬億兆左右。6、谷歌和Meta做多模態(tài)是否相比OpenAI會更有優(yōu)勢,比如其視頻語料庫相對充足谷歌和Meta在處理視頻方面具有一定的優(yōu)勢。目前微軟通過Bing上的視頻和與許多合作供應(yīng)商合作來獲取視頻資源,雖然視頻數(shù)量還不如META和谷歌,但在整體起跑線上,差距并不絕對明顯。因為在開發(fā)新一代算法時,大家都需要對現(xiàn)有的積累進行大量改造。因此,在可用的視頻范圍和數(shù)量方面,與頭部差距大約是10倍左右。因此不會有質(zhì)的差異,但谷歌和Meta確實會有一定的競爭優(yōu)勢7、目前微軟或者OpenAI的視頻生成路徑,是直接生成視頻還是通過圖片拼接的方式現(xiàn)在大家基本上都是通過逐幀生成視頻,原理差別不大,目前主流的技術(shù)都是如此。所以在中短期內(nèi),視頻可能會比較短,但OpenAI已經(jīng)成功生成了大約15分鐘長的動畫片,特別是科幻動畫片,可以看作是目前的主要應(yīng)用領(lǐng)域。目前主要的瓶頸在于視頻生成的合理性,因為生成的視頻越長,越容易出現(xiàn)不合理的情況。其次受限于目前的算力,不可能同時支持大量視頻的生成,但在技術(shù)上并不存在算法瓶頸,也就是生成成視頻的算法技術(shù)問題。因此理論上生成視頻更話用于短視頻生成,因為時間較短,但實際上它也可以用于生成長視頻和電影等。同時現(xiàn)在有很多的方式可以規(guī)避生成視頻的跑偏與中斷,比如通過擬合和現(xiàn)有的視頻素材,包括比較強的糾偏等,當(dāng)前主要問題還是算力方面的支撐不夠。8、目前生成多長的視頻可能效果會好一些,時長到達多長以后可能效果可能會弱一些目前生成兩分鐘內(nèi)的視頻是沒有問題的,比如合理性等都沒有太大的問題,準確率可以達到95%以上。但是隨著生成時間的延長,比如一兩個小時的視頻,其中包含錯誤信息的概率就大大增 加,大約占到20%~30%左右,這些錯誤信息很可能是與現(xiàn)實邏輯不符合的情況。因此,目前更推薦生成兩分鐘以內(nèi)的視頻。在內(nèi)容素材方面,目前更容易生成動畫、簡單場景的機械運動以及已有素材的組合。比如可以剪輯一個新聞的片子,即使是已有素材的視頻形式的組合,過程中不僅僅是簡單的疊加或是拼湊幾張圖片,而是會加入一些中轉(zhuǎn)效果、穿插以及從庫中選擇其他視頻片段進行拼接等。然而對于一些復(fù)雜的場景,比如生成真人動作電影,目前難度非常大。
9、多模態(tài)模型后續(xù)的發(fā)展方向,是否需要在模型底層邏輯或結(jié)構(gòu)上進行調(diào)整針對實現(xiàn)識別和生成視頻的問題,有幾個方向可以進行工程化或者對模型結(jié)構(gòu)進行調(diào)整首先在算法層面,不能僅僅依賴現(xiàn)有算法生成視頻的邏輯,因為目前市面上的視頻生成算法實際上并沒有真正理解視頻元素的含義。OpenAl的目標是讓大模型能夠理解視頻的內(nèi)在含義,例如能夠理解場景、角色、物體等,并理解它們之間的延續(xù)性和影響。需要攻克的重點是讓算法能夠理解視頻的語義,目前在這方面已經(jīng)有了很多思路,但目前市面上還沒有很好的方法能夠真正理解視頻的意義。所以現(xiàn)有的視頻生成方法雖然可用,但并不理想。需要講行算法底層邏輯的融合和創(chuàng)新,從而能夠理解視頻的語義,并按照特定的語境語義生成深層次的視頻。另外在工程方面,OpenAl對性能要求也更高。前面提到的很多模型生成視頻時,實際上并沒有深入理解語義的情況,這就導(dǎo)致算力需求并不高,因為理解的不深入。但是一旦增加了更多元素并深入理解后,算力需求就會呈指數(shù)級增長。因此,如果想要邁向下一步的突破,需要千倍甚至更多的算力支持。10、目前模型性格的落地或者商業(yè)化進展與預(yù)期對比如何目前微軟在Windows的Bing、Copilot以及第三方云應(yīng)用中取得了重大的成果。特別是在第三方公司使用微軟的云服務(wù)表現(xiàn)超出了預(yù)期。本來公司期望是相應(yīng)公司能夠集成GPT在Word、Windows等產(chǎn)品中,使得用戶在這些場景下能夠更好地使用。但實際情況是相反的,他們自己集成的GPT的調(diào)用量反而超過了微軟已有的Word和其他微軟產(chǎn)品的組合調(diào)用量。因此對于GPT的需求在這些公司中比個人用戶更強烈。主要行業(yè)以科技行業(yè)為主,比如客服機器人、語音對話平臺和陪聊等,這些行業(yè)的調(diào)用量最高。但在整個Microsoft Ofice和Windows的使用中,模型的調(diào)用次數(shù)略低于預(yù)估B端是結(jié)合不同行業(yè)的應(yīng)用場景,比如一些公司和客服機構(gòu)需要處理大量的對話信息,因此他們需要更多陪聊的能力,通常會產(chǎn)生很多輪次的對話,其中對話是多輪且無法預(yù)測的。在接入GPT后,可以讓GPT與客戶進行互動,相比普通消費者直接使用微軟的文檔或使用Bing解決問題,B端場號客戶的需求更加強烈同時于C端用戶,他們需求還是更多被傳統(tǒng)的方式所滿足比如搜索引擎等。因此不同的需求強度和場景限制導(dǎo)致B端的整體調(diào)用量大于C端。實際上公司最初并沒有考慮在C端進行太多的變現(xiàn),而是以B端為主要變現(xiàn)方式。比如Ofice產(chǎn)品是一個典型的代表,其主要以B端的商業(yè)化為主,盡管看到Ofice在C端很暢銷,但C端用戶的收入并不如B端的十分之一。原因在于C端用戶大部分還是使用盜版,而B端客戶只要是稍大一點的公司,都會購買正版。除此之外,微軟還有許多與政府的合作項目和定制企業(yè)項目,特別是像律師事務(wù)所和專業(yè)領(lǐng)域的公司它們特別需要工具進行迭代,所以他們非常愿意為微軟的工具付費。他們有很強的付費意愿,而且愿意支付高價。整體B端肯定會比C端帶來更多的收入,但是為什么微軟還要做像Ofice 365這樣的套件升級?其實首先要占領(lǐng)市場,其次要培養(yǎng)用戶的意識,讓大家意識到他們的工作可以與個人助手一起分擔(dān),養(yǎng)成這樣的用戶習(xí)慣。最后在打磨好相應(yīng)場景后,最終向B端客戶傳到并收費針對當(dāng)前Copilot的購買意愿,實際上歐美地區(qū)的客戶非常愿意購買相應(yīng)服務(wù),大約有8%的用戶選擇了付費服務(wù)與預(yù)期10%差別并不大。共性相應(yīng)企業(yè)通常與科技相關(guān),不論是新興企 業(yè)、傳統(tǒng)企業(yè)還是互聯(lián)網(wǎng)和軟件公司,它們都與科技相關(guān),尤其是些傳統(tǒng)的媒體和廣告公司,雖然它們屬于傳統(tǒng)分類,但實際上它們從事的是新媒體和科技賦能的活動,因此與微軟有接觸的公司通常都屬于科技新興企業(yè)的范疇。目前還沒有遇到純粹的傳統(tǒng)企業(yè)購買微軟的云服務(wù),大多數(shù)情況是由傳統(tǒng)企業(yè)集團旗下的科技分公司來采購。其次由于微軟非常注重隱私保護,并承諾不查看用戶數(shù)據(jù),只提供模型服務(wù)給客戶使用,所以只能判斷調(diào)用量大的企業(yè)包合以下幾類:互聯(lián)網(wǎng)企業(yè),主要指那些本身就從事互聯(lián)網(wǎng)媒體工作,并使用對話機器人的企業(yè);而做客服軟件科技的企業(yè)則是第二類;第三類是專門從事內(nèi)容創(chuàng)作的科技公司,比如素材創(chuàng)作和新聞資訊等,此外,其他行業(yè)的公司則屬于細分子場景,沒有特別突出的特點。15、當(dāng)前企業(yè)端需求的持續(xù)性如何目前相應(yīng)領(lǐng)域已經(jīng)經(jīng)歷了一個相對長期的發(fā)展階段,并且正在朝著固化流程的方向發(fā)展。比如客服機器人已經(jīng)成功地應(yīng)用GPT技術(shù),并在實際場景中發(fā)揮作用?,F(xiàn)在很多實際場景已經(jīng)將GPT的能力作為基礎(chǔ)服務(wù)進行賦能,但是仍然存在提升和探索的空間他們很有可能不會撤銷這項服務(wù),調(diào)用量基本上是持續(xù)增長的。16、如何理解微軟對OpenAI研發(fā)的影響,以及后續(xù)OpenAI模型與微軟產(chǎn)品的結(jié)合情況首先,微軟一直是OpenAl的主要股東,提供了包括硬件、戰(zhàn)略平臺、數(shù)據(jù)以及其他工具和服務(wù)等各方面的支持扮演著OpenAI的主要支持者角色。其次,微軟的科學(xué)家在GPT-4中已經(jīng)貢獻了大約三分之一的研究人員,與歐洲聯(lián)盟的團隊一起進行探索。實際上在GPT-5中,微軟的科學(xué)家將占據(jù)大約一半比例,并在研發(fā)工作中有一定分工??傮w上微軟將逐步承擔(dān)在特定領(lǐng)域的開發(fā)工作,并逐步發(fā)揮主導(dǎo)作用。盡管整體框架仍然由OpenAl主導(dǎo),但對于特定領(lǐng)域的特殊算法,微軟起著決定性的作用。因此,兩個團隊之間形成了緊密的合作關(guān)系。而且微軟的投入將會比以前更大,微軟的影響力也會更大。隨著時間的推移,OpenAl將持續(xù)將大型模型的能力輸出到微軟的產(chǎn)品中,由于OpenAl現(xiàn)在非常依賴微軟,合作并不會中斷。17、微軟Azure云已經(jīng)接入了OpenAI以外的開源模型,是否會影響微軟和OpenAl的合作并不會影響微軟和OpenAl的合作。因為微軟和OpenAl在思路上有一些不同,微軟是一家大型公司,擁有多個部門和集團,其中云部門是其中之一,研究院則是另一個重要部門。研究院主要為AI領(lǐng)域提供科學(xué)家與OpenAl進行合作,而云部門則擁有自己的平臺戰(zhàn)略。云部門致力于構(gòu)建一個開放的平臺,不會限制客戶使用云服務(wù)或者使用計算資源。在研究院方面,與OpenAl有著緊密的合作,在共同開發(fā)GPT等相應(yīng)產(chǎn)品方面,整體不存在沖突的情況。ChatGPT下載量提升,堅定看好AI應(yīng)用9/25起,ChatGPT Plus/企業(yè)用戶可使用語音及圖像交互功能據(jù)Data ai,ChatGPT美國地區(qū)iOS的下載榜排名,由9/24的第19名,最高上升至9/26的第3名,目前位于第5名。--------------------------此前ChatGPT訪問量,在3-4月達頂峰,此后下滑。此次升級(尤其是語音交互),顯著提升普通用戶與AI交互的體感,擺脫純文字的枯燥,To C進一步打開。“ChatGPT”一詞的谷歌搜索熱度,也在9月底回到75左右(3-4月為100),普通用戶對AI應(yīng)用的關(guān)注,正在逐步回暖。目前語音功能尚未對全部用戶開放,若后續(xù)大范圍放開,預(yù)計ChatGPT使用率將進一步提升。#10月15-16日: 英偉達AI峰會,黃仁勛將發(fā)言1)系統(tǒng)性重視游戲:估值調(diào)整到位,版號常態(tài)化/景氣回暖,9月買量成本有下降#愷英網(wǎng)絡(luò) (小游戲進入前10)、吉比特 (M66重啟預(yù)約)、#三七互娛 (小游戲第1)巨人網(wǎng)絡(luò) (AI玩法內(nèi)測)、#盛天網(wǎng)絡(luò) (AI音頻社交)神州泰岳 (AI催收)#萬興科技 (天幕大模型)中文在線 (AI漫畫) #芒果超媒 (超跌+關(guān)注10月招商會催化)
本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請
點擊舉報。