2013年,國內(nèi)第一個用HTML5語言編寫的微樓書在北大宿舍里誕生。其創(chuàng)造者是來自山東萊陽的89后小伙董少靈,他從高中時期就開始創(chuàng)業(yè),干過本地信息分類網(wǎng)站、蛋糕坊、電商網(wǎng)站、翻譯服務(wù)公司,直到微信公眾號的興起讓他看到了巨大的商機。當時,他發(fā)現(xiàn),大多數(shù)企業(yè)并不能很好地運營公眾號,又恰逢有客戶提到“能不能把公司宣傳冊搬到微信上”?第二年,還在北大國際法學院攻讀碩士的他正式成立兔展智能,僅靠著H5制作平臺,半年就獲客600萬。9年來,他帶領(lǐng)團隊自主研發(fā)了新一代內(nèi)容引擎、傳播大數(shù)據(jù)工具、營銷云平臺、數(shù)字人工具等產(chǎn)品,如今企業(yè)用戶規(guī)模已經(jīng)突破4000萬,涵蓋金融、醫(yī)藥、零售、地產(chǎn)、美妝等行業(yè)。業(yè)務(wù)高速發(fā)展的同時,公司也頗受資本市場青睞,目前已獲得9輪融資,其中不乏招商局、深創(chuàng)投、投控東海、越秀產(chǎn)業(yè)基金等頭部投資機構(gòu)。日前,在創(chuàng)業(yè)邦主辦的2023AIGC技術(shù)應用大會上,兔展智能入選2023值得關(guān)注的AIGC公司(模型層)榜單。同時,兔展智能正式對外發(fā)布以圖像視覺為核心的多模態(tài)大模型“兔靈”,與多數(shù)語言單一模態(tài)為核心的模型形成差異化優(yōu)勢。兔展智能創(chuàng)始人、董事長兼CEO董少靈表示,相較于ChatGPT、Claude等更多以語言為核心的多模態(tài)產(chǎn)品,兔靈大模型是一個視覺占7成、語言占3成的全新混合體?!巴谜乖谘邪l(fā)大模型之初,就沒想做到全知全能,而是只聚焦于解決垂直領(lǐng)域的問題,也因此可以更好地防幻覺。”
那么,兔靈大模型到底有何獨特之處?又將會誕生出哪些殺手級應用?采用什么樣的商業(yè)化策略?我們一一揭開。兔展智能從最早推出H5工具,到如今的基于全球第四代前端三劍客的數(shù)字內(nèi)容引擎,客戶一直以來所希望的無非是更低成本、更快捷、更多元、更豐富地把內(nèi)容生產(chǎn)出來,并且無需手寫前端代碼就能夠快速生成精美的移動端富媒體頁面,這也是他們一直以來使用兔展的原因。面對這一波生成式AI浪潮,圍繞人類敘事的三個環(huán)節(jié):交互體驗、感官和知識理解,經(jīng)過不懈的努力,兔展智能不斷做精、做深中國新一代AI數(shù)字內(nèi)容總裝線,最終形成了基于兔靈多模態(tài)大模型的AIGC內(nèi)容引擎。基于DragonDiffusion的AI圖像引擎是兔靈多模態(tài)大模型的關(guān)鍵核心,用戶只需要進行框選和拖拽,就可以輕松實現(xiàn)AI圖像編輯和再生成,配合用于文本到圖像擴散模型的控制器DragonAdapter,即可實現(xiàn)圖片生成精準可控,滿足商用場景訴求。據(jù)悉,DragonDiffusion,由北京大學張健老師團隊VILLA(Visual-Information Intelligent Learning LAB),依托北京大學深圳研究生院-兔展智能AIGC聯(lián)合實驗室,聯(lián)合騰訊ARC Lab共同帶來。DragonDiffusion和DragonAdapter均屬于兔展智能在圖像視覺領(lǐng)域的原創(chuàng)技術(shù)成果Dragon系列,其中還包括業(yè)界首個能精準高效生成創(chuàng)意中文字體的技術(shù)Dragon CN Encoder、智能排版布局技術(shù)Dragon Layout等,Dragon系列與FreeDoM(免訓練條件擴散模型)共同構(gòu)成了兔展智能圖像視覺素材生成高效、精準、可控的技術(shù)框架。董少靈提到,“語言領(lǐng)域,我們在科研上重點就做了一件事,也就是'防幻覺’這一基礎(chǔ)的機理——如何進行下一個詞的預測及其概率可行,讓機器不會對這世界上不存在的法律和案例胡編亂造,這也是ChatGPT在很多垂直領(lǐng)域的應用中,很多專業(yè)人士最核心的苦惱?!?/span>以ChatLaw為例,作為經(jīng)過防幻覺技術(shù)約束過的模型,其在多個法律測試機上跑分均超越GPT4?!?strong>這跟我們在視覺模態(tài)里核心關(guān)注精準控制生產(chǎn),是一脈相承的。”應用層面,分別包括以下三個環(huán)節(jié):在交互環(huán)節(jié),兔展智能基于全球第四代底層前端架構(gòu),推出了DragonCode智碼,促進開發(fā)環(huán)節(jié)大幅提效,為數(shù)字化內(nèi)容生產(chǎn)插上騰飛翅膀;在視覺環(huán)節(jié),Chat&Drag-Image智圖提供多種圖片再生成能力,Drag&Chat交互模式助力圖片生成精準可控;在理解環(huán)節(jié),致力于用大語言模型技術(shù)讓復雜知識變簡單的ChatKnowledge項目,涵蓋了法律垂直領(lǐng)域跑分第一的法律大模型產(chǎn)品ChatLaw,以及即將陸續(xù)發(fā)布的支持用戶在微信生態(tài)下搭建屬于自己知識庫的文件理解大模型產(chǎn)品ChatDocument、和輔助用戶金融研究與決策的金融研究領(lǐng)域語言大模型產(chǎn)品ChatFinance。
董少靈認為,在這一波生成式浪潮中,會誕生一批出彩的殺手級應用,而“Magic Point是成為爆款應用不可或缺的因素,要讓用戶覺得就如同變魔術(shù)一樣。”他指出,兔展智能之所以在創(chuàng)業(yè)之初半年獲得600萬用戶,到如今突破4000萬用戶,就是踩準了用戶這一心理。“十年前,在別人發(fā)給你的都是PPT、Word文檔,你卻能做出帶音樂和動畫效果的H5,會不會覺得很驚訝?”因此這就是當年的Magic Point。再如,多年來,設(shè)計藝術(shù)字、個性簽名是一門生意,在淘寶上甚至有店鋪月銷20萬單,而作為業(yè)界首個能精準高效生成創(chuàng)意中文字體的技術(shù),Dragon CN Encoder則可以讓用戶只花費極低的成本就可以快速生成創(chuàng)意中文字體。董少靈指出,目前市面上99%的工具都是套殼Stable diffusion,還沒有任何一款能夠自動生產(chǎn)中文字體的大模型。這樣一款應用配合國慶節(jié)或新聞熱點事件營銷就很容易破圈。例如,中國大模型終于解決了中文字體的自動生成問題,每個人都可以擁有自己的一款獨創(chuàng)字體,很容易點燃用戶的民族自豪感。如今,ChatDocument每天可以幫用戶節(jié)省30分鐘,ChatFinance可以成為用戶的金融顧問,ChatLaw則可以成為用戶的法律顧問,這些都已經(jīng)具備成為爆款的要素。“而接下來,誰能幫助設(shè)計師解決精準生圖的問題必火,誰能做到第一個生成中文字體,也有可能會火?!?/span>為了達成讓人類敘事更生動高效的愿景,兔展智能之所以既做大模型的上層也做底層,是由于用別人的底層一方面實現(xiàn)不了自己的想法,另一方面也解決不了金融客戶的合規(guī)、自主可控需求。董少靈透露。同時,在底層配比上,兔靈大模型的多模態(tài)也是一個獨特的存在。ChatGPT、Claude、Cohere更多的是以語言為核心的多模態(tài),先做語言,再做視覺,其語言占比可能達到了8成,而兔靈大模型則是一個視覺占7成、語言占3成的全新混合體。同時,兔展在研發(fā)大模型之初,就沒想做到全知全能,而是只聚焦于解決垂直領(lǐng)域的問題,也因此可以更好地防幻覺。兔展智能戰(zhàn)略與投融負責人董應賽表示,不少公司擁抱大模型,一開始往往并沒有想好落地場景和應用,只是很堅定地要投入到這件事中來。但兔展智能一直以來的風格是相對務(wù)實的,往往會從一些比較具象的客戶需求和場景入手進而形成商業(yè)閉環(huán)。對于這一波生成式AI,兔展智能更多的是“扎硬寨,打呆仗”,在應用層的推出上一直比較克制。董少靈說到,“去年,很多人忽悠我們做元宇宙,我們并沒有頭腦一熱扎進去,只挑選了既不眩暈且信息傳遞效率夠的一個細分場景推出了產(chǎn)品——MR短視頻?!苯衲甏汗?jié)期間,兔展還推出了AI數(shù)字人拜年小程序,只需上傳個人照片就可以一鍵生成自己數(shù)字人形象的拜年視頻。盡管這款小程序在春節(jié)期間一度火爆,但董少靈仔細研究抖音后發(fā)現(xiàn),平臺不給數(shù)字人直播流量,從本質(zhì)上來說還是一個fake story(虛假的故事)。因此,他建議創(chuàng)業(yè)者,在一些火熱的風口面前還需要有自己一定的判斷和堅守,若是不符合公司的長期價值就不能做,不如把更多的精力投入在團隊認可的事情上。相比元宇宙等風口,這波生成式AI一個非常重要的特征就是能夠讓更多人享受到AI的普惠化。例如,中國內(nèi)陸Photoshop的活躍用戶僅為300萬人,兔展目前用戶數(shù)量為4000萬,而借助生成式AI,以往沒有富媒體表達手段的人都將會是用戶,他們不再需要繪畫、PS等技能,一樣能夠做出精美的富媒體頁面。此外,在公共法律服務(wù)方面,即便是一個毫無法律知識的人也可以利用ChatLaw把訴狀生成出來,找到法援律師簽名蓋章后就可以遞交訴狀了。董少靈感慨道,創(chuàng)業(yè)就像一個萬米長跑,有的人短期內(nèi)掙錢可能沒問題,但在這個時代最終能夠贏得比賽的還是會屬于認真做事的創(chuàng)業(yè)者。“百模大戰(zhàn)”從未發(fā)生,應用層機會不可低估今年以來AI熱度持續(xù)攀升,近半年內(nèi)全球近百家公司、機構(gòu)相繼發(fā)布大語言模型相關(guān)產(chǎn)品。國內(nèi)也正面臨著“百模大戰(zhàn)”,有數(shù)據(jù)顯示,全國有至少130家公司研究大模型產(chǎn)品,其中做通用大模型的有78家。董少靈則認為,“百模大戰(zhàn)”從未發(fā)生,從資金、數(shù)據(jù)、算力這三要素上都難以支持。巧婦難為無米之炊,算力可以看作是火,數(shù)據(jù)是米,算法是巧婦,如果一家大模型公司沒有一個相當體量的某一領(lǐng)域領(lǐng)先的數(shù)據(jù)集就很難成事。哪怕算法人員都是頂級,沒有火和米,也同樣煮不出來飯。他直言,國內(nèi)真正在認真投資源做底座的大模型公司不會超過20家,但應用層能看到很多機會,未來甚至能長出上百上千個應用,并且存活率會很高,因此用“百用大戰(zhàn)”來形容更加貼切。電的發(fā)明和使用引發(fā)第二次工業(yè)革命,給人類帶來巨大的福祉和財富。董少靈指出,這一波生成式AI是對生產(chǎn)力、生產(chǎn)關(guān)系的系統(tǒng)性重塑,也是對人類理解智能、理解人、理解自己的一個重塑,是一場啟蒙運動+工業(yè)革命。未來應用層的繁榮是必然,會有非常多有價值的應用出現(xiàn),甚至是未曾涉及的空白領(lǐng)域(例如ChatDocument),并且成功率不會低,可能更多需要的是耐心。尤其是,與SaaS更多解決的是公司問題不同,這一波生成式AI切實解決的是個人問題,因此用戶付費習慣天然會變好,這就為應用的存活率提供了有利的條件。董少靈認為,若是把大模型當成某種類型的IaaS,在中國能夠真正掙錢的IaaS廠商只是極少數(shù),但是在IaaS之上卻能夠長出抖音、滴滴等無數(shù)個殺手級應用。云計算廠商甚至不敵這些應用公司的估值,所以,大模型應用層的機會完全不可低估,是一個真正能夠大批量產(chǎn)生機會的地方。同時,不要過度夸張大模型本身的商業(yè)價值,除非某家公司能夠在商業(yè)變現(xiàn)里做到壟斷級別,否則都不會太好掙錢。回顧近一年來的研發(fā)歷程,他坦言,做大模型更多的是焦慮與興奮并存。焦慮在于做大模型就意味著會對短期的營收、資源的投向造成一定影響,而興奮就在于其對于社會價值是不可同日而語的。“我們內(nèi)部很少討論是與否的問題,更多討論的是how,而不是why,如何更科學地投入才能讓成功率最高,才能夠抓住這波洪流一般的機遇。”作為擁有多年創(chuàng)業(yè)經(jīng)驗的老兵,董少靈也對大模型創(chuàng)業(yè)者給出了自己的建議。他談到,對于創(chuàng)業(yè)公司來說,先要學會“扎硬寨,打呆仗”,三要素(資金、數(shù)據(jù)、算力)中至少要具備其二,并且至少在兩個垂類里要具備數(shù)一數(shù)二的要素,再去拼自己所缺少的一項,才有可能真正坐上大模型競爭的牌桌。對于投資人來說,各家創(chuàng)業(yè)公司都有愿景和雄心壯志,短期可能看的是誰家熱鬧,冷靜下來看的是誰更具備能力。例如,一家缺少數(shù)據(jù)、從0獲客的公司就很難贏過擁有900T數(shù)據(jù)、已經(jīng)占據(jù)場景,有用戶飛輪和數(shù)據(jù)飛輪的公司。而兔展智能顯然是后者,董少靈相信:萬事都有因,只要因是對的,果自然就會來。
本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請
點擊舉報。