今天我要給你介紹一款新一代的對(duì)話預(yù)訓(xùn)練模型ChatGLM3
它是由智譜AI和清華大學(xué)KEG實(shí)驗(yàn)室聯(lián)合發(fā)布的,是基于GLM-130B的對(duì)話微調(diào)版本。
它不僅可以生成流暢、有趣、有邏輯的對(duì)話,還可以執(zhí)行各種工具調(diào)用,如搜索、翻譯、計(jì)算、繪圖等。
它的性能在10B以下的基礎(chǔ)模型中最強(qiáng),超過了GPT-3.5等知名模型。下面我就來具體介紹一下它。
智譜AI是何方神圣?
智譜AI是一家專注于自然語言處理和大語言模型的人工智能公司,成立于2022年,總部位于北京。它的愿景是打造全球領(lǐng)先的大語言模型平臺(tái),為各行各業(yè)提供智能化的語言服務(wù)。
它擁有一支由清華大學(xué)教授、博士、碩士組成的高水平研發(fā)團(tuán)隊(duì),以及多位國(guó)際頂級(jí)會(huì)議(如ACL、EMNLP、NAACL等)的領(lǐng)域主席和程序委員會(huì)成員。它與清華大學(xué)KEG實(shí)驗(yàn)室保持緊密的合作關(guān)系,共同探索大語言模型的前沿技術(shù)和應(yīng)用場(chǎng)景。
智譜AI在2023年已累計(jì)獲得超25億人民幣融資,投資方包括社?;?、阿里、騰訊、高瓴等知名機(jī)構(gòu)1。目前,智譜AI估值已經(jīng)超過100億人民幣。
ChatGLM3的特點(diǎn)
ChatGLM3是基于GLM-130B的對(duì)話微調(diào)版本,繼承了GLM-130B強(qiáng)大的語言理解和生成能力,并針對(duì)對(duì)話場(chǎng)景進(jìn)行了專門的優(yōu)化。它具有以下幾個(gè)特點(diǎn):
它可以生成流暢、有趣、有邏輯的對(duì)話,不會(huì)出現(xiàn)重復(fù)、跑題、無關(guān)等問題。它可以根據(jù)用戶的輸入和歷史記錄進(jìn)行動(dòng)態(tài)調(diào)整,保持對(duì)話的連貫性和一致性。
它可以執(zhí)行各種工具調(diào)用,如搜索、翻譯、計(jì)算、繪圖等。用戶只需要輸入簡(jiǎn)單的指令或問題,就可以得到滿意的答案或結(jié)果。它還可以根據(jù)用戶的反饋進(jìn)行自我糾錯(cuò)和學(xué)習(xí),提高工具調(diào)用的準(zhǔn)確性和效率。
它支持多種語言和多種模式,如中文、英文、日文等。用戶可以通過設(shè)置選擇自己喜歡的語言和模式,如平衡模式、創(chuàng)意模式、精確模式等。不同的模式會(huì)影響對(duì)話的風(fēng)格和內(nèi)容,讓用戶體驗(yàn)更加豐富和多樣。
智譜AI透露,最新版本的ChatGLM-turbo在最新AgentBench上已略超出GPT-3.5。在算力方面,ChatGLM3已支持昇騰、海光DCU等10余種國(guó)產(chǎn)硬件生態(tài);考慮更多邊緣側(cè)需求,ChatGLM3提供1.5B、3B等更豐富的模型尺寸,支持在筆記本電腦、手機(jī)、汽車上部署。
性能如何?
ChatGLM3在多個(gè)評(píng)測(cè)任務(wù)上都表現(xiàn)出了優(yōu)異的性能,超過了GPT-3.5等知名模型。以下是一些評(píng)測(cè)結(jié)果:
實(shí)際體驗(yàn)如何?
我們?nèi)?shí)際體驗(yàn)一下,看看是否那么好
這個(gè)問題回答的不錯(cuò),描述準(zhǔn)確。我們?cè)倮^續(xù)追問
圖片里的價(jià)格都識(shí)別正確了,沒有毛病。繼續(xù)增加難度
計(jì)算的很準(zhǔn)確,我們繼續(xù)增加難度
到這里就有問題了,雙芝雙牛價(jià)格不對(duì)。
總體來說能力還是很強(qiáng)的,bing測(cè)試的結(jié)果都不如它。不知道有沒有小伙伴用這個(gè)圖試試chatgpt-4v,看看能否計(jì)算準(zhǔn)確。
個(gè)人使用一下我的評(píng)價(jià)是目前用過的國(guó)內(nèi)開源最強(qiáng)的AI大模型之一,暫時(shí)處于第一梯隊(duì),看好它的未來。
現(xiàn)在模型已開源,具體部署方法官方已詳細(xì)列出來了,有興趣的小伙伴可以自行體驗(yàn)。
代碼地址:
https://github.com/THUDM/ChatGLM3
官網(wǎng)地址:
https://www.chatglm.cn/
論文地址:
https://arxiv.org/abs/2103.10360
聯(lián)系客服