機器之心報道
作者:張倩、澤南
顛覆生產(chǎn)力,從這里開始。
給你一份包含成績單的 Excel 文件,要求「成績 <60 顯示不及格,成績在 60-80 間顯示良好,成績> 80 顯示優(yōu)秀」,你會怎么操作?通常來講,這種問題需要借助公式來實現(xiàn),但不常接觸 Excel 的人可能不記得具體公式,于是每次遇到需要用公式的地方都會感覺手足無措,并把這種困難歸咎于自己沒好好學或記性不好。
但是,你有沒有想過,這或許是工具的鍋?
「我做了 20 年辦公軟件,我一直都覺得辦公軟件非常難用?!购茈y想象,這句話出自金山辦公 CEO 章慶元之口。
在他看來,包括 WPS 在內的辦公軟件往往集成了大量的功能和 API 接口,但普通用戶上手卻非常困難。這既是用戶的痛點,也是工程師們一直以來想要解決的問題。早在 2021 年金山辦公技術開放日上,金山辦公副總裁姚冬曾表示,「一個成熟的辦公軟件應該學會自己制作 PPT」。
好在 2023 年,大模型來了,事情迎來了轉機。
如果你是 WPS 的用戶,你最近可能會觀察到一些變化:一個叫「智能文檔」的新功能已經(jīng)能夠幫你提供新聞稿、廣告文案、教學教案、工作周報等種種文件的自動寫作。即使它寫的內容無法完全采納,但至少能給你提供一個模板或思路,讓你不必對著一片空白發(fā)呆。
這個新功能其實是金山辦公 「WPS AI」辦公套件的一部分,背后是業(yè)內領先的大模型技術。隨著更多功能的陸續(xù)開放,它還可以幫你一鍵生成幻燈片、一鍵分析 Excel 數(shù)據(jù)、翻譯總結文檔,自己寫日報等等。
9 月 20 日,在 2023 金山辦公技術開放日活動中,金山辦公宣布,基于大語言模型的智能辦公助手 WPS AI 已接入旗下全系產(chǎn)品,邀請用戶體驗全組件 AI 功能。
可以說,姚冬的「預言」已經(jīng)在一定程度上被 WPS AI 實現(xiàn)了。在國內,他們甚至比微軟的 Microsoft 365 Copilot 還快了一步,成了第一個將大語言模型(LLM)應用在辦公軟件領域,并真正交付了可用產(chǎn)品的公司。
之前我們在看發(fā)布和 PPT,現(xiàn)在手上突然有了實物,大家不免好奇,自己手機和電腦上的 WPS 變成了什么樣子,會有哪些黑科技?能不能盡快用上?在技術開放日上,我們獲得了更多第一手的消息。
如何幫助每一個打工人?
和很多提前放出消息的大模型生產(chǎn)力工具一樣,WPS AI 此前已經(jīng)進行了公開亮相:第一次是在 4 月份,聚焦的是 AI 的生成能力;第二次在 5 月份,聚焦于智慧助理和知識洞察。這也代表了 WPS AI 未來的三個演進方向。
首先來看第一個方向:AIGC(內容創(chuàng)作)。AIGC 中的「G」代表生成,這是大家能夠從 ChatGPT、WPS AI 等工具中感受到的最直觀的應用方向。在已經(jīng)開放的 WPS AI 智能文檔功能中,我們看到它可以生成很多非常實用的文本類型,比如招聘崗位介紹、產(chǎn)品需求文檔、運營策劃案、教學教案、電商直播臺本……
它們和普通人的日常工作息息相關。其實,大家在接觸一個新工作領域時都多多少少會遇到這種「無從下手」的情況,WPS AI 就能幫你克服這個「從 0 到 1」的困境。下圖是我們在輸入一些提示后得到的直播臺本,可以看到,這個臺本從臺詞到直播間背景再到展示動作都設計好了,足以幫一個剛接觸直播的從業(yè)者走出第一步:
除了已經(jīng)開放的「智能文檔」,WPS AI 還對外展示過一鍵生成 PPT 等功能,只用一分鐘左右就可以生成一份 15 頁左右的 PPT,而且支持風格選擇、局部修改,解決了演示文稿制作難度大、耗時長的辦公難題。這些功能現(xiàn)在也已經(jīng)和智能文檔一起同步開放了。
接下來是第二個方向:Copilot(智慧助理)。在打工人的職業(yè)生涯中,每個人都要積累工作、學習資料,但如何快速消化這些資料并在需要的時候正確運用是個更大的問題。這就是金山辦公已經(jīng)著手在做的事情:WPS AI 可以迅速幫你閱讀資料,并把它們變成一個可以以問答形式交互的知識庫。
比如,在培訓時為了記住更多的內容,你可能會把 PPT 一張不落地拍下來,但要把這些內容變成個人筆記是一個非常耗時間的事情。而時間一長,你也不記得某個知識點在哪頁 PPT 上。但現(xiàn)在,WPS AI 可以幫你做這些事情:它會在極短的時間內幫你消化掉拍到的內容,并回答你關于這個文檔的問題。
同樣的功能也適用于閱讀合同等場景,AI 可以幫你看完幾十頁復雜的內容,對你提出的需求給出準確答案。
最后一個方向是 Insight(知識洞察),這其實非??简灱夹g能力。很多時候不會干一個活的原因是這樣:我們知道 Excel 可以編程,有很多好用的能力,但不知道要完成我這個任務需要用哪個能力。WPS AI 把這個門檻打下來了,你只需要用自然語言寫出命令,它就可以幫你去找軟件內置的能夠承擔這些任務的功能按鈕(或公式),然后自動把你交代的事兒干完。
這就相當于,WPS AI 給每個普通人配置了一個 7x24 小時隨時在線的 Office 高手,這個高手不僅能懂你想要什么,而且對軟件的所有復雜功能了如指掌,就問你動不動心?
「未來,你對辦公軟件提出的需求『只要想到就能做到』。交互界面會發(fā)生翻天覆地的變化,也可能會出現(xiàn)全新的應用生態(tài),」姚冬表示。
WPS AI 為什么走得那么快?
看到這么多豐富的 AI 新功能,很多人可能都想問:能盡快讓大家用上嗎?金山辦公給出的答案是:能。截至目前,WPS AI 已經(jīng)進入了邀請測試的階段,可以通過 ai.wps.cn 申請體驗。
擁有能夠快人一步落地全線生產(chǎn)力工具大模型能力,是因為金山辦公在這輪 AI 變革中,選擇了一條「揚長避短、博采眾長」的路。
所謂「長」,即金山辦公在過去 35 年里積累的在辦公軟件方面的技術經(jīng)驗及過硬產(chǎn)品。
很多人可能記得今年 4 月份被 Adobe Firefly 刷屏的經(jīng)歷,這款應用能夠根據(jù)文字描述一鍵生成圖像,還能智能生成獨特的文字效果,讓人驚呼設計行業(yè)要被顛覆了。而它之所以能產(chǎn)生這么大的能量,離不開多年以來構建起來的成熟產(chǎn)品體系,如 Photoshop、Illustrator 等。這些產(chǎn)品本身具備繁雜的功能,有成百上千的按鈕,AI 的加入讓這些按鈕被徹底盤活,其中的想象空間必然是巨大的。
WPS 也面臨類似的情況,金山辦公用 35 年的時間打造了一個「巨無霸」工具,僅一個空白的 WPS 文檔就有 9 個工具卡、接近 200 個按鈕,其中很多功能都經(jīng)過了多年的打磨,比如表現(xiàn)驚艷的 PDF 識別分析源于金山辦公 2017 年就開始研發(fā)的 OCR 技術,PPT 智能排版是金山辦公 2016 年就開始探索的方向??梢哉f,金山辦公已經(jīng)有一個成熟的軟件體系可以與 AI 大模型做深度結合,而且對用戶需求有足夠了解且積累了大量使用場景,這是當前很多圍繞 AI 大模型做應用的公司所不具備的。
那么,如何破除二八定律,讓更多的人能用上這些能力?金山辦公沒有選擇自己從頭研發(fā)大模型,而是選擇做甲方,調用多家業(yè)內領先的大模型,「本著務實的態(tài)度,哪家做得好用哪個」。對于普通用戶而言,這意味著可以更快獲取大模型的能力,獲得的也是業(yè)內最強的能力。
WPS AI 接入大模型的歷程大概經(jīng)歷了三個階段。自去年年底起,大模型技術開始在業(yè)內興起,金山辦公的工程師們構建了一些產(chǎn)品原形,開始進行技術驗證。很快,金山辦公開始圍繞大模型建立工程體系,啟動了產(chǎn)品開發(fā)的流程,技術穩(wěn)定性、產(chǎn)品交互體驗的不斷迭代。直到今天,WPS AI 真正實現(xiàn)了全面上線運營。
WPS AI 選擇的合作方包括百度文心一言、Minimax 和智譜 AI,都是超過千億級參數(shù)的大模型。需要關注的是,每一家的登記驗證、數(shù)據(jù)傳輸、調用協(xié)議、參數(shù)調整方式都不一樣,如何讓各家科技公司的大模型 API 協(xié)同一致?金山辦公做了一個「AI 網(wǎng)關」來統(tǒng)一管理不同的大模型能力。在接入層解決問題,產(chǎn)品和業(yè)務人員就不需要關心兼容與合作問題。
在用上千億級大模型后,把大模型轉化為生產(chǎn)力還需要提示詞調優(yōu)。金山辦公在 WPS AI 背后構建了一個提示詞平臺,內嵌提示詞調優(yōu)工程能力,讓大模型可以更好地適配差異化場景。
提示詞平臺可以幫助你在特定的任務上使用效果最好的提示詞。工程師們可以在后臺為某個任務構建專用的提示詞,然后嘗試不同的參數(shù)選項,測試提示詞輸出的效果,一旦測試完成后就能進行發(fā)布,成為一個功能。在實際使用過程中,用戶向 WPS AI 提出的一些需求可能只有 20 字,但背后大模型實際上接收到的指令可能會有 200 個字。
只有這樣才能保證使用不同的大模型,都能獲得同樣高質量的結果。「在應用時,大模型是工程的基礎設施,我們還要解決應用、產(chǎn)品開發(fā)和各類工程級別的問題。從應用廠商的角度來說,工程層面的挑戰(zhàn)比想象中要大,」姚冬表示?!钢苯咏尤氪竽P偷姆绞绞切胁煌ǖ??!?/span>
在做好了千億級大模型的適用和調優(yōu)之后,WPS AI 還要面臨第三個挑戰(zhàn):大模型的運行成本很高,如何讓有限的算力滿足大量小眾場景?
對此,金山辦公基于業(yè)界領先的開源模型設計了 7B、13B 小體量模型,并面向個性化細分場景進行了一系列增量訓練。
本周三的技術開放日,金山辦公首次對外展示了自研模型的進展。
它們的核心作用在于意圖理解?!冈诘谌酱竽P椭猓覀兪褂眯∧P蛯τ谟脩舻囊鈭D首先進行歸類:用戶想要做什么,WPS AI 需要調用哪一項產(chǎn)品、哪一個大模型,或者只是簡單的聊天 —— 然后再把需求導入到對應的產(chǎn)品中去,」姚冬介紹道。「意圖分類與應用場景是息息相關的。我們必須自己標注數(shù)據(jù),自行訓練模型,才能實現(xiàn)足夠好的效果?!?/span>
此外,各項表格功能中自動寫公式的模型也是金山辦公自己完成的。相比通用化大模型,金山辦公自建的模型有著更好的性能。
「金山辦公未來計劃把 Copilot 能力拓展到更多工具上,我們希望未來的辦公軟件只有一條工具欄,所有復雜任務都只需要向 AI 提需求就可以完成,」金山辦公 CEO 章慶元說到?!肝覀兩踔量赡懿辉贂蜣k公軟件增加新功能了 —— 新的能力是基于我們向大模型提需求,它自動生成代碼來執(zhí)行的方式來實現(xiàn)的。AI 會大幅降低辦公軟件的使用門檻?!?/span>
變革從這里開始
WPS 是與億萬打工人朝夕相處的存在。截至今年 6 月底,其主要產(chǎn)品月度活躍設備數(shù)已達 5.84 億,用戶通過公有云上傳的云文檔數(shù)量已超 1900 億。雖然經(jīng)常顯得低調,但 WPS 早已成為我們不可或缺的生產(chǎn)力工具。
另一方面,大語言模型等生成式 AI 技術的落地正在改變我們的效率,數(shù)字辦公正在呈現(xiàn)新的趨勢。
在金山辦公內部,WPS AI 已經(jīng)大規(guī)模使用一段時間了,大模型顯著提升了人們的工作效率?!笍奈易约旱捏w驗來說,現(xiàn)在做一個 PPT 可以節(jié)省半小時左右。有了 AI 之后,起草文案和找模板的步驟都可以省略掉,直接進入調整和修改的階段,」姚冬說到?!冈诮鹕絻炔?,最常用的功能是創(chuàng)作類,讓 AI 幫助人們寫東西,隨后是輔助操作,最后是文本的閱讀理解。隨著 WPS AI 用戶數(shù)量的增多,或許還會有新的變化出現(xiàn)?!?/span>
金山辦公副總裁姚冬在 2023 金山辦公技術開放日上。
在金山辦公的眼中,WPS AI 的最大優(yōu)勢在于通過大模型能力把功能全面且復雜的 WPS 軟件體系整合在了一起,讓人們日常使用的成千上萬需求僅需要自然語言就能完成表達,并快速連接到正確的功能上獲得滿足。
這就是 AI 對于人機交互方式的重塑。過不了多久,以自然語言為主的溝通方式就會成為我們工作的重要一環(huán),大模型的能力將接管所有枯燥的工作,提升我們的生產(chǎn)力,讓我們能把精力專注于更具創(chuàng)造性的事務上。
這樣的變革,或許隨著未來 WPS AI 的全組件功能正式上線而開始。
聯(lián)系客服