2023開年,ChatGPT的現(xiàn)象級爆紅,引發(fā)了一場全球互聯(lián)網(wǎng)巨頭關(guān)于AIGC的“軍備競賽”,谷歌、微軟、百度、Meta等都紛紛下場。而能夠與人進(jìn)行自然對話、回答問題的ChatGPT的問世,也讓大型語言模型這種抽象高端的概念變成了人人都能用上的“個人助理”,一時間風(fēng)頭無兩。近日,ChatGPT開發(fā)公司OpenAI發(fā)布了下一代大型語言模型GPT-4,這不僅是用于支持ChatGPT和新Bing的最新AI大型語言模型,還支持了Microsoft 365的新功能Copilot,幫助用戶更高效地辦公。據(jù)悉,ChatGPT在許多專業(yè)測試中的表現(xiàn)超出了“人類水平”,消息一出,再次引起人們對AIGC的高度討論。所謂AIGC(AI-Generated Content),就是人工智能生成的內(nèi)容。簡而言之,就是人工智能可以借助已有的材料庫,按照用戶需求生成對應(yīng)的內(nèi)容。目前,AIGC已經(jīng)應(yīng)用到音樂、繪畫、音頻等各個領(lǐng)域,讓大眾真切感知到了技術(shù)革命背后的創(chuàng)造力。在音樂領(lǐng)域,除了輔助音樂創(chuàng)作,AIGC技術(shù)也開始被用于創(chuàng)新用戶體驗。比如,在國外,Spotify最近推出DJ模式,讓AI改善推薦歌曲體驗;在國內(nèi),QQ音樂等音樂平臺在利用AIGC技術(shù)方面做了不少的嘗試。本文將以QQ音樂的AI功能應(yīng)用為例,盤點音樂與AIGC結(jié)合的想象空間。如今,打開QQ音樂就會發(fā)現(xiàn),AIGC已經(jīng)遍布QQ音樂的各處細(xì)節(jié)中,從聽歌體驗、視覺呈現(xiàn)、社交分享等多個維度,做了不少有趣的創(chuàng)新嘗試。點開推薦歌曲開始聽歌時,頗具設(shè)計美感的AIGC黑膠播放器就映入眼簾。與以往的歌曲專輯封面播放不同, QQ音樂新上線的AI播放器是國內(nèi)音樂行業(yè)首個在AIGC領(lǐng)域運用的視覺嘗試,其原理是通過在AI工具輸入關(guān)鍵詞,讓AI算法組合各種元素,生成有創(chuàng)意的播放器風(fēng)格?,F(xiàn)在,QQ音樂已推出機(jī)械裝甲、雪山白、積木游戲、工業(yè)灰等 6款供用戶選擇,據(jù)悉還將結(jié)合場景,有更多樣式可以期待。如果播放的歌詞正符合當(dāng)下的心情,想要分享到朋友圈、微博等社交媒體,這時候,“AI歌詞海報”功能就派上用場了。不管是古風(fēng)、流行還是說唱,基于Stable diffusion 和Disco diffusion兩個模型,短短幾秒,都能根據(jù)歌詞一鍵生成對應(yīng)畫風(fēng)的海報,為用戶省去尋找配圖的時間。而在這背后,是騰訊音樂天琴實驗室業(yè)內(nèi)首創(chuàng)的AI音樂視覺生成技術(shù)MUSE(Music Envision)帶來的支持。作為國內(nèi)音樂行業(yè)內(nèi)率先布局AIGC領(lǐng)域的平臺,QQ音樂憑借對音頻、歌詞的深度理解和用戶需求的前瞻洞察,實現(xiàn)了音樂行業(yè)首創(chuàng)的規(guī)?;魳泛罄L制技術(shù)。據(jù)悉,該技術(shù)還用于為曲庫中大量無專輯歸屬的游離單曲生成適配的歌曲封面,大大提高了用戶視覺體驗,音樂人也可以基于該技術(shù),自主制作專輯圖。在基于MuseAI算法的支持下,QQ音樂也開發(fā)了頗具可玩性的“AI·次元專屬BGM”功能。用戶只要上人物傳照片,就能生成動漫風(fēng)格的對應(yīng)圖片,還配有專屬BGM。除此之外,聯(lián)動天琴實驗室的AI技術(shù),我們還可以通過AI動聽賀卡功能,自行編輯祝福語和選擇歌曲,獲得AI生成的祝福語藏頭歌詞,并用所選歌曲的曲調(diào)演唱,一鍵生成定制祝福。不得不說,不管是逢年過節(jié)還是朋友生日,媽媽再也不擔(dān)心我為想祝福語而禿頭了,走心又有趣。當(dāng)我們打開QQ音樂簽到時,除了會收到每日根據(jù)用戶偏好及聽歌記錄的一首推薦歌曲,滑動卡片便可查看當(dāng)日運勢,收到一張AIGC生成的“今日運勢畫”。據(jù)悉,該畫作是依托于當(dāng)日推薦歌曲內(nèi)容,并融入今日幸運色元素生產(chǎn)的,好聽又好看。對于音樂愛好者而言,QQ音樂基于AIGC開發(fā)的“智能曲譜”功能也非常實用,頗受歡迎。由于網(wǎng)上的曲譜大多不完整,且篩選成本極高,如果想要學(xué)習(xí)心水歌曲的樂器彈唱,第一步就是耗時的扒譜。而如今得益于智能曲譜功能,就連《我記得》這種新歌也能直接找到曲譜,且吉他譜、鋼琴譜、尤克里里等主流曲譜一應(yīng)俱全。在此基礎(chǔ)上,QQ音樂還讓靜止的圖片曲譜動起來,在業(yè)內(nèi)首家推出“曲譜OCR”功能,基于圖像識別的方法自動識別樂譜中的和弦、音高、休止符等10類音樂信息,然后結(jié)合QQ音樂高精度歌詞信息,一鍵生成相應(yīng)的智能曲譜,幫助愛好者輕松自如彈唱,再也不用中途停下來手動翻譜子了。不同于一般人工的曲譜,QQ音樂的智能曲譜還有AB反復(fù)、原聲、節(jié)拍器、常用節(jié)奏型選擇和編輯等一系列功能選項。不僅如此,我們學(xué)完還能在QQ音樂彈唱小組進(jìn)行分享,結(jié)識同好。這一功能一經(jīng)推出就頗受好評,非常實用。總而言之,不論是QQ音樂積極結(jié)合AIGC讓用戶體驗更加個性化,還是提高音樂愛好者的學(xué)習(xí)效率,可以看出AIGC技術(shù)在音樂領(lǐng)域極高的契合度,也拓展了行業(yè)對AIGC與音樂結(jié)合的想象空間。嫁接音樂后,
如何打開AIGC的想象空間?
此前,法國知名DJ David Duetta在演出時候通過AIGC工具,以Eminem風(fēng)格寫了一首關(guān)于Future Rave的歌,還用Eminem的聲線錄了出來,觀眾反響十分“瘋狂”,令David Duetta直呼“音樂的未來在于AI”。而David Duetta絕不是唯一一個有此信念的人。在音樂領(lǐng)域,AIGC不論是作詞、作曲、還是人聲合成上都大有作為,僅僅是利用AIGC生產(chǎn)功能性音樂,就能創(chuàng)造巨大商機(jī),更別說成為輔助音樂創(chuàng)作的主流技術(shù),或是打造虛擬藝人等等想象空間了。可以說,AIGC應(yīng)該是繼流媒體之后對音樂行業(yè)最具顛覆性的技術(shù)。面對這一歷史機(jī)遇,Spotify、三大唱片等音樂公司已經(jīng)積極入局AIGC領(lǐng)域,試圖搶占先機(jī)。例如華納投資AI音樂創(chuàng)作平臺Lifescore、環(huán)球音樂投資AI音樂創(chuàng)作平臺Soundful、索尼音樂自主研發(fā)AI輔助音樂創(chuàng)作應(yīng)用Flow Machines。毫無疑問,音樂公司們爭相探索AIGC已經(jīng)成為新趨勢。在國內(nèi),QQ音樂率先洞察到了人工智能和AIGC的巨大潛力,并進(jìn)行布局。在2019年,QQ音樂旗下聽歌識曲團(tuán)隊獲得了Mirex音頻指紋大賽冠軍,同時打破了三項世界紀(jì)錄;2020年,QQ音樂獨創(chuàng)的Predictive Model(PDM)技術(shù)也打破了“預(yù)測識別(Patterns for Prediction)”世界紀(jì)錄,助力潛力好歌挖掘,成為行業(yè)標(biāo)配的賦能工具;還成功將基于DNN的翻唱識別技術(shù)引入聽歌識曲場景,開創(chuàng)了革命性的第一代聽歌識曲系統(tǒng),識別率提升了12%。2021年,在QQ音樂多媒體研發(fā)中心基礎(chǔ)上,TME成立首個音視頻技術(shù)研發(fā)中心——天琴實驗室,專注于音視頻相關(guān)AI研究,研發(fā)了聽歌識曲、智能修音、音頻超分、臻品母帶、翻唱識別、唱歌評分以及行業(yè)首創(chuàng)的MUSE AI音樂視覺生成技術(shù)明星產(chǎn)品。其中,天琴實驗室研發(fā)的“歌詞生成方法”和哼唱識別還分別斬獲了國家級專利獎和深圳市專利獎。截至目前,天琴實驗室累計發(fā)布10余篇國際頂會論文,獲得500余項發(fā)明專利,主導(dǎo)參與多項音樂行業(yè)標(biāo)準(zhǔn)制定,成為行業(yè)內(nèi)頂尖的音視頻研究實驗室。最近,天琴實驗室還面向海內(nèi)外首次發(fā)布三套開源數(shù)據(jù)集,分別涉及片段翻唱識別、哼唱識別和歌唱評價,以夯實產(chǎn)業(yè)發(fā)展基礎(chǔ),為數(shù)字音樂產(chǎn)業(yè)升級注入新活力。此外,輸入歌詞即可隨唱隨跳的虛擬人“小琴”也是出自于天琴實驗室之手。小琴基于天琴實驗室Music XR Maker系統(tǒng)和MUX設(shè)計中心的支持,體現(xiàn)了天琴實驗室在擬人舞蹈生成、歌唱表演生成、音樂燈光秀等方面的綜合成果。不難看出,從底層技術(shù)創(chuàng)新到融入產(chǎn)品功能升級,QQ音樂對AIGC的布局已初見成效,持續(xù)滿足豐富著用戶的音娛體驗,建立了行業(yè)先發(fā)優(yōu)勢。如果觀察QQ音樂的功能設(shè)計更迭,會發(fā)現(xiàn)QQ音樂不僅是靠著過硬的技術(shù)打底,更是靠著持續(xù)提升用戶體驗的核心理念,擅于在細(xì)節(jié)處利用尖端技術(shù)解決B端和C端的痛點,才得以不斷引領(lǐng)音娛體驗的迭代創(chuàng)新。正如用戶體驗專家Sean Gerety所說,“能驚艷所有人的,不是你所使用的技術(shù),而是你用技術(shù)創(chuàng)造的體驗”。在持續(xù)變幻的技術(shù)革命前面,唯有積極擁抱新技術(shù)、為我所用,推動行業(yè)革新,才能在新浪潮中站穩(wěn)腳跟。而QQ音樂在人工智能領(lǐng)域的持續(xù)布局,既為用戶帶來更具前瞻、個性化的音娛體驗,打開AIGC與音樂領(lǐng)域的想象空間,也將推動音樂娛樂生產(chǎn)生態(tài)的進(jìn)化。
本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請
點擊舉報。