智能音箱的爆發(fā)是在消費(fèi)升級(jí)的背景下,人民日益增長的對(duì)美好家庭生活的需求和科技進(jìn)步的一次碰撞。
智能音箱在即將過去的 2018 年迎來了狂飆突進(jìn)的一年,中國的互聯(lián)網(wǎng)巨頭紛紛進(jìn)場(chǎng)。據(jù)測(cè)算,2018 年中國的智能音箱出貨量達(dá)到 2200 萬臺(tái),相較去年增長 10 倍之多。阿里、百度、小米和京東紛紛參與到補(bǔ)貼大戰(zhàn)當(dāng)中,小玩家已經(jīng)被排擠出市場(chǎng)。大洋彼岸的美國智能音箱市場(chǎng)同樣戰(zhàn)況焦灼,但亞馬遜和谷歌已經(jīng)跑到了前列,2017 年的市場(chǎng)優(yōu)勢(shì)得到繼續(xù)鞏固。
智能音箱類產(chǎn)品的功能流程
智能音箱產(chǎn)品的核心是會(huì)話系統(tǒng),例如:小愛同學(xué)/天貓精靈/小度在家等,然后跟人進(jìn)行會(huì)話。智能問答機(jī)器人又稱會(huì)話代理或智能代理(Intelligent Agent),是模仿人類對(duì)話的計(jì)算機(jī)程序,檢索用戶輸入,基于關(guān)鍵技術(shù)進(jìn)行內(nèi)置算法計(jì)算,再匹配數(shù)據(jù)庫并返回運(yùn)算結(jié)果。
智能問答機(jī)器人產(chǎn)品的關(guān)鍵技術(shù)包括自然語言處理、解析技術(shù)、語音識(shí)別、語義識(shí)別、SQL和相關(guān)數(shù)據(jù)庫、機(jī)器學(xué)習(xí)與深度學(xué)習(xí)等。
一般而言,智能問答產(chǎn)品的框架包含如下7個(gè)主要功能模塊,如下圖所示:
智能音箱/智能問答類產(chǎn)品的主要功能和處理流程:
用戶輸入模塊支持文本或語音模式(例如:您對(duì)某某音箱喊話說播放某某歌曲)。
識(shí)別技術(shù)模塊接收用戶輸入,采用語音及語義識(shí)別技術(shù)將其轉(zhuǎn)換為表達(dá)式。
自然語言處理模塊理解表達(dá)式,將其轉(zhuǎn)化并輸入至對(duì)話管理模塊。
對(duì)話管理模塊采取特定的算法進(jìn)行回復(fù)。
處理模塊進(jìn)行自然語言生成。
生成的回復(fù)文本經(jīng)語音合成。
完成文字至語音的輸出。
由于智能問答產(chǎn)品是基于人機(jī)交互服務(wù),由內(nèi)置規(guī)則和人工智能支持,它可嵌入眾多社交平臺(tái),如新浪微博、微信、Facebook Messenger、Slack、Telegram、Text Messages等,具備強(qiáng)大的社會(huì)性。
常常AI產(chǎn)品經(jīng)理就智能問產(chǎn)品實(shí)施框架,不同模塊結(jié)合不同技術(shù),多種算法的應(yīng)用使智能問答產(chǎn)品具備強(qiáng)大交互性。生動(dòng)有趣的用戶界面為人機(jī)交互增添了趣味性。此外,智能問答機(jī)器人還能夠在歷史交互中學(xué)習(xí),隨著時(shí)間推移改進(jìn)響應(yīng)的精準(zhǔn)性。
同時(shí),能讓用戶通過對(duì)話式服務(wù)高效準(zhǔn)確地執(zhí)行任務(wù)。正是智能問答產(chǎn)品具備社會(huì)性、交互性、趣味性、智能性及有效性,目前該類產(chǎn)品廣泛用于電子商務(wù)(例如:阿里旺旺、百度小度等)、醫(yī)療服務(wù)(情感關(guān)懷機(jī)器人)、休閑娛樂(度假酒店的智能語音窗簾、各種音樂類智能音箱)等領(lǐng)域,且產(chǎn)品功能愈漸創(chuàng)新,但智能問答類產(chǎn)品在學(xué)習(xí)領(lǐng)域的研究剛剛處于起步階段。
在智能音箱/問答類產(chǎn)品中,產(chǎn)品經(jīng)理做智能問答產(chǎn)品,必懂智能問答原理是:模擬人類對(duì)話的計(jì)算機(jī)程序,做哪個(gè)領(lǐng)域的產(chǎn)品需要預(yù)先構(gòu)建那個(gè)領(lǐng)域的知識(shí)庫,機(jī)器接收問題后經(jīng)過計(jì)算,返回最貼切的匹配。
同時(shí)結(jié)合AI的神經(jīng)網(wǎng)絡(luò)算法、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、自然語言理解逐步提升之前沒有預(yù)設(shè)的知識(shí)庫也能與人進(jìn)行交互。
阿里的天貓精靈
2017年7月份,在位于北京鼓樓的時(shí)間博物館,阿里巴巴 Ai Labs 舉辦「未來,開口即來」新品發(fā)布會(huì),宣布推出該部門第一款自主開發(fā)的智能音箱「天貓精靈 X1」,其售價(jià)僅為 499 元,其語音交互技術(shù)綜合采用了來自思必馳的語音識(shí)別、語音合成、算法降噪、環(huán)麥陣列,以及阿里 AliGenie的NLP和聲紋識(shí)別等。它能夠理解中文語音指令,通過語音交互實(shí)現(xiàn)購物、播放音樂音頻內(nèi)容、玩游戲、查天氣、問百科、充話費(fèi)、控制天貓魔盒等功能。
阿里巴巴人工智能實(shí)驗(yàn)室負(fù)責(zé)人淺雪介紹天貓精靈X1
在語音交互前端技術(shù)方面,“天貓精靈 X1”采用了思必馳環(huán)形六麥陣列技術(shù)(AISpeech 6mic)。在頂部的六顆高靈敏麥克風(fēng)有助于收集來自不同方向的聲音,從而更容易在周圍的噪音中識(shí)別出有用的信息,實(shí)現(xiàn)360°全角度拾音效果和5米遠(yuǎn)場(chǎng)交互。思必馳作為項(xiàng)目合作方,在這款音箱中提供了環(huán)形六麥陣列、語音識(shí)別、語音合成、回聲消噪及語音增強(qiáng)等技術(shù)方案。該款產(chǎn)品的NLP、聲紋識(shí)別等技術(shù)則來自 AliGenie,它集成了阿里巴巴積累多年的自然語言處理、人機(jī)交互等技術(shù)。
環(huán)形麥克風(fēng)陣列在智能音箱類家居產(chǎn)品中成為了寵兒,一是由于它能夠滿足家居環(huán)境下遠(yuǎn)場(chǎng)交互的需求,二是由于它能夠幫助智能音箱、智能中控、機(jī)器人等需要全角度拾音的智能硬件產(chǎn)品實(shí)現(xiàn)更好的收音效果。思必馳2015年即推出了國內(nèi)首款環(huán)形6+1麥克風(fēng)陣列,現(xiàn)已全面升級(jí)至環(huán)形6麥,算法更優(yōu)化且成本更低,目前在智能機(jī)器人和智能音箱領(lǐng)域有較為廣泛的應(yīng)用。
天貓精靈X1采用了最平凡的圓柱形設(shè)計(jì),有黑白兩種配色,高度為128mm,直徑為82mm。在硬件配置上,天貓精靈 X1采用了業(yè)內(nèi)首顆 SmartAudio專業(yè)處理芯片,相比此前市面上的主流芯片,處理效率提升25%,功耗降低32%。系統(tǒng)軟件方面,采用了一鍵聲波配網(wǎng)技術(shù),這讓天貓精靈 X1 不到 10 秒就能連上網(wǎng)絡(luò)。而配網(wǎng)對(duì)智能家居來說,非常有挑戰(zhàn)性,目前大部分產(chǎn)品配網(wǎng)時(shí)間平均大于 30 秒。
一個(gè)值得注意的細(xì)節(jié)是天貓精靈 X1 的底部設(shè)計(jì)了朝下發(fā)光的燈帶(12 顆高亮 RGB 喚醒燈),因此并不會(huì)直接刺眼,同時(shí)通過不同顏色的視覺反饋能夠表示不同的含義(1600 萬色),這一點(diǎn)在現(xiàn)場(chǎng)連線產(chǎn)品演示時(shí)也能注意到。
從產(chǎn)品功能方面,天貓精靈X1內(nèi)置阿里第一代中文人機(jī)交流系統(tǒng)AliGenie,相當(dāng)于一個(gè)“你的小秘書”,支持效率工具、訂日程、備忘提醒;音頻音樂播放;購物助手支持話費(fèi)充值、訂外賣;日常生活用品購買;健身教練支持倒計(jì)時(shí)、卡路里查詢等。 其背后擁有阿里體系龐大的內(nèi)容資源,可為用戶提供豐富多樣的服務(wù)。
基于阿里系的主生態(tài)網(wǎng)上購物,X1 推出了聲紋識(shí)別,還打通了支付環(huán)節(jié)。用戶先將自己的聲音注冊(cè)后生成聲音密碼,與機(jī)器綁定后,確認(rèn)開啟聲紋購功能。隨后,當(dāng)用火狐說出 “幫我買一箱牛奶” 這樣的需求時(shí),天貓精靈會(huì)要求用戶跟著念一串隨機(jī)數(shù)字進(jìn)行聲紋校驗(yàn),如果確認(rèn)為用戶本人,天貓精靈會(huì)從用戶綁定的支付寶中進(jìn)行扣款完成交易。
淺雪介紹,聲紋識(shí)別技術(shù)是生物識(shí)別的重要識(shí)別手段之一,結(jié)合服務(wù)鏈多重安全機(jī)制,已達(dá)到商用的級(jí)別。這也是阿里在語音深度學(xué)習(xí)領(lǐng)域的核心技術(shù)之一。據(jù)悉,天貓精靈目前最多可以識(shí)別 6 個(gè)人的身份。
阿里還重點(diǎn)介紹了號(hào)稱「第一代中文語音人機(jī)交流系統(tǒng)」的 AliGenie,這是一個(gè)云端語音操作系統(tǒng),能夠聽懂中文普通話語音指令。
目前已經(jīng)可以實(shí)現(xiàn)智能家居控制、語音購物、手機(jī)充值、叫外賣、音頻音樂播放等功能,覆蓋了音樂、影視、餐飲、人物、旅游、財(cái)經(jīng)等 20 多個(gè)領(lǐng)域,能夠理解人類 80% 的意圖。
AliGenie 還配備了技能市場(chǎng),類似于手機(jī)的應(yīng)用市場(chǎng),開發(fā)商可以為其開發(fā)出各種各樣的實(shí)用技能,豐富其產(chǎn)品的使用場(chǎng)景。目前,AliGenie 的開發(fā)者平臺(tái)主要面向 4 種類型的開發(fā)者,包括內(nèi)容開發(fā)者、應(yīng)用開發(fā)者、智能家居開發(fā)商和硬件生產(chǎn)商,并向開發(fā)者們開放了包括深度學(xué)習(xí)、自然語言處理、搜索/推薦算法和知識(shí)表示及推理問答系統(tǒng)等四大核心技術(shù),以幫助開發(fā)者及硬件廠商節(jié)約研發(fā)成本,更好地為用戶提供服務(wù)。
這里值得關(guān)注的是內(nèi)容開發(fā)者和硬件生產(chǎn)商的開放。在采訪環(huán)節(jié)阿里表示,內(nèi)容開發(fā)者平臺(tái)類似于一個(gè)「語音版公眾平臺(tái)」,內(nèi)容創(chuàng)業(yè)者可以在這里進(jìn)行音頻內(nèi)容的上傳,并且形成特有的內(nèi)容服務(wù);而硬件生產(chǎn)商方面,已經(jīng)和「芭比娃娃」生產(chǎn)商美泰爾進(jìn)行合作,將來開發(fā)出與 AliGenie 語音聯(lián)動(dòng)的玩具產(chǎn)品。硬件方面目前阿里智能聯(lián)盟的上千萬智能家居設(shè)備已經(jīng)能夠與天貓精靈 X1 進(jìn)行連接,隨著阿里對(duì) AliGenie 開發(fā)者平臺(tái)的開放,天貓精靈 X1 也將能夠支持越來越多的智能硬件設(shè)備。
阿里推出的不僅是天貓精靈X1,AliGenie的智能語音平臺(tái)的用戶前景也許才是他更關(guān)注的焦點(diǎn)。
2018年3月22日,阿里巴巴人工智能實(shí)驗(yàn)室2018春季發(fā)布會(huì)上,阿里發(fā)布了搭載AliGenie2.0系統(tǒng)的“天貓精靈火眼”。只需要49元購買天貓精靈XHolder,天貓精靈X1的用戶就能升級(jí)成天貓精靈火眼。
簡單來說,在AliGenie 2.0系統(tǒng)加持下,天貓精靈火眼具備視覺認(rèn)知和交互能力,可識(shí)別117套兒童讀物(直接有聲閱讀)、40000種中國家庭常用藥(說出藥品名稱、功效、用法以及保質(zhì)期等),未來還將增加“萬物識(shí)別”和“人臉識(shí)別”技能。
會(huì)后,阿里官方對(duì)AliGenie2.0系統(tǒng)和“天貓精靈火眼”進(jìn)行了詳細(xì)闡述。
據(jù)官方介紹,AliGenie1.0是阿里巴巴推出的第一代中文人機(jī)交流系統(tǒng),通過“聽”和“說”,帶來了全新的交互體驗(yàn)。
AliGenie2.0在“聽”和“說”的基礎(chǔ)上引入視覺能力,能夠進(jìn)行視覺認(rèn)知、多模態(tài)交互、情景感知。
其中,AliGenie 2.0的視覺認(rèn)知能力包括圖像識(shí)別、人臉識(shí)別、物體檢測(cè);AliGenie 2.0的多模態(tài)交互能力可以通過對(duì)語音、圖像、觸摸等多種交互形態(tài)的融合,模擬人與人之間的交流方式;AliGenie2.0的情景感知能力,則基于你所在的上下文、對(duì)話場(chǎng)景自主學(xué)習(xí),深刻理解情景需求。
據(jù)了解,AliGenie 2.0首先將視覺能力落地在天貓精靈X1,通過搭載在天貓精靈手機(jī)APP的“精靈火眼”功能,以及天貓精靈XHolder,天貓精靈在幾乎沒有增加硬件設(shè)備成本的情況下,實(shí)現(xiàn)了視覺識(shí)別能力。
阿里表示,起名叫“精靈火眼”,意味著天貓精靈從此有一雙炯炯的火眼,能看見、感知外部的世界,擁有視覺能力的天貓精靈,會(huì)給人們生活帶來更大的幫助。
此外,精靈火眼提供了一個(gè)全新視覺系統(tǒng),基于3D虛擬形象,提供自然交互的表情擬態(tài)動(dòng)畫,目前包括近20多種擬態(tài)動(dòng)畫,觸摸虛擬形象的不同部位,能夠產(chǎn)生反饋和互動(dòng),使用戶體驗(yàn)從天貓精靈的語音交互升級(jí)為“精靈火眼”的自然互動(dòng)。
面向兒童,精靈火眼能識(shí)別117套圖書,通過圖像識(shí)別,結(jié)合智能語音互動(dòng)、聲音朗讀,幫助兒童讀書、識(shí)字。面向老人,精靈火眼能夠識(shí)別4萬種藥盒,覆蓋中國家庭常用藥,只要用精靈火眼掃一掃藥盒,就能用語音播報(bào)藥名、功效、過期日等信息。
阿里稱,精靈火眼未來將推出“萬物識(shí)別”、“人臉識(shí)別”等功能。
天貓精靈從2017年8月8日正式開售天貓精靈系列產(chǎn)品,直到2018年7月5日,時(shí)隔不到一年,累計(jì)全渠道銷量為500多萬臺(tái)。
華為AI音箱
5G時(shí)代即將來臨,手機(jī)廠商們也都紛紛進(jìn)軍智能家居這塊市場(chǎng)平臺(tái), 華為進(jìn)軍AI智能音箱的敲門磚,同華為Mate 20一起發(fā)布的“華為AI音箱”表現(xiàn)如何。
華為AI音箱的外形看起來有點(diǎn)像堂鼓,不過堂鼓是以木為框,兩面蒙牛皮,而華為AI音箱則是以塑料材質(zhì)塑形后,在所謂的“木框”蒙上了一層帆布“皮”。同堂鼓一樣能給人一種樸實(shí)的感覺,放在那都不會(huì)有突兀的感覺。
堂鼓的鼓皮是用動(dòng)物皮革制成,通過特殊工藝去除了皮革的粗糙感,保留了皮革上特有的紋路。而華為AI音箱上的帆布采用棉質(zhì)線編制而成,摒棄了帆布的糙感,卻有了同帆布一樣的質(zhì)感,可以很清晰的感受到棉線上的紋路卻不會(huì)有粗糙的感覺,拿在手中還是挺舒適的。
華為AI音箱的“鼓面”上有四個(gè)按鈕來分別實(shí)現(xiàn)音量調(diào)節(jié)、播放/暫停、接通/掛斷電話等最基本的操作,鼓面上的六個(gè)收音孔則是能夠帶來更好的拾音效果,讓人在喚醒的時(shí)候更加簡單,體驗(yàn)更好。
底部配有一個(gè)電源接口,因?yàn)殡娫唇涌谳^為靠內(nèi),所以采用了走線凹槽的方式,同時(shí)為了加固擺放還貼了一圈的圓形防滑墊,防滑墊邊緣還有一個(gè)用于恢復(fù)出廠設(shè)置的圓形小孔。底部不足6厘米的直徑圓內(nèi)貼有APP二維碼下載地址和12V/2A的電源輸入規(guī)格以及強(qiáng)調(diào)調(diào)音是聯(lián)合丹拿完成的凹陷字體。
音箱采用了一個(gè)丹拿設(shè)計(jì)的話2.25英寸10W全頻帶揚(yáng)聲器單元,再用2×1500mm2的無源低音輻射器配合。保證高還原度的的音質(zhì)外,也強(qiáng)調(diào)了中低音的效果。而這也能理解為什么用24W功率的原因了!
在低音上華為AI音箱能表現(xiàn)出猶如男歌手在歌唱時(shí)喉嚨的振幅。在中音部分華為AI音箱的表現(xiàn)比較平庸,放在這個(gè)價(jià)位的智能音箱中平平無奇,也沒什么好點(diǎn)評(píng)的,而在高音部分在播放一些音調(diào)較高的歌曲中沒有表現(xiàn)出應(yīng)有的靈巧,在高音人聲上會(huì)略有淡薄,偶爾會(huì)有渾濁的情況。
華為AI音箱還配備了華為Histen算法,但沒有開啟或關(guān)閉該算法的方法,所以也沒能說出其中的區(qū)別。其實(shí)在近些年發(fā)布的智能音箱中,音質(zhì)基本上都是尿點(diǎn),沒一個(gè)可說的。華為AI音箱的音質(zhì)表現(xiàn)已經(jīng)很不錯(cuò)了,只是高低音的差異太大才給人一種高音不行的感覺。
說完音箱的音質(zhì),接下來就說說它的拾音表現(xiàn), 六個(gè)收音麥克風(fēng)的確要比市面上的AI音箱要好上不少。不過在隔著一面墻的情況下華為AI音箱也同其他AI音箱一樣,沒有絲毫反應(yīng)。值得一提的是華為AI音箱比起普通的AI音箱多了一個(gè)聲紋識(shí)別的功能,能夠識(shí)別出記錄在內(nèi)的聲音是誰。聲紋識(shí)別這項(xiàng)技術(shù)雖然還未普及,但也是熱門的識(shí)別技術(shù)之一,未來還是有挺多可用之處的,也算是提前享受了。
華為AI音箱是基于華為HiLink智聯(lián)協(xié)議所開發(fā),可以有效的整合各種不同的智能終端,比如電視機(jī)、空調(diào)、風(fēng)扇、燈具、空氣凈化器甚至是掃地機(jī)器人等,前提是支持華為這個(gè)智聯(lián)協(xié)議。例如華為智選香薰助眠燈,它就是由OPPLE與華為聯(lián)合推出的一款支持該協(xié)議的智能家居設(shè)備。
華為AI音箱與其他智能音箱不同的是它有通話功能,無需SIM卡。有點(diǎn)類似于早期的有信APP(網(wǎng)絡(luò)電話),只需通過提前設(shè)定聯(lián)系人即可通過語音指令撥打電話,相對(duì)其他功能這個(gè)功能更加實(shí)用,可以方便對(duì)智能手機(jī)使用有困難的老人和孩子,無需通過智能手機(jī),只要一個(gè)語音指令即可撥打電話聯(lián)系。
電話分為普通通話和網(wǎng)絡(luò)通話,普通電話是通過華為AI音箱發(fā)送號(hào)碼到華為的通訊平臺(tái),然后通過平臺(tái)座機(jī)撥打給通訊號(hào)碼。通訊平臺(tái)是中轉(zhuǎn)站,連接通訊號(hào)碼和音箱,通話質(zhì)量還行,就是在使用過程中會(huì)有1秒左右的延遲。
另外一個(gè)網(wǎng)絡(luò)通話則是跟微信的語音通話一致,直接通過網(wǎng)絡(luò)來進(jìn)行進(jìn)行通話,通話質(zhì)量則直接取決于網(wǎng)絡(luò)信號(hào)質(zhì)量。另外還能與其他華為AI音箱相互撥打網(wǎng)絡(luò)電話進(jìn)行通訊。手機(jī)APP也可以向的音箱撥打網(wǎng)絡(luò)電話,音箱一端接聽只需說一句“小藝小藝,接聽”就可以接聽電話。
小米AI智能音箱小愛
話說小米AI智能音箱是在2017年7月26日發(fā)布的,但是它一直缺貨缺貨?。?!到了2018年5月, 去官網(wǎng)一看,還是缺貨,一首涼涼送給自己, 走某寶和某東上看看,某東價(jià)格都在400元以上,某寶現(xiàn)貨要加價(jià)60元左右,無奈,只好下手了。。。
小米AI智能音箱體積要比其他品牌的AI音箱大不少,四方四正,乍一看和小米家的空氣凈化器一個(gè)模樣。頂部有一圈光帶,在剛上電時(shí)很是炫酷,還有麥克風(fēng)禁用/開啟鍵,上一曲/下一曲按鍵,中間為play播放鍵,CH頻道切換鍵,長按3秒進(jìn)去配置模式,還有一個(gè)音量環(huán)。
作為一款音箱就得說說它的音質(zhì),小米AI智能音箱有六個(gè)麥克風(fēng),拾音效果很不錯(cuò),五米以內(nèi)聲音很小就能識(shí)別,而且發(fā)音不是很正的情況下也可以識(shí)別,這一點(diǎn)很優(yōu)越。音箱的音質(zhì)低音效果相當(dāng)不錯(cuò),音色很純正,在音量上本人感覺小米的這款音箱偏大,小編一直調(diào)在10%左右,調(diào)到50%的音量就感覺很吵了。
米家的絕大數(shù)產(chǎn)品小愛同學(xué)都可以接入,一開始QQ音樂沒有接入小愛同學(xué)手機(jī)app,很多歌曲庫里都沒有。不過后來去取音樂去住小米音箱app,完美解決了曲庫這個(gè)問題。小米音箱app里面的內(nèi)容逐漸豐富起來,相聲、小品、財(cái)經(jīng)、故事、英語演講、搞笑等有很多欄目。
接下來談?wù)勑∶譇I智能音箱與米家飛利浦智睿臺(tái)燈二代的接入,接入之后,通過小愛同學(xué)可以語音控制開啟/關(guān)閉臺(tái)燈,亮度調(diào)節(jié),但是不能識(shí)別開啟護(hù)眼模式,也不能開啟/關(guān)閉小夜燈模式,可在app里操作。在控制米家電飯煲還是不錯(cuò)的,各種模式的蒸煮模式都能開啟,表現(xiàn)還不錯(cuò)。
在和小愛同學(xué)交互時(shí),小愛同學(xué)拾音時(shí)間有點(diǎn)短,需要重新喚醒;很多時(shí)候她不能解析你的對(duì)話,就會(huì)識(shí)別為歌曲,這一點(diǎn)不是很智能。在使用的過程中小愛同學(xué)偶爾會(huì)自己喚醒,感覺還是有缺陷。其他方面小編繼續(xù)再挖掘。
總結(jié)一下,小米AI智能音箱作為娛樂聽歌還是相當(dāng)不錯(cuò),在控制米家設(shè)備變現(xiàn)還算可以,作為兒童伴侶是最佳的選擇。希望小米能在AI方面繼續(xù)優(yōu)化,做到更加智能。
今年6月份,百度發(fā)布了新款智能音箱——小度智能音箱,主打音質(zhì)、配置以及豐富功能。時(shí)隔5個(gè)月,小米智能音箱迎來了換代新品——小度智能音箱Pro,號(hào)稱“大”不一樣的人工智能音箱,搶鮮價(jià)169元,目前已經(jīng)在小度商城和京東上架開售。
小度智能音箱Pro采用全鋁合金頂蓋和高品質(zhì)定制網(wǎng)布(灰色、黑色可選),內(nèi)置高靈敏環(huán)形6麥克風(fēng)設(shè)計(jì),搭配主動(dòng)降噪、波束成形和遠(yuǎn)近場(chǎng)拾音技術(shù),5米內(nèi)輕松語音喚醒。音箱內(nèi)置大尺寸內(nèi)磁喇叭,低音層次分明,提供360°聲場(chǎng)。
據(jù)了解,小度智能音箱Pro在原有超過2000萬首音樂曲庫基礎(chǔ)上,深度整合QQ音樂海量正版資源,并支持外部歌單導(dǎo)入,大幅提升音樂體驗(yàn)。同時(shí),支持通過Wi-Fi語音找歌,也可以在小度音箱App上控制播放,支持藍(lán)牙和DLNA無線音樂投射多種播放方式。
小度智能音箱Pro搭載百度DuerOS語音系統(tǒng),擁有超過400個(gè)技能, 查訊息、語音備忘、日程管理、鬧鐘設(shè)置等,一句話便可操作。同時(shí),全面接入海爾U+、博聯(lián)、Lifesmart、歐瑞博等知名智能家居產(chǎn)品,不用動(dòng)手,喚醒小度,即可語音控制智能家居產(chǎn)品。
此外,小度智能音箱Pro還升級(jí)了全新的兒童模式2.0,可根據(jù)聲紋特征區(qū)分兒童用戶,并根據(jù)孩子年齡的不同,分階段推薦不同內(nèi)容和游戲。引入《十萬個(gè)為什么》的自園,解決孩子成長期的各種疑問。
同時(shí),極客模式優(yōu)化8秒多輪對(duì)話的免喚醒能力,并增加情緒識(shí)別,同時(shí)能判斷用戶是否希望繼續(xù)對(duì)話,引導(dǎo)繼續(xù)交流,提升用戶使用流暢度。
百度智能生活事業(yè)群組(SLG)總經(jīng)理,百度人工智能產(chǎn)品委員會(huì)主席景鯤宣布,百度DuerOS是國內(nèi)規(guī)模最大、最活躍、生態(tài)最繁榮的對(duì)話式人工智能操作系統(tǒng),激活設(shè)備數(shù)突破1.5億,月活躍設(shè)備超3500萬,合作伙伴280+,落地主控設(shè)備160+,技能開發(fā)者超2.4萬。
據(jù) IDC 統(tǒng)計(jì),2018年第三季度,搭載百度 DuerOS 的智能音箱在中國市場(chǎng)第三季度出貨量第一名,小度系列智能硬件在中國市場(chǎng)增速最快,市場(chǎng)份額增至24%,出貨量環(huán)比增速第一。
其實(shí),百度進(jìn)入智能音箱領(lǐng)域的時(shí)間并不算長, 但是,憑借其持續(xù)升級(jí)的AI技術(shù)和豐富的內(nèi)容生態(tài)資源,百度不斷加碼發(fā)力。內(nèi)容生態(tài)方面組建了兒童教育成長聯(lián)盟,把“常春藤爸爸”創(chuàng)始人常爸,“凱叔講故事”品牌創(chuàng)始人凱叔等10位頂級(jí)兒童教育專家引入進(jìn)來;音樂方面也與QQ音樂合作,深度整合來自QQ音樂的超2000萬首正版曲庫。技術(shù)方面,升級(jí)全新一代語音交互技術(shù)Endless Conversation,支持一次喚醒多輪交互、持續(xù)對(duì)話,越來越具備和真人助理式的對(duì)話體驗(yàn)。
亞馬遜的Echo
智能音箱的創(chuàng)新者非Amazon的Echo所屬。在亞馬遜看來,智能音箱可以看做是生活助手, 作為智能音箱鼻祖的Echo是怎樣做的?它又是如何被亞馬遜創(chuàng)造出來?
創(chuàng)造Echo的想法來自《星際迷航》
2014年11月,Echo正式在亞馬遜上線。但實(shí)際上,創(chuàng)造Echo的想法要更早。大約在四年半之前。
亞馬遜設(shè)備業(yè)務(wù)高級(jí)副總裁大衛(wèi)·林普(David Limp)稱,亞馬遜那時(shí)候已經(jīng)開始一些比較早期的研發(fā)工作,并發(fā)現(xiàn)了一些大家都沒有注意到的趨勢(shì)。
首先是云計(jì)算。當(dāng)時(shí)亞馬遜有了自己的AWS云服務(wù),并非常清楚的感受到云計(jì)算所擁有的巨大能力。所以在公司內(nèi)部,亞馬遜鼓勵(lì)其他部門將業(yè)務(wù)或者產(chǎn)品放到云端。
與此同時(shí),機(jī)器學(xué)習(xí)算法也開始凸顯實(shí)力。亞馬遜用機(jī)器學(xué)習(xí)算法為網(wǎng)站用戶做產(chǎn)品推薦,并取得非常好的效果。消費(fèi)者很喜歡這樣的推薦,也認(rèn)為亞馬遜推薦的很精準(zhǔn)。
這時(shí),亞馬遜的工程師開始思考,機(jī)器學(xué)習(xí)算法還能在哪些領(lǐng)域應(yīng)用。
最終,有人提出了一個(gè)想法:如果將沒有云計(jì)算能力與機(jī)器學(xué)習(xí)結(jié)合在一起,是否可以創(chuàng)造出一種類似電影《星際迷航》中的一種設(shè)備。在電影中的宇宙飛船上,無論站在什么位置,都可以隨意發(fā)問,然后一個(gè)“隱形電腦”就會(huì)找到答案并回答你。
Echo的第一個(gè)目標(biāo),就是成為《星際迷航》中隱形電腦一樣的設(shè)備。
Echo產(chǎn)品本身非常簡單,智能助手Alexa才是它軀殼下真正的靈魂。
為了優(yōu)化Alexa差不多經(jīng)歷了3年的時(shí)間。 至于如何優(yōu)化,這里舉兩個(gè)例子。首先是關(guān)于延遲。
Alexa在研發(fā)之初, 要5秒以后才能聽到答復(fù)。 為了提高回答速度這背后卻是一套復(fù)雜的流程。用戶提出問題后,Alexa需要把它識(shí)別成文字——把文字傳送到云端——在云端被識(shí)別、明確用戶問題——在云端連接提供時(shí)間服務(wù)的應(yīng)用——應(yīng)用傳回答案——答案從云端傳回——翻譯成語言播放出來。
另外在聲音識(shí)別環(huán)節(jié),就要解決關(guān)于真實(shí)應(yīng)用環(huán)境的噪聲問題,這也是 要說的第二個(gè)例子。
Echo的原型機(jī),在樣板間中可以工作的很好。但是,真實(shí)的家庭環(huán)境不可能像樣板間一樣安靜。比如在自家廚房,很可能一邊洗碗,一邊放音樂,然后旁邊還有攪拌機(jī)的聲音、孩子的打鬧聲等。
亞馬遜花了很多年來解決這個(gè)問題。比如他們改善設(shè)備本身的麥克風(fēng)收音等相關(guān)技術(shù),讓它能更好、清晰地辨別用戶發(fā)出的聲音;在云端讓應(yīng)用進(jìn)行大量的機(jī)器學(xué)習(xí),使它能過濾不需要的噪音,然后識(shí)別用戶的指令等。
目前,Alexa已經(jīng)從最初的5秒延遲縮短至1.5秒左右。而這3.5秒的差異背后,卻包含了大量的技術(shù)研發(fā)工作。
Echo不只是一個(gè)硬件
一經(jīng)問世,Echo就成為業(yè)界的關(guān)注焦點(diǎn)。因?yàn)樗莵嗰R遜創(chuàng)造的一類全新的產(chǎn)品和服務(wù), Alexa為消費(fèi)者所提供的服務(wù),與其過去通過Pad或者手機(jī)能獲得的服務(wù)完全不同。
亞馬遜希望Echo能夠跟大量的應(yīng)用和服務(wù)結(jié)合,并同時(shí)滿足客戶、開發(fā)者以及亞馬遜自己的需求。
比如Echo剛剛推出時(shí),功能很少。但是亞馬遜將Alexa平臺(tái)的接口開放后,至今已有上萬個(gè)開發(fā)者加入進(jìn)來,并基于Alexa開發(fā)出12000余種功能和應(yīng)用。
現(xiàn)在 Echo系列產(chǎn)品在快速發(fā)展,尤其是在美國市場(chǎng),取得了非常不錯(cuò)的表現(xiàn)。
如果你想要一個(gè)固定在家里某個(gè)位置的智能揚(yáng)聲器,并且是一位永遠(yuǎn)你在線的私人助理,那么Echo是個(gè)理想的選擇。它會(huì)帶來不錯(cuò)的音效,適合聽音樂,如果接入到Wi-Fi里,還可以回答各種各樣的問題,控制智能家居產(chǎn)品。
而亞馬遜Tap可以做所有該做的事情,包括聲音體驗(yàn)。不過由于采用無線供電的方式,因此為了省電Alexa并不總是在線,必須要按下專門的按鈕才能啟用。當(dāng)然更新之后也支持免提選項(xiàng)。如果你想要帶著它去海邊或者旅行,Tap是個(gè)很有用的伙伴。
至于Dot,就是一個(gè)迷你版、永遠(yuǎn)在線的Echo,不過它并不是揚(yáng)聲器,因此需要和家里的音響配合使用。Echo Dot可以6個(gè)或12個(gè)組合使用,確保家中每個(gè)房間都有一位Alexa待命。
接下來是Echo Look,盡管它也有麥克風(fēng),可以接收語音命令,但是嚴(yán)格意義上來說也算不上一款音樂播放設(shè)備,而它完全是為了拍照和提供時(shí)尚建議而來。
最后,亞馬遜最新的Echo Show是一款提供核心體驗(yàn)的產(chǎn)品,可以像所有Echo一樣工作,并且還提供了一塊屏幕,帶來更多的互動(dòng)體驗(yàn),通過攝像頭查看視頻,并且提供音頻和視頻通話功能。而在Alexa的使用上,Echo Show完全支持所有功能。
蘋果的HomePod
蘋果WWDC17開發(fā)者大會(huì)上,蘋果終于發(fā)布了自己的首款音響產(chǎn)品HomePod。 2018年12月6日,逃票長達(dá)18個(gè)月的HomePod智能音箱終于在中國區(qū)蘋果官網(wǎng)上架了!
蘋果HomePod
首先這款名為HomePod的產(chǎn)品采用編織材料無縫包裹,顏色有黑白兩種可選。在音箱的下方搭配了七個(gè)中高頻喇叭,上方搭配一個(gè)4寸低音單元。音箱采用同為手機(jī)使用的A8芯片作為處理器,內(nèi)置聽音環(huán)境的優(yōu)化功能,可以根據(jù)自我判斷來優(yōu)化在不同空間中的聲音表現(xiàn)力。支持兩只立體聲配對(duì)并且內(nèi)置了Siri功能,可以語音控制,除了音樂可以播放還可以播放一切音頻播報(bào)的信息如新聞、天氣、鬧鐘設(shè)置等等,可以理解為一個(gè)沒有屏幕的Siri。并且也可以通過你的手機(jī)或者其他設(shè)備遠(yuǎn)程控制你的HomePod,產(chǎn)品的芯片采用手機(jī)同樣使用的A8芯片。
產(chǎn)品尺寸
其實(shí)對(duì)于這款HomePod來說,在當(dāng)今的消費(fèi)類音響行業(yè)中,它沒有任何功能是創(chuàng)新的,甚至就連它的外觀設(shè)計(jì)也并沒有當(dāng)年蘋果的驚艷你可能還會(huì)覺得似曾相識(shí) 。
蘋果HomePod相較于亞馬遜的Echo,堅(jiān)持了它對(duì)于音箱HIFI的品質(zhì)的一貫追求。
至于語音控制, 蘋果的Siri作為目前最成熟的語音交互系統(tǒng)來說,確實(shí)還是有一定的優(yōu)勢(shì),但這也并不算是亮點(diǎn)吧?
顯然,雖然蘋果傳統(tǒng)上擁有優(yōu)秀的硬件工業(yè)設(shè)計(jì)能力,但是如果HomePod幕后的Siri語音助手,依舊停留在目前讓消費(fèi)者十分失望的水平,則蘋果在智能音箱市場(chǎng)的前景,將十分渺茫。
GoogleHome Hub智能音箱
Google Home 在 2018 年的表現(xiàn)也很亮眼,美國的滲透率從 2017 年的 8% 躍升到了 23%,每個(gè)家庭約有 1.7 臺(tái)硬件設(shè)備,總數(shù)約為 4300 萬。目前約有 900 萬臺(tái) Google Home 在美國以外的地區(qū)運(yùn)行。
圖 | Google Home(來源:官網(wǎng))
不過 RBC 的預(yù)測(cè)報(bào)告顯示,與 Alexa 系列音箱相比,Google Home 未來幾年帶來的營收并不算多,今年預(yù)計(jì)會(huì)帶來 34 億美元,到 2021 年則會(huì)增長到 82 億。
首次計(jì)入調(diào)查范圍的蘋果 HomePod 就比較慘了,目前 HomePod 的市場(chǎng)占有率很低,只有 5%,而亞馬遜 Alexa 約占 66%,谷歌約占 29%。
2018年10月,谷歌在 “谷歌制造”(Made By Google)的硬件發(fā)布會(huì)上發(fā)布了三大類產(chǎn)品,這包括了新一代的智能手機(jī)Pixel3/Pixel 3 XL、平板Pixel Slate,以及GoogleHome Hub智能音箱。
其中,Google Home Hub是谷歌此次發(fā)布會(huì)的重點(diǎn)產(chǎn)品,該音箱是谷歌發(fā)布的首款帶觸摸屏的智能音箱。Google Home Hub配備了7英寸LCD觸摸屏、遠(yuǎn)場(chǎng)麥克風(fēng)、環(huán)境光傳感器以及15W揚(yáng)聲器,支持藍(lán)牙5.0,并配發(fā)了綠、粉、白、深灰四種顏色。
跟GoogleHome 一樣,用戶可以通過語音交互的方式,用Google Home Hub來獲取一些常用信息。
但除此之外,用戶還可以在Google Home Hub上觀看YouTube、YouTube TV以及其他視頻服務(wù),以及通過屏幕來直觀地獲得一些顯示的信息,這也彌補(bǔ)了之前智能音箱完全依靠語音交互的不足。
不過,需要注意的是,Home Hub上并沒有安裝攝像頭,所以用戶就無法進(jìn)行視頻通話和視頻聊天,而這正是基于谷歌保護(hù)用戶的安全隱私而考慮的。
此外,此次Google Home Hub起售價(jià)149美元,相比亞馬遜和Facebook的同類產(chǎn)品,更具性價(jià)比,并最終于10月22日上市發(fā)售。
更有意思的是,在最后的one more thing中,谷歌還發(fā)布了一款智能無線充電設(shè)備,讓Pixel 3手機(jī)可以在充電狀態(tài)中變成一款在線的帶屏智能音箱。
配備屏幕的智能音箱,谷歌并不是頭一次
谷歌此次發(fā)布帶屏的智能音箱,之前已經(jīng)做好了充分的準(zhǔn)備。
早在18年CES(國際消費(fèi)類電子產(chǎn)品展覽會(huì))大展上,聯(lián)想就發(fā)布會(huì)了一款帶屏幕的智能音箱:聯(lián)想Smart Display。
這款智能音箱搭載了驍龍624處理器,配備2GB內(nèi)存,提供8/10英寸屏幕兩種型號(hào),售價(jià)分別為199美元和249美元。這款智能音箱搭載Google Smart Display平臺(tái)。聯(lián)想也是首個(gè)Google Smart Display的合作商。
除了聯(lián)想,谷歌在去年的 CES 上推出了 Smart Display 平臺(tái),希望將 Google Assistant 融入更多廠商的智能設(shè)備中。據(jù)了解,與 Google 合作的廠商有 iHome、JBL、Jensen、LG、聯(lián)想、Klipsch、Knit Audio、Memorex、RIVA Audio、索尼。
智能音箱的市場(chǎng),谷歌一路高歌猛進(jìn)
根據(jù)Canalys的報(bào)告顯示,美國2018年一、二季度智能音箱總出貨量為1680萬臺(tái);谷歌Google Home系列出貨量為540萬臺(tái),亞馬遜的Echo系列緊隨其后,售出410萬臺(tái)。就在2017年的同一時(shí)間,亞馬遜已經(jīng)占據(jù)了美國7成以上的智能音箱市場(chǎng)。
如今,谷歌智能音箱包括售價(jià)129美元的標(biāo)準(zhǔn)版Google Home ;售價(jià)49美元的低配版Home mini;售價(jià)399美元高配版的Home Max。
2018年被稱作智能音箱元年并不過分,國內(nèi)外巨頭猛砸智能音箱,近兩年智能音箱實(shí)現(xiàn)了跳躍式增長,從小眾走向大眾成為智能音箱行業(yè)發(fā)展的趨勢(shì)。全球發(fā)力,一方面是因?yàn)槠渚薮蟮南M(fèi)市場(chǎng),另一方面作為未來的AI入口,互聯(lián)網(wǎng)巨頭們斷然不會(huì)錯(cuò)過這一戰(zhàn)略要地。
2019新年來臨,精彩紛呈的智能音箱是否會(huì)成為你給自己或家人的一份新年禮物呢?
聯(lián)系客服