作為一名媒體工作者,外出采訪、整理會議錄音幾乎可以稱得上是家常便飯。
偷偷告訴大家,小編的內(nèi)心其實是拒絕的。不,工作不可負(fù),然而,不過,可是,采訪要記的東西似乎腫么寫都寫不完,聽錄音幾乎能聽到想吐,那種希望有人解救自己于水火之中的心情油然而生,我的蓋世英雄,你再不來,人家就要拿小拳拳錘你胸口了啦~~~
呼~ 現(xiàn)在好了!
目前,多家公司已推出了語音識別APP。雖然語音轉(zhuǎn)文字的應(yīng)用市場仍魚龍混雜,但如果可以得到一款好用易用的應(yīng)用,既可以提高效率,還能在某些時候避免出錯而出現(xiàn)尷尬。今天我們以安卓手機(jī)中的語音轉(zhuǎn)換為例,選出3款我們?nèi)粘J褂玫牡谌秸Z音轉(zhuǎn)文字軟件,從里到外地進(jìn)行一次全面對比。
我們先分別來介紹下這三款應(yīng)用:
搜狗聽寫(截止目前下載量:3311)
8月8日,搜狗推出語音實時變文字的速記工具“搜狗聽寫”,解決了會議、采訪、寫作等場景下長語音內(nèi)容轉(zhuǎn)寫難題。搜狗聽寫可用于寫文章、采訪錄音、會議記錄、筆記整理、日常記事等場景,能實現(xiàn)對語音轉(zhuǎn)寫的高準(zhǔn)確率實時轉(zhuǎn)換,并支持長語音轉(zhuǎn)換等。
版本號:1.1.2.50425
軟件大?。?.0MB
發(fā)布時間:2017-08-08
訊飛語記(截止目前下載量:474萬)
訊飛語記是一款說話就能變文字記錄的記事本,首次上線時間為2015年7月,支持普通話、英語、粵語、四川話等多方言多語種輸入。據(jù)悉,其準(zhǔn)確率高達(dá)95%,可以讓我們毫不費力地記錄。另外,在搜狗聽寫推出當(dāng)日,“訊飛語記”進(jìn)行了版本更新。
版本號:3.0.1149
軟件大?。?3.0MB
更新時間:2017-08-08
有道云筆記(截止目前下載量:683萬)
有道云筆記,是目前國內(nèi)最早的筆記軟件之一,2011年6月由網(wǎng)易出品。有道云筆記具備云端資料、文檔管理、資料收集、語音速記、掃描OCR等多種功能。其中,其語音速記功能于2016年年底推出。今天,小編將著重在語音速記功能進(jìn)行橫向分析。
版本號:5.9.4.1
軟件大?。?9.4MB
更新時間:2017-07-28
為了驗證語音速記功能的識別速度和準(zhǔn)確程度,小編決定在實際體驗中以兩種形式進(jìn)行測試,分別是熱詞和長段落,不僅考驗3款軟件語音速記功能,還考驗其編輯功能。
對2017年熱詞的語音識別準(zhǔn)確度對比測試:
搜狗聽寫:
訊飛語記:
有道云筆記:
先定一個能達(dá)到的小目標(biāo),比方說我先考個全國第一。/ 明明可以靠臉吃飯,偏偏要靠才華。/ 細(xì)思恐極 / 何棄療 / 你有Freestyle嗎? / 扎心了,老鐵。/ 我可能是個假人。/ 皮皮蝦,我們走。
對段落文字的語音識別準(zhǔn)確度對比測試:
搜狗聽寫:
訊飛語記:
有道云筆記:
2017年,世界遺產(chǎn)大會最重要的成果就是,審議通過了中國青海省可可西里和福建省鼓浪嶼兩個世界遺產(chǎn)地。特別是可可西里,大多數(shù)讀者可能對她都有較深的感情,她的美麗更是無與倫比。我第一次詳盡了解可可西里還是在大學(xué)期間,當(dāng)時的“三角地”附近展覽過可可西里的照片,當(dāng)我看到“高原精靈”藏羚羊由于其皮毛昂貴而成為偷獵對象,屢遭到兇殘殺害的時候,我心無比顫抖,當(dāng)時就報名了去可可西里的社團(tuán)活動,希望能為保護(hù)可可西里貢獻(xiàn)一份自己的力量。現(xiàn)在,萬惡的偷獵者的槍聲距離可可西里越來越遠(yuǎn),一個人與動物和諧共處的環(huán)境已形成。
智能語音目前主要依靠深度學(xué)習(xí)的技術(shù)實現(xiàn),作為機(jī)器學(xué)習(xí)的一個重要分支,深度學(xué)習(xí)在于建立、模擬人腦進(jìn)行分析學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),使得機(jī)器能從大量歷史數(shù)據(jù)中學(xué)習(xí)規(guī)律,從而對新的樣本做智能識別或?qū)ξ磥碜鲱A(yù)測,以達(dá)到具有人類一樣的思考能力。
A.搜狗聽寫
在轉(zhuǎn)寫方面,搜狗聽寫使用了搜狗知音獨家研發(fā)的長時語音轉(zhuǎn)寫技術(shù),并與業(yè)內(nèi)領(lǐng)先的端到端深度神經(jīng)網(wǎng)絡(luò)技術(shù)深度整合,使得語音識別準(zhǔn)確率保持在較高水平。同時,搜狗聽寫與搜狗輸入法聯(lián)通,推出國民輸入法,即個性化詞庫功能,能使搜狗聽寫迅速識別相關(guān)的專業(yè)詞匯。
在“聽寫”模式下,錄音的同時即可實時給出識別結(jié)果,話音落文字出,幾乎沒有時間差;而“轉(zhuǎn)寫”模式下則可以離線錄音,錄音完成后一次性獲取文字結(jié)果。
同時,搜狗聽寫還貼心的加入了邊聽邊改、無線標(biāo)重點、多端同步、信息分享等人性化功能,大幅度提升記錄效率。此外,在針對圖書館、咖啡廳等不便于大聲說話而又有使用語音的場景,搜狗聽寫提供耳語識別技術(shù),在人的說話音量低至30分貝時,依然可以準(zhǔn)確識別。
B.訊飛語記
訊飛語記是一款內(nèi)置了訊飛語音輸入功能的云筆記應(yīng)用,有著與訊飛輸入法同樣的識別速度,高達(dá)97%的準(zhǔn)確率,還可以將文字轉(zhuǎn)成語音朗讀出來。
訊飛語音輸入功能搭載自然語言理解(Natural Language Understanding,NLU)優(yōu)化模型,從“聽話”層面進(jìn)化到“聽懂”,識別語音中的深層含義;同時為改變“一聲吼”的壞毛病,訊飛輸入法內(nèi)置耳語輸入聲學(xué)模型,結(jié)合低分貝大數(shù)據(jù)訓(xùn)練,說話音量再輕也能兼顧語音識別速度和準(zhǔn)確率。此外,通過機(jī)器學(xué)習(xí)分領(lǐng)域的噪音數(shù)據(jù),自動采用不同算法去除帶噪語音中的噪音部分,混合訓(xùn)練噪音和安靜環(huán)境,自適應(yīng)不同噪音環(huán)境的語音輸入。
由于內(nèi)嵌了訊飛語音輸入,可以全程無需觸碰屏幕一直說下去。
C.有道云筆記
有道云筆記的首頁設(shè)計非常簡潔。其語音速記功能為有道云筆記與訊飛共同推出的功能,將訊飛旗下的語音識別技術(shù)融入到了移動記錄場景,從而完成文字的快速錄入。錄音的同時進(jìn)行文字轉(zhuǎn)換,最長支持60分鐘。完成后可根據(jù)分段語音進(jìn)行文字調(diào)整,并轉(zhuǎn)化為文字筆記。
首先,在標(biāo)點符號方面,即使人們在斷句處作短時間停頓,這3款軟件均存在無法正確標(biāo)注標(biāo)點符號的問題。相比之下, 搜狗聽寫表現(xiàn)最佳。
其次,在部分熱詞識別準(zhǔn)確度方面,這3款軟件整體表現(xiàn)良好,而搜狗聽寫對“我可能是個假人”一句話中的“假人”轉(zhuǎn)換為“家人”,其他2款軟件未出現(xiàn)類似問題。
第三,在語音識別速度上,搜狗聽寫和訊飛語記均速度較快,相比之下,有道云筆記的識別速度較慢,甚至還會出現(xiàn)漏轉(zhuǎn)文字等問題。
最后,當(dāng)人們說話過程中,穿插英文單詞時,搜狗聽寫和訊飛語記的效果會不太好,相比而言,有道云筆記能夠做到準(zhǔn)確識別。so那些很love講English的boys and girls,就不要輕易地have a try啦。
聯(lián)系客服