之前,我們介紹過(guò)這樣一個(gè)功能,可以讓視障者也能“看見(jiàn)”圖片:
一直以來(lái),當(dāng)視障用戶使用智能手機(jī)時(shí),都能通過(guò)自帶的讀屏功能聽(tīng)到文字。
可一旦碰上圖片動(dòng)態(tài),他們就只能聽(tīng)見(jiàn)“圖片”、“圖片”、“圖片”......
而我們做了一個(gè)嘗試,希望這些圖片也能“說(shuō)話”。
在最新安卓版QQ空間APP中,增加了「圖片語(yǔ)音即時(shí)描述功能」。它能識(shí)別圖片的內(nèi)容,并“說(shuō)出”一句文字描述。就像這樣——
一位參與內(nèi)測(cè)體驗(yàn)的視障小伙伴說(shuō):
可能你不會(huì)覺(jué)得有什么,但對(duì)我而言卻仿佛打開(kāi)了一扇全新的大門。
?
QQ空間這個(gè)功能,來(lái)源于2017年產(chǎn)品團(tuán)隊(duì)與合作伙伴深圳信息無(wú)障礙研究會(huì)的一次交流。而同年,我們?cè)囍_(kāi)放了高精度圖像識(shí)別服務(wù)能力。
令人驚喜的是,許多國(guó)內(nèi)PC和手機(jī)讀屏軟件接入后實(shí)現(xiàn)了對(duì)圖片的朗讀,一定程度上讓視障人士有了更多選擇。
這也讓我們更加堅(jiān)信,AI 不僅要 “IN ALL”,更需要 “FOR ALL”。
于是今天,我們?cè)诳萍紵o(wú)障礙發(fā)展大會(huì)上宣布,在中國(guó)殘疾人聯(lián)合會(huì)的支持下,正式啟動(dòng)“AI無(wú)障礙:QQ空間無(wú)障礙技術(shù)開(kāi)源項(xiàng)目”。
我們會(huì)開(kāi)放這樣一批AI技術(shù),讓更多企業(yè)、開(kāi)發(fā)者能夠自由接入并使用——
能聽(tīng)的圖片:圖片轉(zhuǎn)語(yǔ)音技術(shù)
它能通過(guò)深度神經(jīng)網(wǎng)絡(luò)識(shí)別圖片的內(nèi)容,然后組織語(yǔ)言,以通順并符合人類語(yǔ)言習(xí)慣描述圖片,并通過(guò)語(yǔ)音說(shuō)出來(lái),就像QQ空間里能“說(shuō)話”的圖片一樣;
看圖識(shí)字:OCR識(shí)別技術(shù)
它可以識(shí)別圖片上的文字,比如身份證、指示牌、一張PPT的照片等等,能讓你對(duì)文本信息的獲取更為便捷,不僅在日常生活中很實(shí)用,結(jié)合語(yǔ)音技術(shù)還能為許多障礙人群提供便利;
多角色定制語(yǔ)音:語(yǔ)音合成技術(shù)
它能通過(guò)機(jī)器學(xué)習(xí)訓(xùn)練,將文字以特定角色的聲音誦讀出來(lái),讓語(yǔ)音合成更加真實(shí)有情緒、獲取信息更加容易,未來(lái)也許能用你的聲音為奶奶念出一份說(shuō)明書(shū);
這些技術(shù),你都可以在小程序 “多媒體AI平臺(tái)”中找到。
我們還為這些特別適用于無(wú)障礙場(chǎng)景的AI技術(shù)開(kāi)辟了專門的入口:
騰訊從2009年開(kāi)始就進(jìn)入到無(wú)障礙產(chǎn)品的改造中。
在探索中,我們?cè)絹?lái)越強(qiáng)烈地意識(shí)到,所有用戶都有權(quán)利更方便地獲取信息、更自由地交流,而這絕不是一個(gè)人就能走下去的道路。
所以,我們希望無(wú)障礙技術(shù)的普及,能降低產(chǎn)品應(yīng)用新技術(shù)的門檻,讓越來(lái)越多的行業(yè)和企業(yè)都加入這項(xiàng)探索中。
這樣,我們才能一起消除前方的障礙,為更多人打開(kāi)新的大門。
來(lái)源:騰訊