2017 年 7 月,國務(wù)院正式印發(fā)了我國在人工智能領(lǐng)域展開系統(tǒng)性部署的第一份文件《新一代人工智能發(fā)展規(guī)劃》,正式將人工智能上升為國家戰(zhàn)略。規(guī)劃中還重點(diǎn)提到了要加快人工智能在醫(yī)療領(lǐng)域的創(chuàng)新應(yīng)用,建立智能醫(yī)療體系、探索智慧醫(yī)院建設(shè),基于人工智能開展醫(yī)學(xué)研究和新藥研發(fā)等,醫(yī)療人工智能再一次被提到了政策高度。
與此同時(shí),資本的敏銳目光也聚焦到了醫(yī)療 AI 領(lǐng)域,創(chuàng)投熱情高漲,據(jù)前瞻研究院數(shù)據(jù)統(tǒng)計(jì),2013 年到 2017 年,中國醫(yī)療人工智能行業(yè)共獲得 241 筆融資,其中單是 2018 年上半年,就有 18 家公司獲投,總金額超過 31 億元。在政策助力和資本加持下,醫(yī)療人工智能成為時(shí)下最火熱的領(lǐng)域之一。
近年來,伴隨著機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、計(jì)算機(jī)視覺等技術(shù)的發(fā)展,人工智能與醫(yī)療領(lǐng)域融合的趨勢在不斷加強(qiáng)并碰撞出新的火花,人工智能技術(shù)的運(yùn)用為醫(yī)療健康行業(yè)賦予了新的活力,幫助提升醫(yī)療服務(wù)水平,降低醫(yī)療成本,讓醫(yī)療活動(dòng)更加有效率。
在技術(shù)層面,由于算法算力的改進(jìn)和提升,加之醫(yī)療大數(shù)據(jù)的規(guī)模激增,各個(gè)醫(yī)療場景中的 AI 技術(shù)發(fā)展趨向成熟。目前,醫(yī)療人工智能有 7 大應(yīng)用場景:醫(yī)學(xué)影像、輔助診斷、疾病預(yù)測、藥物研發(fā)、健康管理、醫(yī)院管理、醫(yī)學(xué)研究七大應(yīng)用場景。
在上述場景中運(yùn)用到了五大主流的 AI 技術(shù):計(jì)算機(jī)視覺、數(shù)據(jù)挖掘、智能語音交互、自然語言處理、機(jī)器(深度)學(xué)習(xí)。
計(jì)算機(jī)視覺
簡單來說,計(jì)算機(jī)視覺技術(shù)就是來研究如何讓機(jī)器具有“看”的智能,現(xiàn)在這項(xiàng)技術(shù)已經(jīng)廣泛運(yùn)用到了日常生活中,如人臉識(shí)別、虹膜識(shí)別、自動(dòng)駕駛等,它也是目前醫(yī)療場景中運(yùn)用最多的技術(shù)之一,尤其廣泛用于醫(yī)療影像中。
計(jì)算機(jī)視覺技術(shù)能夠?qū)︶t(yī)學(xué)影像進(jìn)行圖像分類、圖像檢索、目標(biāo)檢測、圖像分割等處理,人工智能可 24 小時(shí)無疲勞不間斷工作,能夠大批量處理圖像數(shù)據(jù),減少醫(yī)生的閱片時(shí)間,降低漏診率。
在醫(yī)學(xué)影像中,人工智能技術(shù)主要解決三種需求:
1、病灶識(shí)別與標(biāo)注。人工智能技術(shù)對(duì)醫(yī)學(xué)影像進(jìn)行圖像分割、特征提取、定量分析、對(duì)比分析等工作。
2、 靶區(qū)自動(dòng)勾畫與自適應(yīng)放療,輔助放療科醫(yī)生對(duì)腫瘤放療環(huán)節(jié)的影像進(jìn)行靶區(qū)自動(dòng)勾畫,按照傳統(tǒng)方式,放療科醫(yī)生一次靶區(qū)勾畫通常要處理 200-450 張 CT 圖像,勾畫速度和耗時(shí)長,一次勾畫要花 3-5 小時(shí),而通過 AI 技術(shù)自動(dòng)勾畫可以將時(shí)間大大縮短為 30 分鐘,而且還可以在患者 15-20 次上機(jī)照射過程中間不斷識(shí)別病灶位置變化以達(dá)到自適應(yīng)放療,有效減少射線對(duì)病人健康組織的傷害。
3、針對(duì)手術(shù)環(huán)節(jié)的影像三維重建。
數(shù)據(jù)挖掘
數(shù)據(jù)量大是中國醫(yī)療產(chǎn)業(yè)的“特色”。曾有統(tǒng)計(jì)表明,到 2020 年,醫(yī)療數(shù)據(jù)將增至 35ZB,占全球的 20%,但這些龐大的數(shù)據(jù)中卻有 75% 以上是非結(jié)構(gòu)化的。目前中國的醫(yī)療體系中,不同醫(yī)院、不同科室信息不互通,一個(gè)個(gè)信息孤島將數(shù)據(jù)(信息)壁壘越堆越高。此外,患者的病歷報(bào)告沒有統(tǒng)一標(biāo)準(zhǔn)、醫(yī)生手寫不規(guī)范等導(dǎo)致醫(yī)療數(shù)據(jù)質(zhì)量不佳,數(shù)據(jù)的價(jià)值并沒有真正被挖掘出來。
借助數(shù)據(jù)挖掘技術(shù)、深度學(xué)習(xí)算法通過數(shù)據(jù)采集、存儲(chǔ)、分析等環(huán)節(jié)對(duì)海量的醫(yī)療數(shù)據(jù)進(jìn)行大規(guī)模清洗處理和分析,并將臨床數(shù)據(jù)結(jié)構(gòu)化,從中挖掘有價(jià)值的信息諸如病癥的規(guī)律總結(jié)等,可以有效輔助醫(yī)生做診斷決策和安排治療方案。
語音 / 語義識(shí)別
語音識(shí)別是指將語言轉(zhuǎn)換為文字的過程,語音識(shí)別系統(tǒng)主要包括 4 個(gè)部分:特征提取、聲學(xué)模型、語言模型和解碼搜索。近年來,語音識(shí)別技術(shù)已經(jīng)逐漸走向成熟,基于深度學(xué)習(xí)的端到端的語音識(shí)別方法簡化了聲學(xué)模型訓(xùn)練的過程,在實(shí)用性方面頗受業(yè)界青睞。
在醫(yī)療場景下,語音 / 語義識(shí)別主要用于輔助診療,相應(yīng)的產(chǎn)品有導(dǎo)診機(jī)器人、診斷與治療機(jī)器人、虛擬助理、康復(fù)機(jī)器人、語音電子病歷等。其中,導(dǎo)診機(jī)器人運(yùn)用語音識(shí)別、人臉識(shí)別等技術(shù),為患者提供掛號(hào)、就醫(yī)流程指導(dǎo)等服務(wù)。虛擬助理可以幫助醫(yī)生回復(fù)患者的線上問診,實(shí)現(xiàn)智能問診、導(dǎo)診、智能用藥等。
自然語言處理
自然語言處理是分析、理解和生成自然語言以方便人與計(jì)算機(jī)、人與人交流的技術(shù),其核心技術(shù)有機(jī)器翻譯、信息檢索、推薦系統(tǒng)、語言生成等。在醫(yī)療產(chǎn)業(yè)中,自然語言處理多和語音識(shí)別等人機(jī)交互技術(shù)一起用于智能問診、結(jié)構(gòu)化電子病歷等虛擬助理產(chǎn)品中。
機(jī)器 / 深度學(xué)習(xí)
以機(jī)器學(xué)習(xí)為核心的人工智能技術(shù)正在改變著傳統(tǒng)醫(yī)療產(chǎn)業(yè),它包括遷移學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、對(duì)抗學(xué)習(xí)等類別。最近幾年,機(jī)器學(xué)習(xí)尤其是深度學(xué)習(xí)技術(shù)的發(fā)展推動(dòng)醫(yī)療 AI 走向新的高潮。按照拓?fù)浣Y(jié)構(gòu)分類,深度學(xué)習(xí)可分為卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)和全連接神經(jīng)網(wǎng)絡(luò)。
深度學(xué)習(xí)在醫(yī)學(xué)上的應(yīng)用已卓有成效,例如卷積神經(jīng)網(wǎng)絡(luò) CNN 在識(shí)別、處理醫(yī)療圖像上的準(zhǔn)確率非常高。深度學(xué)習(xí)算法可以更有效、更全面地處理醫(yī)學(xué)數(shù)據(jù),提煉出有價(jià)值的信息,進(jìn)行快速準(zhǔn)確地圖像標(biāo)注來為醫(yī)生提供輔助診療意見,幫助醫(yī)生提高效率、節(jié)省時(shí)間。
醫(yī)學(xué)影像,是目前人工智能在醫(yī)療領(lǐng)域最熱門的應(yīng)用方向。
據(jù)億歐智庫統(tǒng)計(jì),截至 2019 年 7 月,中國共有醫(yī)療人工智能企業(yè) 126 家,其中開展醫(yī)學(xué)影像業(yè)務(wù)的企業(yè)數(shù)量最多,共 57 家,其次是開展疾病風(fēng)險(xiǎn)預(yù)測業(yè)務(wù)的公司,共 41 家。反映在資本市場上,也是醫(yī)療影像最受青睞,在 2012 年至 2019 年 5 月獲投的醫(yī)療人工智能企業(yè)中,智能影像領(lǐng)域占比最高,醫(yī)學(xué)數(shù)據(jù)挖掘領(lǐng)域及健康管理領(lǐng)域分列第二、第三位。
醫(yī)學(xué)影像的處理本質(zhì)上就是計(jì)算機(jī)視覺技術(shù)的運(yùn)用,計(jì)算機(jī)視覺技術(shù)能夠?qū)︶t(yī)療影像進(jìn)行快速閱片和智能分析診斷,準(zhǔn)確標(biāo)記特定異常結(jié)構(gòu)來輔助醫(yī)生診斷。在技術(shù)層面,由于計(jì)算機(jī)視覺技術(shù)發(fā)展相對(duì)成熟,其在醫(yī)學(xué)影像上的運(yùn)用也更廣泛,醫(yī)學(xué)影像場景下的公司數(shù)量也最多。因此本文重點(diǎn)探討醫(yī)學(xué)影像領(lǐng)域的技術(shù)運(yùn)用。
在產(chǎn)品的技術(shù)成熟度方面,目前醫(yī)療影像 AI 在肺結(jié)節(jié)、眼底、乳腺癌、宮頸癌方面已有較為成熟的產(chǎn)品,其中肺癌、糖網(wǎng)眼底篩查最成熟,針對(duì)其他病種的產(chǎn)品大多處于使用或研發(fā)階段 。
在癌癥檢測與早篩方面,醫(yī)療 AI 影像產(chǎn)品騰訊覓影目前已有了體系化的解決方案。騰訊覓影利用圖像識(shí)別、深度學(xué)習(xí)等 AI 技術(shù),對(duì)各類醫(yī)學(xué)影像進(jìn)行訓(xùn)練學(xué)習(xí),智能識(shí)別不同病灶,能夠做肺癌、糖網(wǎng)眼底篩查、食管癌、宮頸癌等疾病的早篩,并輔助醫(yī)生作出臨床診斷。
自騰訊覓影發(fā)布以來,一共上線了 6 個(gè)病種的輔助診斷產(chǎn)品,其中有三款是由其背后的算法和技術(shù)提供方—騰訊優(yōu)圖實(shí)驗(yàn)室的醫(yī)療 AI 團(tuán)隊(duì)主導(dǎo)開發(fā)的,分別是肺結(jié)節(jié)、眼科疾?。òㄌ蔷W(wǎng)、青光眼和老年性黃斑等 7 大眼底疾?。┖蛯m頸癌篩查,此外,優(yōu)圖實(shí)驗(yàn)室還研發(fā)了乳腺癌早篩、肝癌早篩等產(chǎn)品。為了解騰訊優(yōu)圖在癌癥早篩方面的最新成果,AI 前線采訪了騰訊優(yōu)圖實(shí)驗(yàn)室鄭冶楓博士。
在肺癌早篩方面,騰訊優(yōu)圖采用全卷積神經(jīng)網(wǎng)絡(luò)完成早期肺結(jié)節(jié)檢測和分割,騰訊覓影的早期肺癌篩查 AI 系統(tǒng)采用了騰訊優(yōu)圖實(shí)驗(yàn)室的“端到端肺癌輔助診斷技術(shù)”,它能夠精準(zhǔn)定位微小結(jié)節(jié)位置和輔助醫(yī)生準(zhǔn)確判斷患者患肺癌的風(fēng)險(xiǎn)。? ?“騰訊覓影” 能精確定位 3mm 以上的微小肺結(jié)節(jié),檢出率≥95%。
在宮頸癌早篩上,騰訊優(yōu)圖于今年 5 月份取得了新的研發(fā)進(jìn)展——AI 電子陰道鏡輔助診斷系統(tǒng),并與騰訊覓影聯(lián)合發(fā)布。該系統(tǒng)利用 AI 技術(shù)可以進(jìn)行陰道鏡下癌前病變的輔助判讀。鄭冶楓介紹,優(yōu)圖實(shí)驗(yàn)室是在中國醫(yī)學(xué)科學(xué)院腫瘤院喬友林教授指導(dǎo)下開展這個(gè)項(xiàng)目的,在核心算法上,該系統(tǒng)采用了全新設(shè)計(jì)的深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu),在一致性方面,團(tuán)隊(duì)花了很多精力將算法從單中心向中心拓展,通過自適應(yīng)圖像規(guī)整化的方法,提高算法的準(zhǔn)確率,通過模擬醫(yī)生讀片過程,幫助判別病灶的位置,為醫(yī)生提供快速可靠的臨床輔診建議,目前,該系統(tǒng)已經(jīng)在幾家醫(yī)院做試點(diǎn),在病人活檢上面,可以達(dá)到最頂尖醫(yī)生的水平,要超出 5 個(gè)百分點(diǎn)。
在其他應(yīng)用方面,最近半年來,騰訊優(yōu)圖打破了 3 項(xiàng)記錄:1 月份,騰訊優(yōu)圖實(shí)驗(yàn)室聯(lián)合廈門大學(xué)組成的 TencentX 團(tuán)隊(duì)刷新全球醫(yī)療影像大賽 LiTS 雙紀(jì)錄,獲得肝分割、肝腫瘤分割兩項(xiàng)技術(shù)世界記錄。全球胸部多器官分割大賽上,TencentX 團(tuán)隊(duì)提出的胸部多器官分割系統(tǒng),在 Dice 指標(biāo)上取得三項(xiàng)第一和一項(xiàng)第二的成績,刷新 3 項(xiàng)全球新紀(jì)錄。
胸部多器官分割系統(tǒng)提供了一種全自動(dòng)化的基于卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的健康器官分割方法,能夠精確快速地分割出胸腔內(nèi)位于靶腫瘤附近的健康器官,該系統(tǒng)先通過縮小三維 CT 影像空間距離采樣,配合 3D 卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)快速定位,接著利用 2.5D 卷積神經(jīng)網(wǎng)絡(luò)沿矢狀面、冠狀面和水平面三個(gè)方向逐層預(yù)測結(jié)果,同時(shí)與 3D 卷積神經(jīng)網(wǎng)絡(luò)在完整的 VOI 下直接預(yù)測出的結(jié)果相結(jié)合,產(chǎn)生準(zhǔn)確、全面的多器官分割結(jié)果,實(shí)現(xiàn)了精細(xì)分割。
鄭冶楓表示,該系統(tǒng)融合了二維和三維圖像分割的結(jié)果。二維三維分割各自有優(yōu)缺點(diǎn):二維分割算法獨(dú)立分割每層 CT 圖像,好處是內(nèi)存消耗比較小,所以可以采用更深、更大的網(wǎng)絡(luò)來取得較好的層內(nèi)分割結(jié)果,不過層間一致性較差,會(huì)出現(xiàn)不光滑的問題。三維算法能保證層間上的分割結(jié)果是連續(xù)的,但最大問題是內(nèi)存消耗大,不能采用較小的網(wǎng)絡(luò),導(dǎo)致層內(nèi)分割精度受影響。為解決這個(gè)問題,優(yōu)圖團(tuán)隊(duì)將二維、三維圖像分割結(jié)果做融合,即保證層內(nèi)分割結(jié)果的高準(zhǔn)確率,又保證層間的連續(xù)性。在鄭冶楓看來,在工程上如何讓將二維、三維結(jié)合起來,這是一個(gè)關(guān)鍵技術(shù)。
視網(wǎng)膜檢查也是醫(yī)療影像 AI 領(lǐng)域最為重要的項(xiàng)目。常言說,眼睛是心靈的窗口,其實(shí),眼睛還是人全身疾病檢測的“窗口”。視網(wǎng)膜是全身唯一的、不用開刀就能直接看到血管和神經(jīng)的部位,幾乎所有血液血管疾病、全身性疾病都能在視網(wǎng)膜有所反映,通過做視網(wǎng)膜的異常表現(xiàn)能發(fā)現(xiàn)糖尿病、心血管疾病、眼科疾病、腎病等多種全身性疾病的早期征兆,并及時(shí)做診斷和治療,保障患者最佳的診療時(shí)期。
盡管有如此重要的醫(yī)療價(jià)值,這項(xiàng)視網(wǎng)膜檢查技術(shù)卻并沒有大規(guī)模普及。國內(nèi)專業(yè)的眼科醫(yī)生數(shù)量少,全國眼科醫(yī)生僅 3 萬人,且真正會(huì)看視網(wǎng)膜照片的醫(yī)生非常稀缺,全國有資格分析視網(wǎng)膜圖像的眼科醫(yī)生僅有約 1100 人。在醫(yī)院科系設(shè)置上,視網(wǎng)膜檢查屬于眼科,除視網(wǎng)膜疾病外,眼科醫(yī)生在診斷心血管疾病等病變的專業(yè)性上不足,而其他科醫(yī)生也不具備視網(wǎng)膜閱片的能力,此外,眼底照相設(shè)備價(jià)格昂貴,以上種種限制導(dǎo)致了視網(wǎng)膜檢查技術(shù)普及困難。
AI 成為解決這一難題的突破口。
AI 通過對(duì)大量的視網(wǎng)膜圖像進(jìn)行學(xué)習(xí)后,可以幫助醫(yī)生閱片,輔助判別病變。Airdoc 是在視網(wǎng)膜檢測 AI 這個(gè)垂直賽道上的領(lǐng)先企業(yè),在業(yè)內(nèi)深耕數(shù)年,Airdoc 積累了一套成熟的技術(shù)解決方案。
據(jù)悉,Airdoc 研發(fā)的人工智能健康風(fēng)險(xiǎn)識(shí)別系統(tǒng)可以基于視網(wǎng)膜影像識(shí)別 30 種慢性疾病和并發(fā)癥風(fēng)險(xiǎn),比如動(dòng)脈硬化、高血壓、心腦血管疾病、糖尿病、青光眼、白內(nèi)障、視神經(jīng)疾病、高度近視、年齡相關(guān)性黃斑變性等慢性病導(dǎo)致的視網(wǎng)膜異常征兆。
操作該系統(tǒng)的方法非常簡單,機(jī)器拍攝下用戶的進(jìn)行視網(wǎng)膜影像后,算法立即將視網(wǎng)膜影像發(fā)送到云端,并開始用人工智能算法分析視網(wǎng)膜影像,在云端完成視網(wǎng)膜影像的識(shí)別,于此同時(shí)分析結(jié)果實(shí)時(shí)傳輸?shù)接脩羰謾C(jī)上。在準(zhǔn)確率方面,大多數(shù)臨床試驗(yàn)顯示,Airdoc 人工智能健康風(fēng)險(xiǎn)評(píng)估系統(tǒng)的識(shí)別準(zhǔn)確率與三甲醫(yī)院主任醫(yī)師的水平相當(dāng)。
Airdoc 創(chuàng)始人張大磊向 AI 前線表示,Airdoc 的人工智能健康風(fēng)險(xiǎn)評(píng)估系統(tǒng)依托人工智能圖像識(shí)別技術(shù),基于數(shù)百萬張醫(yī)學(xué)影像,邀請(qǐng) 300 多位醫(yī)學(xué)專家進(jìn)行交叉標(biāo)注,建立起了標(biāo)注網(wǎng)絡(luò),設(shè)計(jì)構(gòu)建了特定的深度神經(jīng)網(wǎng)絡(luò)模型。目前 Airdoc 用于深度學(xué)習(xí)的訓(xùn)練數(shù)據(jù)已經(jīng)達(dá)到了千萬量級(jí),在數(shù)據(jù)處理上會(huì)經(jīng)過篩選、質(zhì)控、風(fēng)險(xiǎn)評(píng)估、分級(jí)、運(yùn)算、反饋等過程。視網(wǎng)膜檢測系統(tǒng)運(yùn)用了監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、遷移學(xué)習(xí)等大量的深度學(xué)習(xí)方法,像素比更大的醫(yī)學(xué)影像數(shù)據(jù)對(duì)計(jì)算力要求較高,Airdoc 采用了 Tensorflow、TNCK 等開放式框架進(jìn)行訓(xùn)練。
除人工智能健康風(fēng)險(xiǎn)識(shí)別系統(tǒng)外,Airdoc 還推出了近視預(yù)測產(chǎn)品、自動(dòng)多功能綜合檢眼儀等眼睛檢測產(chǎn)品。針對(duì)兒童青少年的近視問題,Airdoc 的近視預(yù)測產(chǎn)品基于醫(yī)院逾百萬條持續(xù)追蹤的驗(yàn)光數(shù)據(jù),能自動(dòng)預(yù)測 3-18 歲兒童青少年的近視發(fā)展趨勢,如何時(shí)會(huì)近視,近視度數(shù)增長趨勢等。
自動(dòng)多功能綜合檢眼儀是 Airdoc 和一家以色列公司合作推出的視功能檢測機(jī)器,該機(jī)器可以在 2 分鐘內(nèi)將人的眼睛全方位掃描一遍,篩查眼部上千數(shù)據(jù),形成關(guān)于雙眼度數(shù)、明暗視差、視疲勞、白內(nèi)障、青光眼等疾病的風(fēng)險(xiǎn)報(bào)告,讓人全面了解眼睛的狀態(tài)。
除了基于眼睛檢測,在醫(yī)療影像 AI 領(lǐng)域,Airdoc 還延伸出了皮膚病檢測、算法自動(dòng)識(shí)別心電圖、血糖檢測傳感器等幾大產(chǎn)品線。
小樣本學(xué)習(xí)是這兩年醫(yī)療 AI 領(lǐng)域的一個(gè)熱門卻又棘手的研究課題。
當(dāng)下醫(yī)療 AI 技術(shù)的發(fā)展還存在一些局限性,比如過度依賴訓(xùn)練樣本,深度學(xué)習(xí)是一個(gè)非常依賴數(shù)據(jù)的技術(shù),要保障深度學(xué)習(xí)的效果,前提條件是訓(xùn)練樣本足夠多,要“投喂”給它大量的數(shù)據(jù)。
然而,現(xiàn)實(shí)中是沒有足夠的已標(biāo)注的數(shù)據(jù)的,獲得大量已標(biāo)注的數(shù)據(jù)又非常困難。一方面,數(shù)據(jù)的來源是受限制的,很多數(shù)據(jù)的采集需要專業(yè)的設(shè)備,比如 CT 和 MRI 等設(shè)備非常昂貴;出于對(duì)自身隱私的保護(hù),患者也不愿意共享自己的醫(yī)療數(shù)據(jù)信息。另一方面,在數(shù)據(jù)的標(biāo)注上也是一個(gè)難題,醫(yī)療影像標(biāo)注需要頂尖的醫(yī)療專家參與,但因?yàn)橄嚓P(guān)人才缺乏,加之臨床、科研任務(wù)重,很多醫(yī)療專家沒有時(shí)間做數(shù)據(jù)標(biāo)注。
鄭冶楓認(rèn)為,小樣本學(xué)習(xí)的問題是當(dāng)下醫(yī)療影像 AI 面臨的最大挑戰(zhàn)?!拔覀兘?jīng)常希望拿到幾千萬量級(jí)的數(shù)據(jù),而實(shí)際上能夠有幾萬數(shù)據(jù)就已經(jīng)很好了,很多時(shí)候,遇到一些罕見疾病的時(shí)候,只有一兩千甚至幾百的數(shù)據(jù)量,這讓最后出來的效果難以保障,小樣本學(xué)習(xí)是一個(gè)迫切需要解決的問題“。
現(xiàn)在針對(duì)小樣本學(xué)習(xí)問題,業(yè)界也提出了一些解決方法,目前小樣本學(xué)習(xí)的研究成果主要是把一些已知類別的一些信息遷移到新的類別上,無監(jiān)督學(xué)習(xí)或半監(jiān)督方法也是未來的發(fā)展方向。
鄭冶楓表示,目前騰訊優(yōu)圖團(tuán)隊(duì)在致力于解決小樣本學(xué)習(xí)的問題,他表示,目前團(tuán)隊(duì)已提出了兩種解決方案:遷移學(xué)習(xí)、計(jì)算機(jī)合成圖像。針對(duì)有監(jiān)督的小樣本學(xué)習(xí)問題,優(yōu)圖會(huì)專門在醫(yī)學(xué)圖像上預(yù)訓(xùn)練一個(gè)模型,然后做遷移。最近團(tuán)隊(duì)在騰訊 GitHub 的官方賬號(hào)下開源了 MedicalNet 預(yù)訓(xùn)模型和相關(guān)代碼,供業(yè)界免費(fèi)使用。這是全球首個(gè)專門針對(duì) 3D 醫(yī)學(xué)影像的預(yù)訓(xùn)練模型,也是騰訊在醫(yī)療 AI 方面的首個(gè)開源項(xiàng)目。此外,計(jì)算機(jī)合成圖像可以對(duì)訓(xùn)練樣本形成有效補(bǔ)充,尤其是可以利用生成對(duì)抗網(wǎng)絡(luò)(GAN)產(chǎn)生逼真圖像。
“我們最近開始嘗試把樣本數(shù)據(jù)再往下減,從幾千張、幾百張?jiān)龠M(jìn)行壓縮,壓縮到幾十張甚至更少到兩三張,我認(rèn)為這是一個(gè)非常關(guān)鍵的技術(shù),在這樣的情況下,如何去訓(xùn)練出一個(gè)好的結(jié)果?!?/p>
張大磊認(rèn)為小樣本學(xué)習(xí)盡管熱度高,但效果一般化,在這方面,Airdoc 在嘗試?yán)脤?duì)抗生成網(wǎng)絡(luò)技術(shù)攻克難題。他認(rèn)為,在醫(yī)療領(lǐng)域,一張影像不能解決所有的問題,要廣泛結(jié)合病史、病例、發(fā)展進(jìn)程去綜合考量。多模態(tài)的一個(gè)局限性是,算法“造”出來了一個(gè)樣本,看上去理論上似乎是存在的,但現(xiàn)實(shí)生活中是否真正存在這樣一個(gè)人,如果不存在,最后又該如何驗(yàn)證結(jié)果?有些罕見的疾病一年全中國可能就發(fā)生 1-2 例,類似這樣的情況在積攢足量的數(shù)據(jù)上難度很大。
在數(shù)據(jù)標(biāo)注方面,Airdoc 建立起了一個(gè)標(biāo)注網(wǎng)絡(luò),以視網(wǎng)膜為例,每個(gè)標(biāo)注專家會(huì)通過自動(dòng)推薦的算法領(lǐng)到自己喜歡或者擅長的標(biāo)注任務(wù),接下來,多個(gè)專家獨(dú)立執(zhí)行標(biāo)注任務(wù),如果所有專家達(dá)成共識(shí)的部分,將其作為標(biāo)注,反之,則舍棄掉,通過獨(dú)立標(biāo)注、交叉質(zhì)控的方法大大提高了標(biāo)注質(zhì)量。
張大磊坦言,數(shù)據(jù)標(biāo)注這件“苦”活兒沒有什么好的辦法,只有依靠持續(xù)的積累,“我不覺得它難,我覺得它需要堅(jiān)持去做”。在標(biāo)注專家這方面,Airdoc 已經(jīng)形成了一個(gè) 300 多人的全球標(biāo)注醫(yī)生團(tuán)隊(duì),他認(rèn)為做大標(biāo)注網(wǎng)絡(luò)是針對(duì)數(shù)據(jù)標(biāo)注難題的一個(gè)有效解決方案。
未來 3-5 年,哪些醫(yī)療 AI 技術(shù)比較有發(fā)展前景?
“小樣本學(xué)習(xí)是未來幾年需要重點(diǎn)攻克的問題”,鄭冶楓表示,騰訊優(yōu)圖目前還在基于醫(yī)療影像的個(gè)性化治療方案上做探索。
張大磊認(rèn)為,人工智能技術(shù)在疾病的預(yù)測和預(yù)防上仍有很多的實(shí)現(xiàn)場景和應(yīng)用潛力,Airdoc 目前在探索的一個(gè)方向是,通過皮下植入傳感器持續(xù)監(jiān)測生命體征,進(jìn)而研究生命體征與遺產(chǎn)基因代謝、生活方式間的關(guān)系。
人工智能技術(shù)的運(yùn)用為傳統(tǒng)的傳統(tǒng)醫(yī)療體系帶來了一些充滿驚喜的顛覆和改變,當(dāng)然也不乏挑戰(zhàn)和隱憂,有人擔(dān)心,AI 是否會(huì)搶了醫(yī)生的飯碗?事實(shí)上,這種擔(dān)憂未免太早?!爸委煻说幕顑哼€是要交給醫(yī)生“,張大磊的觀點(diǎn)簡潔明了。鄭冶楓認(rèn)為,在流程方面,騰訊優(yōu)圖希望把 AI 算法無縫嵌入到診斷流程里,并不希望改變醫(yī)生的流程,而是基于醫(yī)生現(xiàn)有的流程之上做一些輔助診斷。
談到技術(shù)是否是一家醫(yī)療 AI 公司的“護(hù)城河”這一問題時(shí),兩位專家都認(rèn)為,技術(shù)只是其中的壁壘之一,但不是唯一,尤其是在如今行業(yè)、技術(shù)發(fā)展革新速度迅猛的大環(huán)境下,固守技術(shù)便意味著某種程度上的落后,“對(duì)技術(shù)的追求和技術(shù)能否保持持續(xù)演進(jìn)、對(duì)客戶需求和落地場景的理解、三者缺一不可,為技術(shù)找到一個(gè)好的應(yīng)用場景、構(gòu)建好的生態(tài)系統(tǒng)非常重要“,張大磊表示。鄭冶楓亦表示,騰訊優(yōu)圖要利用在算法上的優(yōu)勢,將 AI 技術(shù)落地到更多基層的場景去,幫助基層醫(yī)生提高診斷準(zhǔn)確率。
聯(lián)系客服