“我們醫(yī)生現(xiàn)在最怕的就是AI研究人員直接上來(lái)對(duì)我們說(shuō):你們什么都不用管,只要給我數(shù)據(jù),我就一定能做出成果來(lái)。這類人我遇到過(guò)很多。”
四川大學(xué)前副校長(zhǎng)、華西醫(yī)院病理科教授步宏曾在雷鋒網(wǎng)的報(bào)道中如此說(shuō)道。
步宏教授指出,他們也許認(rèn)為只要把數(shù)據(jù)給到即可,但醫(yī)生還必須考慮哪些信息必須隱去,因?yàn)樯婕暗絺惱怼?/p>
“現(xiàn)在不少醫(yī)生開(kāi)始研究人工智能,我的學(xué)生也在看計(jì)算機(jī)科學(xué)專家發(fā)表的結(jié)果,他們有時(shí)候會(huì)拿著論文跑過(guò)來(lái)對(duì)我說(shuō):老師,你看!這篇論文連基本的醫(yī)學(xué)常識(shí)都沒(méi)有。是不是該給它加一個(gè)醫(yī)學(xué)的reviewer呢?”
“如果真的這么做,很多論文其實(shí)根本發(fā)表不出來(lái)。論文成功發(fā)表并不代表取得了成果,只說(shuō)明在你reviewer的知識(shí)范疇中這種方法是可行的,實(shí)際應(yīng)用到臨床當(dāng)中,就會(huì)暴露很多問(wèn)題。我也絕不相信隨便拿一堆片子就能做出研究成果來(lái)?!辈胶杲淌谘a(bǔ)充道。
上個(gè)月,吳恩達(dá)團(tuán)隊(duì)發(fā)布AI+醫(yī)學(xué)影像研究成果,聲稱該算法在識(shí)別胸透照片中肺炎等疾病上的準(zhǔn)確率上超越了人類專業(yè)醫(yī)師。
成果發(fā)布不久,放射科在讀博士Luke Oakden-Rayner隨之發(fā)布長(zhǎng)文提出質(zhì)疑:《吳恩達(dá)肺炎診斷成果不靠譜?放射科博士長(zhǎng)文質(zhì)疑:有些數(shù)據(jù)集根本不能用》。此外,不少影像科主任醫(yī)師也向雷鋒網(wǎng)反饋了該成果存在的諸多問(wèn)題。
2017年,雷鋒網(wǎng)參加了數(shù)十個(gè)頂尖醫(yī)療人工智能大會(huì),而大會(huì)期間和會(huì)后交流環(huán)節(jié),時(shí)常出現(xiàn)影像科醫(yī)生批評(píng)市場(chǎng)上眾多醫(yī)學(xué)影像AI輔助診斷產(chǎn)品種種問(wèn)題的情況,而當(dāng)事人AI從業(yè)者面對(duì)這些批評(píng)時(shí)也往往卻無(wú)法反駁,連連點(diǎn)頭。
諸多醫(yī)院科室主任解釋到,過(guò)去一年里,他們經(jīng)??吹健癆I讀片準(zhǔn)確率、精確率高達(dá)百分之九十幾,超越醫(yī)生”這些字眼,這些報(bào)道有很多是不負(fù)責(zé)任的。
這樣的判斷方法回避了醫(yī)學(xué)常用的“敏感度”和“特異度”的評(píng)價(jià)標(biāo)準(zhǔn)。
而AI研究者說(shuō)采用的“準(zhǔn)確率”和“精確率”嚴(yán)重依賴于樣本總數(shù)里陽(yáng)性和陰性的配比,舉個(gè)極端的例子,設(shè)計(jì)一個(gè)系統(tǒng),對(duì)于所有的輸入都報(bào)陽(yáng)性,即敏感度為100%,特異度為0,這就是個(gè)沒(méi)有實(shí)際用處的系統(tǒng),那么此時(shí)取100個(gè)測(cè)試樣本中,99個(gè)為陽(yáng)性,1個(gè)為陰性,此時(shí)計(jì)算出的準(zhǔn)確率為99%,精確率也是99%。
評(píng)價(jià)醫(yī)學(xué)人工智能系統(tǒng)是否有用,要同時(shí)看其正確的判斷陽(yáng)性的能力和正確的判斷陰性的能力,即敏感度和特異度。
不負(fù)責(zé)任的輿論聲音,從某種程度上激化了醫(yī)生們對(duì)AI的反擊心里。
與此同時(shí),醫(yī)院自身的客觀問(wèn)題,也導(dǎo)致AI專家進(jìn)入醫(yī)療領(lǐng)域,遠(yuǎn)比想象的艱難。
在上一篇文章《“AI+醫(yī)療”這片領(lǐng)土上,科技巨頭為何不再敢說(shuō)自己是巨頭?》中,我們談到一個(gè)很多人沒(méi)有異議的觀點(diǎn):醫(yī)療,是人工智能最難完全攻下來(lái)的領(lǐng)域。
醫(yī)工交叉與產(chǎn)學(xué)結(jié)合,這兩個(gè)由來(lái)已久的問(wèn)題隨著人工智能的興起,讓醫(yī)學(xué)影像分析面臨著全新的機(jī)遇與挑戰(zhàn)。
隔行如隔山,這對(duì)IT界和醫(yī)學(xué)界來(lái)說(shuō)尤為貼切,當(dāng)雙方團(tuán)隊(duì)共同打造一個(gè)產(chǎn)品時(shí),面臨著話語(yǔ)體系不同、評(píng)價(jià)方式不同、誰(shuí)來(lái)主導(dǎo)等諸多問(wèn)題。
目前這個(gè)市場(chǎng)還處于初期,各路玩家相繼入場(chǎng),產(chǎn)品仍處于科研摸索期。
如果只是將人工智能現(xiàn)有的算法直接套用在醫(yī)學(xué)影像領(lǐng)域,很難取得優(yōu)秀成果。與此同時(shí),只滿足把自己定位于一個(gè)人工智能研究者來(lái)看待醫(yī)學(xué)影像問(wèn)題,將圖像識(shí)別技術(shù)單純地嫁接到醫(yī)學(xué)影像原有的系統(tǒng)上,即便數(shù)字結(jié)果看起來(lái)不錯(cuò),但距離“好用的產(chǎn)品”依舊非常遙遠(yuǎn)。
AI要順利進(jìn)入醫(yī)學(xué)影像領(lǐng)域,會(huì)面臨哪些阻礙?
一、被新技術(shù)與新方法迷惑醫(yī)療行業(yè),技術(shù)不僅要為影像科、病理科服務(wù),還要為臨床服務(wù)。
只不過(guò)技術(shù)是通過(guò)影像科和病理科醫(yī)生最終服務(wù)于臨床的,服務(wù)于臨床是最高目標(biāo)。在這個(gè)過(guò)程中,醫(yī)生的指導(dǎo)非常重要。
科大訊飛醫(yī)療事業(yè)部總經(jīng)理陶曉東博士向雷鋒網(wǎng)介紹了自己的一個(gè)原則:要用正確的工具解決正確的問(wèn)題,即先準(zhǔn)確地定義問(wèn)題,然后尋找合適的解決手段。
“我經(jīng)常跟同事講,一個(gè)問(wèn)題如果能用90年代的技術(shù)解決,就不要想著用2000年的技術(shù);如果能通過(guò)人和機(jī)器一起解決,就不要想著做全自動(dòng)的方案??傊灰傁胫米钚碌募夹g(shù),關(guān)鍵是要能解決實(shí)際問(wèn)題?;貧w到醫(yī)療行業(yè),我們要解決的是臨床問(wèn)題,肯定需要醫(yī)生的合作,一起完成很多工作,并不斷碰撞出火花?!?/p>
二、數(shù)據(jù)不足、質(zhì)量不過(guò)關(guān)
影像數(shù)據(jù)的質(zhì)量和數(shù)量很難兼顧,AI從業(yè)者很難找到滿足要求的數(shù)據(jù),尤其是由醫(yī)生標(biāo)注過(guò)的高質(zhì)量數(shù)據(jù)。
除此之外,還要結(jié)合病人的其他信息來(lái)判斷,比如實(shí)驗(yàn)室檢測(cè)、病理標(biāo)本等,這更是增加了難度。
廣東省人民醫(yī)院劉再毅教授曾向雷鋒網(wǎng)()介紹了他們團(tuán)隊(duì)所做的項(xiàng)目,該項(xiàng)目過(guò)程中需要臨床檢測(cè)項(xiàng)目數(shù)據(jù),像基因、血液等相關(guān)檢查數(shù)據(jù),預(yù)計(jì)能拿到500~600例可用的數(shù)據(jù),但投入起碼為百萬(wàn)級(jí),這需要科研基金來(lái)支撐,醫(yī)院和病人都不可能負(fù)擔(dān)這個(gè)成本。
正因?yàn)殡y以獲取基因、病理等方面數(shù)據(jù),所以一大波創(chuàng)業(yè)公司才蜂擁進(jìn)入影像領(lǐng)域,他們的很多研究是基于影像信息判斷和推斷基因、病理和臨床信息情況,這是一種可行的方式,但還是需要很多數(shù)據(jù)去驗(yàn)證。
醫(yī)療數(shù)據(jù)非常稀缺,非常寶貴。
當(dāng)前很多醫(yī)院的PACS系統(tǒng)做得很不錯(cuò),盡管存在影像標(biāo)準(zhǔn)化的問(wèn)題,至少有圖像,但很多數(shù)據(jù)是沒(méi)有的,比如病人做了檢查、手術(shù)、治療之后,沒(méi)有完整的隨訪機(jī)制,沒(méi)有后續(xù)數(shù)據(jù)評(píng)估臨床療效和預(yù)后等數(shù)據(jù)。醫(yī)生自己做研究,要花很大力氣搜集整理這些數(shù)據(jù)。
除此之外,數(shù)據(jù)質(zhì)控也很關(guān)鍵。比如,通過(guò)電話隨訪,如果病人電話號(hào)碼更換就無(wú)法再聯(lián)系;其次是打電話隨訪信息準(zhǔn)確性問(wèn)題,隨訪信息有很多方面,比如腫瘤手術(shù)之后,有無(wú)復(fù)發(fā)?是否死亡?化療有無(wú)進(jìn)展?
具體的病逝時(shí)間較為容易確認(rèn),99%的親人都記得,但“有無(wú)進(jìn)展”很難評(píng)估。
另外,每個(gè)隨訪工作人員的態(tài)度也影響隨訪質(zhì)量。許多污染數(shù)據(jù)對(duì)醫(yī)院的研究團(tuán)隊(duì)不但沒(méi)有意義,還有害處。
醫(yī)療數(shù)據(jù)并沒(méi)有那么簡(jiǎn)單,不僅僅是挖掘一個(gè)點(diǎn),而且包含很多方面。不像購(gòu)物,調(diào)查消費(fèi)者的購(gòu)物習(xí)慣時(shí),看其買了什么東西,價(jià)格多少,什么時(shí)候買的?這類數(shù)據(jù)很明確,也很容易找到。
但醫(yī)療數(shù)據(jù)很多是不確定的,很難打通,這種情況下,具備完整信息的病人資料就尤其寶貴。
醫(yī)院能用的數(shù)據(jù)比例很小,判斷數(shù)據(jù)是否有價(jià)值主要取決于具體研究目的。
拿肺癌或其他腫瘤來(lái)說(shuō),在大醫(yī)院,滿足要求的可能只有10%~20%,即便如此,也已經(jīng)算不錯(cuò)了;在二甲等地方醫(yī)院,很多病人做完檢查之后,轉(zhuǎn)移到上級(jí)醫(yī)院看病,有完整資料的病人可能只有1%~2%。
Google團(tuán)隊(duì)關(guān)于糖尿病視網(wǎng)膜病變的研究成果經(jīng)常被當(dāng)做范例來(lái)解讀,但頂級(jí)期刊JAMA(美國(guó)醫(yī)學(xué)會(huì)雜志)也指出了幾點(diǎn)問(wèn)題:
首先是數(shù)據(jù)量的問(wèn)題,Google的這項(xiàng)研究用到了128000張醫(yī)學(xué)圖像,在很多人看來(lái),數(shù)量已經(jīng)非常旁大,但其中嚴(yán)重的病變事實(shí)上只有200多個(gè),還遠(yuǎn)遠(yuǎn)不夠。
疾病種類繁多,沒(méi)有人能保證病人檢測(cè)出不是糖網(wǎng)后就無(wú)需再看醫(yī)生。一個(gè)模型并不能解決所有問(wèn)題,還需要更加龐大的數(shù)據(jù)量。
同時(shí),一項(xiàng)研究成果究竟好不好,不是由工程人員說(shuō)了算,也不是有了較高的精確率就行,而是要經(jīng)過(guò)一系列的驗(yàn)證。
任何新藥臨床應(yīng)用之前,都需要經(jīng)過(guò)一系列的研究和驗(yàn)證,證明安全、有效之后才能在臨床中應(yīng)用。人工智能亦如此。
三、數(shù)據(jù)不互聯(lián)互通優(yōu)質(zhì)的海量數(shù)據(jù)是人工智能算法的基礎(chǔ),但信息孤島在每個(gè)醫(yī)院都是一大難題。病房場(chǎng)景、教學(xué)場(chǎng)景、ICU場(chǎng)景、急診場(chǎng)景的系統(tǒng)都是不互通的。各個(gè)醫(yī)院之間的信息化水平參差不齊,要實(shí)現(xiàn)所有醫(yī)院的數(shù)據(jù)互聯(lián)互通,目前來(lái)說(shuō)還很困難。
當(dāng)前醫(yī)院內(nèi)部的數(shù)據(jù)都難以做到互聯(lián)互通,存在以下顧慮:
一、不敢。數(shù)據(jù)安全是一個(gè)讓行業(yè)比較痛苦的問(wèn)題。大家都想要彼此的數(shù)據(jù),但是對(duì)于到底該不該給對(duì)方提供優(yōu)質(zhì)的數(shù)據(jù)支撐又猶豫不決。
二、不愿。醫(yī)療在很多地方都是香餑餑,牽涉到各個(gè)部門的利益,大家都不愿意將自己的數(shù)據(jù)交出去。
三、不能。目前懂人工智能的醫(yī)生和懂醫(yī)生的IT人才還極其稀少。
四、脫敏數(shù)據(jù)也存在問(wèn)題
新華醫(yī)院副院長(zhǎng)潘曙明在接受雷鋒網(wǎng)采訪時(shí)談到,目前行業(yè)內(nèi)的共識(shí)是,將數(shù)據(jù)用于人工智能模型訓(xùn)練前必須進(jìn)行脫敏處理,確保病人的隱私。
但這也帶來(lái)了數(shù)據(jù)的真實(shí)性問(wèn)題,因?yàn)榍∏≈挥心切┟舾械男畔?比如身份證號(hào)、手機(jī)號(hào))才能確保數(shù)據(jù)的真實(shí)性和唯一性。
假如保險(xiǎn)公司擁有10萬(wàn)張保單,對(duì)方可以說(shuō)這10萬(wàn)張保單的數(shù)據(jù)都是真實(shí)的,因?yàn)槊恳粡埍味紝?duì)應(yīng)了一個(gè)身證份號(hào)。但醫(yī)院的住院號(hào)等編碼并不是唯一的,一旦脫敏數(shù)據(jù)進(jìn)入市場(chǎng)流通,這些數(shù)據(jù)可能會(huì)被反復(fù)打包多次,丟失真實(shí)性和唯一性。
研發(fā)醫(yī)療AI產(chǎn)品必須找到病人數(shù)據(jù)的“源代碼”,這些“源代碼”就存儲(chǔ)在醫(yī)院里。但究竟該如何運(yùn)用這些數(shù)據(jù),還亟待國(guó)家出臺(tái)相關(guān)法律進(jìn)行明確。這些問(wèn)題需要逐一理清。
五、算法不可解釋性由于醫(yī)療涉及到人的生命健康,因此對(duì)AI可解釋性的要求遠(yuǎn)高于任何一個(gè)行業(yè)。
美國(guó)醫(yī)學(xué)與生物工程院會(huì)士、醫(yī)療人工智能領(lǐng)域國(guó)際學(xué)術(shù)權(quán)威學(xué)者沈定剛教授在雷鋒網(wǎng)的一次報(bào)道中指出,可解釋性從理論上來(lái)說(shuō)是非常難的,當(dāng)然,也有人在做這方面的研究。比如在腦部疾病診斷中,分析到底是大腦哪些區(qū)域的病變導(dǎo)致了老年癡呆或者自閉癥。方法是把結(jié)果往前傳,通過(guò)function connectivity分析究竟哪些connectivity和疾病的診斷有關(guān)。
即便如此,沈定剛教授仍舊認(rèn)為實(shí)現(xiàn)可解釋性非常困難,如果要做到這一點(diǎn),就必須在網(wǎng)絡(luò)設(shè)計(jì)方面做調(diào)整,要求網(wǎng)絡(luò)非常稀疏。
客觀環(huán)境受阻,倒逼算法和商業(yè)模式上的創(chuàng)新面對(duì)諸多問(wèn)題,這也迫使不少?gòu)臉I(yè)者不斷從算法和模式上進(jìn)行創(chuàng)新,如微軟亞洲研究院副院長(zhǎng)張益肇在接受雷鋒網(wǎng)采訪時(shí)提到,他們團(tuán)隊(duì)在醫(yī)學(xué)影像數(shù)據(jù)量受限的情況下,采用弱監(jiān)督學(xué)習(xí)提升算法的有效性;而一些AI創(chuàng)業(yè)公司拋棄過(guò)去較為單薄的產(chǎn)品形態(tài),從深度和廣度上選擇打造更接近醫(yī)生的多鏈條端到端的產(chǎn)品平臺(tái)。那么
產(chǎn)業(yè)界如何才能開(kāi)發(fā)出更好用的醫(yī)學(xué)影像輔助診斷產(chǎn)品?
學(xué)者們?cè)撛鯓永肁I技術(shù)更好地解決醫(yī)學(xué)問(wèn)題?
醫(yī)院各科室需要什么、考量什么、在意什么、應(yīng)該做什么?
CFDA和FDA等監(jiān)管機(jī)構(gòu)對(duì)人工智能的態(tài)度與規(guī)范進(jìn)度如何?
近一年來(lái),雷鋒網(wǎng)與近百位應(yīng)用過(guò)AI產(chǎn)品的三甲醫(yī)院院長(zhǎng)、影像科主任醫(yī)師、信息中心主任,以及與40位醫(yī)療人工智能公司CEO和數(shù)百位AI研究員進(jìn)行過(guò)深入探討和報(bào)道記錄。
本次,雷鋒網(wǎng)精選了63篇深度案例報(bào)道,重磅推出“AI+醫(yī)療經(jīng)典項(xiàng)目案例庫(kù)”。
深入挖掘「行業(yè)標(biāo)桿企業(yè)、三甲醫(yī)院、海內(nèi)外名校」三界63個(gè)“醫(yī)療人工智能”案例(平均每篇4300字),全鏈條梳理AI在醫(yī)療各細(xì)分場(chǎng)景,尤其是醫(yī)學(xué)影像中的“學(xué)術(shù)研究+算法實(shí)戰(zhàn)+工程實(shí)施+解決方案搭建+系統(tǒng)集成+最終落地”流程。(共825頁(yè)P(yáng)DF),助力AI和醫(yī)療從業(yè)者更快地讓產(chǎn)品落地并實(shí)現(xiàn)大規(guī)模商業(yè)化。
雷鋒網(wǎng)「AI+醫(yī)療」經(jīng)典項(xiàng)目案例庫(kù)
案例數(shù):
63個(gè),平均每篇4300字,共825頁(yè)P(yáng)DF
案例分類:
高校案例、企業(yè)案例、醫(yī)院案例
案例內(nèi)容:
學(xué)術(shù)研究+算法實(shí)戰(zhàn)+工程實(shí)施+解決方案搭建+系統(tǒng)集成+最終落地
在本案例庫(kù)中,你將學(xué)習(xí)到:
AI+病種:
掌握人工智能在肺癌、糖尿病視網(wǎng)膜病變、阿爾茨海默病、皮膚病、乳腺癌、咽喉癌、胃癌、結(jié)直腸癌、兒童骨齡等影像方向的全面應(yīng)用。
案例:
企業(yè)與醫(yī)院的AI商業(yè)化應(yīng)用落地案例
流程:
了解從算法到工程,再到端到端產(chǎn)品的研發(fā)全流程
經(jīng)驗(yàn):
學(xué)習(xí)多位產(chǎn)、學(xué)、醫(yī)專家,在研發(fā)醫(yī)療人工智能項(xiàng)目中走過(guò)的彎路、失敗經(jīng)驗(yàn)與深刻總結(jié),以及新的機(jī)遇。
以下為部分案例列表(全版共63個(gè)):
高校案例(8個(gè))
中科院研究員田捷:基于醫(yī)療大數(shù)據(jù)和AI技術(shù)的影像組學(xué)及其應(yīng)用
CMU邢波教授團(tuán)隊(duì):如何利用AI自動(dòng)生成醫(yī)學(xué)影像報(bào)告
吳恩達(dá)飽受質(zhì)疑的醫(yī)療AI成果,輔助肺炎診斷
丘成桐得意門生顧險(xiǎn)峰:機(jī)器學(xué)習(xí)解決不了的醫(yī)學(xué)圖像問(wèn)題,如何用幾何方法攻克?
企業(yè)案例(29個(gè))
騰訊覓影:在解決食管癌、乳腺癌、肺癌、糖網(wǎng)病難題上,我們用了這些AI手段
IBM Watson:關(guān)于它的診療方案,關(guān)于醫(yī)生的評(píng)價(jià)
微軟亞洲研究院副院長(zhǎng)張益肇:你可能有所不知,MSRA已經(jīng)做了8年醫(yī)學(xué)影像研究
Google醫(yī)學(xué)影像團(tuán)隊(duì):AI落地醫(yī)院臨床,需恪守這3大原則
科大訊飛醫(yī)療總經(jīng)理陶曉東:三款產(chǎn)品和一個(gè)平臺(tái),未來(lái)要做基層全科助手
依圖醫(yī)療總裁倪浩:產(chǎn)品只是第一步,與醫(yī)院共同制定新標(biāo)準(zhǔn)才是方向
飛利浦ISD(圖像后處理平臺(tái)):詳解腫瘤、神經(jīng)、心臟研究套件
醫(yī)院案例(26個(gè))
廣東省人民醫(yī)院劉再毅教授自述:為什么我是AI醫(yī)療的「旁觀者」?
浙大兒院副院長(zhǎng)傅君芬:我們?yōu)楹螘?huì)把AI引入兒童骨齡檢測(cè)?
北京大學(xué)第三醫(yī)院:大數(shù)據(jù)中心在醫(yī)院的落地,需如何去做集成融合與利用
華山醫(yī)院信息中心主任:個(gè)性化AI給藥系統(tǒng)的搭建經(jīng)驗(yàn)與感悟
中國(guó)中醫(yī)科學(xué)院首席研究員:如何把老中醫(yī)的經(jīng)驗(yàn)“大數(shù)據(jù)化”,得出診療規(guī)律
江蘇省人民醫(yī)院主任醫(yī)師:AI時(shí)代,請(qǐng)熟知我們影像科醫(yī)生的工作思維
聯(lián)系客服