大數(shù)據(jù)時代無可爭議地來臨了。
在長城會大數(shù)據(jù)論壇上,輝瑞中國醫(yī)學部的谷成明博士指出,大數(shù)據(jù)的特點之一是“規(guī)模巨大且持續(xù)高速增長”。而且,“大數(shù)據(jù)能夠讓我們看到以往看不到的東西,回答臨床研究回答不了的問題。”
他說,“大數(shù)據(jù)的另一個特征是數(shù)據(jù)收集、數(shù)據(jù)清理、數(shù)據(jù)分析方面的變化”,比如使用拍照掃描自動識別技術,可以幫助醫(yī)生收集院內院外的數(shù)據(jù),減少大量的人工錄入需求,而且患者可看到自己的危險因素,控制情況,提高治療的依從性?!?/span>
來自美國輝瑞公司的MarcBerger教授則說,大數(shù)據(jù)分析最需要“數(shù)據(jù)能充分發(fā)揮其外部性,并通過與某些相關數(shù)據(jù)交叉融合,才能產(chǎn)生巨大價值。”
而且,“只有通過比較,才能展現(xiàn)其魅力?!?/span> 比如有研究通過比較不同國家的數(shù)據(jù),發(fā)現(xiàn)中國高膽固醇患者診斷率和認知率之低,讓人觸目驚心。
為此,輝瑞公司總部購買了許多巨大的商業(yè)醫(yī)療數(shù)據(jù)庫,可供有興趣的專家進行中外對比研究。但這也是有門檻的,因為這種數(shù)據(jù)“通常需要臨床專家、統(tǒng)計專家、公共衛(wèi)生專家及大數(shù)據(jù)分析專家等合作,才能更好應用大數(shù)據(jù),造福于患者。
對這一觀點,來自IBM中國研究院的謝國彤表示,隨著我們掌握的數(shù)據(jù)越來越多,可以發(fā)現(xiàn)的統(tǒng)計上顯著的相關關系也就越來越多,因此,很多數(shù)據(jù)可能沒有實際意義,甚至是“欺騙性的”,對此,從專業(yè)角度出發(fā),避免制造“噱頭”很重要。
另外,在大數(shù)據(jù)論壇上,幾位講者共同說的一點是“garbage in,garbage out”,這是統(tǒng)計學專家的口頭禪,意思是說,“扔進去垃圾,出來的也是垃圾”。
這一方面是說建立數(shù)學模型要洞察問題的內在本質和癥結,而非數(shù)字游戲;另一方面,也提示數(shù)據(jù)的傾向性問題,這其實也是大數(shù)據(jù)分析面臨的“數(shù)據(jù)來源方面”的挑戰(zhàn),即應用客觀而真實的數(shù)據(jù)找到癥結所在;當然,數(shù)據(jù)質量問題也是要考慮的問題。
2012 年,《哈佛商業(yè)評論》報道,“數(shù)據(jù)科學相關工作是'二十一世紀最性感的工作崗位’?!?/span>
但這個性感是什么,谷成明認為是“大數(shù)據(jù)的全新的思維和方式,尤其是思維模式的改變。”。
“我們有時不是追究事情的因果關系和理論的推導,而關注是否'相關’,因此大數(shù)據(jù)回答的'怎樣’,而不是'為什么’?!?/span>
比如,一項研究發(fā)現(xiàn)對于糖尿病患者需要治療血脂異?;颊撸?/span>72%的患者選擇了阿托伐他汀治療,87%的患者病情明顯改善,原因可能有很多,但數(shù)據(jù)真實反映了醫(yī)生對于個性化選擇方案的良好結果。
從科研方面,谷成明表示,大數(shù)據(jù)顛覆了“觀察—假設—實驗—應用”的科研流程。不是先有假設,再開始試驗。
“我們可以先提出問題,馬上就找答案。” 谷成明說。
當然,大數(shù)據(jù)的真實價值還是海洋中的冰山,現(xiàn)在看到的只是冰山一角。
我們該怎么做?用MarcBerger教授的話來說,“要么去改變,要么被改變”。
轉載請標明來源:中國循環(huán)雜志
聯(lián)系客服