如果在機(jī)場(chǎng)的安檢系統(tǒng)沒有旅客的人工比對(duì)系統(tǒng),沒有身份證、沒有護(hù)照,僅僅憑借各種傳感設(shè)備記錄的信息來核對(duì)身份,乘客自如的登機(jī),有沒有這個(gè)可能?我想大多數(shù)人的第一個(gè)反應(yīng),這是不可能的,如果識(shí)別錯(cuò)了呢?如果這個(gè)人帶著面具呢、如果這個(gè)人做了美容、如果這個(gè)人做了手術(shù)呢、如果這個(gè)人變老呢?想象一下,有太多的不可能。
但是,譚鐵牛院士告訴我們
這不僅不是不可能,而且還是未來的趨勢(shì)。
我們的身份信息包含著年齡、性別、民族等信息,年齡性別民族等信息我們稱為人口學(xué)特征。譚院士的講座就是告訴我們?nèi)绾瓮ㄟ^人臉識(shí)別、指紋識(shí)別、聲紋識(shí)別、耳型識(shí)別以及虹膜識(shí)別甚至加上簽名識(shí)別等生物識(shí)別來確定這個(gè)人的人口學(xué)特征。
在講座引入階段,譚院士介紹了生物識(shí)別的概念:生物識(shí)別也叫“生物特征識(shí)別”,即根據(jù)人自身的特征,比如你的指紋來識(shí)別人的身份。這些自身的特征,就叫做生物特征,有兩大類:一類叫生理特征,另一類叫行為特征。生理特征是與生俱來的,比如你的指紋、你的虹膜;行為特征是后天習(xí)慣使然,比如:走路的樣子,寫字的筆跡。人體有很多可以用來進(jìn)行身份驗(yàn)證的生物特征。
在本講座中,譚院士講述了6大生物特征類:面部、聲音、步態(tài)、指紋、虹膜、筆跡,利用這6大生物特征來估計(jì)人的性別、年齡和種族這三大人口學(xué)身份,并講述了其涉及的模型和方法。
生物識(shí)別的技術(shù)來進(jìn)行人口學(xué)特征分析標(biāo)志性事件開始于1988年通過聲音識(shí)別性別,而隨著信息采集技術(shù)的進(jìn)步以及深度學(xué)習(xí)技術(shù)的發(fā)展,人口學(xué)特征分析準(zhǔn)確度越來越高,針對(duì)每一種生物識(shí)別技術(shù),譚院士都是從問題提出、問題過去及現(xiàn)在解決方案以及問題挑戰(zhàn)三個(gè)角度來闡述問題。
首先他講述的是生物特征獲取技術(shù),手機(jī)、網(wǎng)絡(luò)、智能穿戴設(shè)備、檢測(cè)設(shè)備等都可以獲取到人體生物學(xué)信息。
然后講述了應(yīng)用最為成熟的指紋識(shí)別方法,傳統(tǒng)的指紋表示方法有山脊數(shù)、不對(duì)稱山脊數(shù)、山脊厚度、山谷厚度比(RTVTR)等特征提取方法,也有小波表示和紋理分析方法。而最為奇妙的是男女的指紋特征并不一致,所以指紋識(shí)別可以用于性別的分類。
而用于人口學(xué)特征分析的人臉識(shí)別技術(shù)最開始是幾何學(xué)分析,用鼻嘴眼的距離等特征來做特征臉,這個(gè)方法僅僅能分析正面圖像,而且忽略了紋理信息,隨后是Holisic模型和流形學(xué)習(xí)在人臉識(shí)別中的應(yīng)用提高了識(shí)別的正確率,目前流行的深度學(xué)習(xí)技術(shù)在人臉識(shí)別的成功應(yīng)用更是極大提升了人口學(xué)特征提取的精確度。但是人臉識(shí)別的各種技術(shù)均依賴于獲取臉部圖像的質(zhì)量。
譚院士提出了三個(gè)挑戰(zhàn),包括側(cè)臉圖像、低分辨率的圖像、光照或者遮擋的圖像對(duì)人臉識(shí)別的影響。這三個(gè)挑戰(zhàn),與及其學(xué)生給出了用深度學(xué)習(xí)或者對(duì)抗網(wǎng)絡(luò)來生成正面圖像、高分辨率圖像以及其他的調(diào)整,效果都相當(dāng)好。從而也可見,此次的講座給出我們一個(gè)解決問題的框架:提出問題、問題的傳統(tǒng)與現(xiàn)在的解決方案以及問題的挑戰(zhàn)及解決的方法。
人臉識(shí)別對(duì)年齡的識(shí)別傳統(tǒng)的方法有BIF + Adaboost + SVM等,這些方法可以實(shí)現(xiàn)跟人工識(shí)別相同的效果,而卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用使得對(duì)年齡估計(jì)的正確度會(huì)超過人類。但是對(duì)于非標(biāo)準(zhǔn)化的數(shù)據(jù)集人口學(xué)的預(yù)測(cè)可能相互影響,比如年齡估計(jì)會(huì)受到民族的影響,也會(huì)受到性別的影響。
而對(duì)好像千篇一律的人的行走方式在識(shí)別方面卻表現(xiàn)出驚人的準(zhǔn)確性。應(yīng)用于人口學(xué)預(yù)測(cè)的步態(tài)識(shí)別傳統(tǒng)方法有基于點(diǎn)光源的方法、基于模型和基于表觀的方法。譚院士展示了他和其學(xué)生合作的基于CNN的深度學(xué)習(xí)方法在身份識(shí)別中的應(yīng)用視頻,該視頻可以在中央電視臺(tái)的機(jī)智過人欄目中查看。
觀看網(wǎng)址:
http://tv.cctv.com/2017/09/15/VIDEjBtstfgHYmEOl2gm9PUQ170915.shtml
當(dāng)然譚院士是虹膜識(shí)別方面的專家,虹膜識(shí)別的紋理特征分析在性別識(shí)別方面應(yīng)用也較為成功,結(jié)合Gabor濾波、線性濾波以及尺度不變?yōu)V波等小波分析方法能較好的進(jìn)行身份識(shí)別。
聲音識(shí)別主要是提取聲紋和聲韻特征來分析性別、年齡。LPCC、MFCC和PLP系數(shù)在性別之間的辨識(shí)度較高,如果加上振幅、頻率、能量等分析方法,聲紋的識(shí)別度會(huì)更高。
手寫體受到人們身體素質(zhì)、年齡生活方式等因素的影響,從而根據(jù)手寫體來分析人口學(xué)特征具有先天的優(yōu)勢(shì)。微觀上的字體梯度、結(jié)構(gòu)和凸凹性以及宏觀上的字體的傾斜性、字符間距和灰度值都可以作為人口特征探索的特征。而由于電子簽名的應(yīng)用,書寫速度、書寫方向、傾斜度和曲率等因素的記錄更可以加強(qiáng)手寫體識(shí)別的辨識(shí)度。
總之,綜合各種生物識(shí)別方法可以較好的識(shí)別出個(gè)人的性別、年齡、種族等人口學(xué)特征。下表是各種生物特征識(shí)別的方法和應(yīng)用。
譚院士的講座通俗易懂,深入淺出。即有引用文獻(xiàn)也有使用數(shù)據(jù)集,對(duì)該領(lǐng)域的學(xué)習(xí)者來說都是難得的學(xué)習(xí)資料,而研究方法從傳統(tǒng)方法到深度學(xué)習(xí),特征提取從顯性到隱性,都顯示了現(xiàn)代研究方法的演繹過程??傊?,教我們學(xué)會(huì)研究方法,教我們不同角度去思考問題,比如性別的識(shí)別除了人臉之外,還有指紋識(shí)別,虹膜識(shí)別以及書寫識(shí)別,則研究的準(zhǔn)確度就可以達(dá)到相當(dāng)?shù)母叨?;從理論到引用到產(chǎn)品,一個(gè)系統(tǒng)的研究展現(xiàn)在我們面前。聆聽者無不集中精力,全神貫注,每有會(huì)意則贊嘆不已,以為妙絕。
聯(lián)系客服