楊金堂1,林孝毅1,楊正群2,柯昌美1
(1.武漢科技大學(xué) 機(jī)械自動化學(xué)院,湖北 武漢 430081;2.襄陽遠(yuǎn)銳資源工程技術(shù)有限公司,湖北 襄陽 441000)
摘 要:為提高廢舊鉛酸蓄電池回收效率和金屬回收質(zhì)量,提出采用自動化手段分類廢舊鉛酸蓄電池。針對該識別分類問題,首先將主成分分析法、線性判別分析法應(yīng)用于廢舊鉛酸蓄電池的X射線圖像的特征提取。通過支持向量機(jī)對提取的訓(xùn)練集圖像特征向量進(jìn)行訓(xùn)練,分別對測試集的圖像數(shù)據(jù)進(jìn)行分類實(shí)驗(yàn),并對比了不同數(shù)量的訓(xùn)練集和不同特征空間維度下各種方法的識別率。實(shí)驗(yàn)結(jié)果表明,主成分分析法、線性判別分析法可用于廢舊鉛酸蓄電池X射線圖像的識別,并且隨著訓(xùn)練集與測試集樣本量的增加,二次線性判別分析法表現(xiàn)出較為穩(wěn)定的識別率。
關(guān)鍵詞:主成分分析法;線性判別分析法;支持向量機(jī);廢舊鉛酸蓄電池
工業(yè)的高速發(fā)展,使得鉛酸蓄電池的使用量與使用范圍越來越大,與此同時,報(bào)廢的鉛酸蓄電池?cái)?shù)量也在與日俱增,而隨著國家對資源再生技術(shù)的重視,廢舊蓄電池資源回收利用技術(shù)也在加快改進(jìn)。鉛酸蓄電池的主要由極柱、極群組、匯流條等部分組成,通常情況下,鉛酸蓄電池的匯流條與極柱部分主要含有鉛銻合金,而網(wǎng)柵主要含有鉛鈣合金[1]。由于在回收工藝中的冶煉過程需要對鉛鈣以及鉛銻熔鑄去渣,常常對銻、錫、硒等貴重金屬產(chǎn)生不必要損失,也不利于銅鐵的去除,所以選擇把廢舊鉛酸蓄電池中主要含有的鉛鈣合金以及鉛銻合金的兩部分分開進(jìn)行處理??紤]到鉛酸蓄電池的自身結(jié)構(gòu)以及匯流條根部是匯流條與網(wǎng)柵連接部分,也是電池結(jié)構(gòu)中較薄弱處,所以將切割高度定在匯流條的根部。而由于人力切割蓄電池的精度和效率較低,并且廢舊鉛酸蓄電池中的稀硫酸對工人身體健康有較大危害,因此采用自動化系統(tǒng)提高處理效率具有重要的意義。
考慮近年來識別技術(shù)在工程領(lǐng)域的快速發(fā)展以及鉛酸蓄電池的結(jié)構(gòu)特點(diǎn),提出利用鉛酸蓄電池的X射線影像,結(jié)合圖像識別技術(shù)實(shí)現(xiàn)廢舊鉛酸蓄電池分類識別,鉛酸蓄電池X射線圖像,如圖1所示。當(dāng)前國內(nèi)外圖像識別方法主要有:(1)對研究圖像提取特征信息并采用分類器進(jìn)行訓(xùn)練識別[2];(2)將經(jīng)過預(yù)處理后的圖像采用kNN算法進(jìn)行識別;(3)提取預(yù)處理后圖像的感興趣區(qū)域,采用模板匹配算法識別。以上算法雖然被廣泛地應(yīng)用于各行各業(yè),但仍存在不足的地方。諸如模板匹配算法雖然識別效果不錯,但是抗干擾能力較差;神經(jīng)網(wǎng)絡(luò)算法雖然自學(xué)能力強(qiáng),識別率較高,但是容易陷入局部極小值中;kNN算法雖然原理直觀簡單,但是計(jì)算維度高效率低。
分別運(yùn)用計(jì)算效率較高的主成分分析法、二次線性判別分析法,PCA+LDA算法對6種常用的鉛酸蓄電池的X射線成像圖進(jìn)行特征提取,并通過支持向量機(jī)對廢舊鉛酸蓄電池的X射線圖進(jìn)行識別分類。實(shí)驗(yàn)對比了三種方法在不同情況下的識別率,并根據(jù)實(shí)驗(yàn)結(jié)果對提出的三種方法進(jìn)行了分析評價。
2.1 主成分分析法
主成分分析法(PCA)的原理是將數(shù)據(jù)特征投影為少數(shù)綜合特征[2]的一種統(tǒng)計(jì)分析方法。它采取一種降維的方式,找出幾個主要的特征向量來替代原來的大量特征,使這些主要的特征向量能最大地反映出原信息,同時使得數(shù)據(jù)之間彼此互不相關(guān),而由此產(chǎn)生的新變量則稱之為主成分。
PCA算法[3-4]能夠有效地壓縮數(shù)據(jù)進(jìn)行特征提取,可以將高維度的數(shù)據(jù)分解為低維度,PCA算法對數(shù)據(jù)的處理步驟如下:
(1)樣本矩陣獲取
假定N張大小為m×n的鉛酸蓄電池X射線圖像,將每張圖像的列向量首尾串接成大小為m×n的列向量,那么N張圖像數(shù)據(jù)可以構(gòu)成(m×n)×N的矩陣。令 M=(m×n),則樣本數(shù)據(jù)的矩陣為X=[X1,X2,…,XN],其中 XN=[X1,N,X2,N,…,XM,N]T。
(2)樣本均值計(jì)算
將樣本矩陣的數(shù)據(jù)均值化,可將原始數(shù)據(jù)中的量綱和數(shù)據(jù)量級消除,使得獲取的主成分更具代表性,由式(1)可得原始樣本數(shù)據(jù)的均值:
(3)構(gòu)建協(xié)方差矩陣
根據(jù)概率論的定義,協(xié)方差矩陣Cx與數(shù)據(jù)的均值有關(guān),可根據(jù)式(2)近似計(jì)算獲?。?/p>
式中:E—數(shù)據(jù)的數(shù)學(xué)期望運(yùn)算。式(3)中單個元素的協(xié)方差矩陣:
當(dāng)下標(biāo) i=j時,σ1,1,σ1,1,…,σM,M,是協(xié)方差矩陣中各變量間的方差,而在非對角線元素上,下標(biāo) i≠j,σi,j是變量 xi與 xj間相關(guān)程度的協(xié)方差。
(4)計(jì)算特征值及其特征向量
由特征值分解,可得協(xié)方差矩陣 Cx的特征值 λ1,λ2,…,λM以及相應(yīng)的特征向量[v1,v2,…,vM],并對協(xié)方差矩陣的特征值以及相應(yīng)的特征向量進(jìn)行降序排列。通過式(4)得到相應(yīng)的標(biāo)準(zhǔn)正交投影向量[u1,u2,…,uM],最后從獲取的正交投影向量選取前k個作為圖像數(shù)據(jù)的主成分。
2.2 線性判別分析法
線性判別分析法(LDA)[5]是以提高數(shù)據(jù)樣本在子空間中的可分性為目標(biāo),其基本思想就是把高維的模式樣本映射到最佳特征空間中去,實(shí)現(xiàn)降低特征空間維度并獲得相關(guān)分類信息的目標(biāo)。樣本在投影空間中不同類別數(shù)據(jù)間距離最大,而相同類別中數(shù)據(jù)距離最小,因此可使得類間可分離性達(dá)到最優(yōu)。線性判別分析法算法的計(jì)算步驟如下:
(1)樣本均值
假定有N張鉛酸蓄電池的X射線成像圖,每張圖像為(m×n)維數(shù)據(jù) xi,其組成的訓(xùn)練樣本集{x1,x2,…,xN}分別屬于 ω1,ω2,…,ωc這c個不同的類別,其中類ωi的樣本數(shù)目為ni,則類ωi的樣本數(shù)據(jù)的均值mi為:
所有樣本的均值為:
(2)離散度計(jì)算
設(shè)Sw為樣本數(shù)據(jù)的類內(nèi)離散度,Sb為樣本數(shù)據(jù)的類間離散度,則
(3)求解最優(yōu)映射向量
LDA算法的分類特性在于,希望數(shù)據(jù)經(jīng)過LDA算法運(yùn)算后,可使得所分的類間距離最大,而類內(nèi)距離最小,這樣才能具有較好的分類效果。那么,這就需要求得一個最優(yōu)映射向量W,使得子空間J能通過Fisher準(zhǔn)則求得,即:
式(9)對W求偏導(dǎo),令W為0,求得極大值,則最終得到投影向量W*是矩陣
的最大特征值對應(yīng)的特征向量構(gòu)成的。(4)映射樣本數(shù)據(jù)
將訓(xùn)練樣本xi向LDA子空間J做映射,那么有yi=W*Txi,即獲得的向量yi就是xi的LDA特性。
支持向量機(jī)是文獻(xiàn)[6-7]提出的一種基于結(jié)構(gòu)風(fēng)險最小化準(zhǔn)則的機(jī)器學(xué)習(xí)方法,它比傳統(tǒng)的方法擁有更強(qiáng)的推廣能力。它還具有解決小樣本、高維數(shù)以及非線性等實(shí)際問題的特點(diǎn)。
對于非線性可分的問題,SVM將輸入向量由低維空間投影到高維空間,來實(shí)現(xiàn)樣本數(shù)據(jù)分類。分類過程中,只需調(diào)用合適的核函數(shù)K(x,xi)[8],則可避免求解非線性映射函數(shù)具體形式,也解決了在高維空間計(jì)算所帶來的“維數(shù)災(zāi)難”問題。常用的核函數(shù)有:多項(xiàng)式函數(shù)、徑向基RBF函數(shù)、S形函數(shù),在這三種核函數(shù)中,徑向基RBF函數(shù)對于高維、低維、大樣本、小樣本等情況都適用。因此本實(shí)驗(yàn)選用徑向基RBF函數(shù)作為SVM的核函數(shù)來進(jìn)行鉛酸蓄電池的識別分類。SVM最初是用于二分類問題的方法,由于鉛酸蓄電池具有多種類型,因此需要將SVM擴(kuò)展到多分類問題。具體的識別流程,如圖2所示。圖像經(jīng)過預(yù)處理后,所有圖像維度一致,并分為訓(xùn)練集和測試集兩部分,將兩部分圖像分別經(jīng)三種方法特征提取后,需要通過歸一化將數(shù)據(jù)權(quán)重統(tǒng)一至(0,1),再由SVM對處理后的數(shù)據(jù)進(jìn)行分類。
圖2 識別流程圖
Fig.2Flow Chart of Identification
4.1 鉛酸蓄電池的數(shù)據(jù)集處理
實(shí)驗(yàn)選用6類常用的鉛酸蓄電池的X射線圖像作為數(shù)據(jù)集,由于采集的原始圖像尺寸為(986×256)像素并且鉛酸蓄電池影像的長寬不一,為減小數(shù)據(jù)維度且能完整的獲取所有類型電池的圖像,統(tǒng)計(jì)所有X射線圖像中的鉛酸蓄電池影像的像素尺寸,發(fā)現(xiàn)所有影像的長寬分別小于460個像素和230個像素,因此采用460×230像素窗口對數(shù)據(jù)集中的圖像進(jìn)行截取,實(shí)驗(yàn)中采集的部分樣本圖像,如圖3所示。
實(shí)驗(yàn)環(huán)境采用MATLAB進(jìn)行編程。本數(shù)據(jù)集共有108張經(jīng)過預(yù)處理后的圖像(每類蓄電池18幅,圖像大小均為(460×230)像素),且對數(shù)據(jù)集內(nèi)圖像分類編號便于區(qū)分,每張圖像數(shù)據(jù)可構(gòu)成樣本矩陣的列向量為105800維。由于處理對象是廢舊鉛酸蓄電池,在回收和運(yùn)輸過程中,蓄電池往往存在一定程度的擠壓變形,因而實(shí)際成像的效果會存在一些差異。實(shí)驗(yàn)中訓(xùn)練集大小和測試集大小需保持一致,分別選取每類蓄電池圖像(5~9)張作為訓(xùn)練集,選取剩下的(5~9)張作為測試集,用來檢測該方法識別率。
圖3 實(shí)驗(yàn)中采集的部分樣本圖像
Fig.3Images of Sample Collected in the Experiment
4.2 識別實(shí)驗(yàn)及分析
分別采用PCA、PCA+LDA、二次LDA(在LDA初始值上再進(jìn)行一次LDA)對訓(xùn)練集圖像進(jìn)行特征提取,并通過網(wǎng)格搜索法[9-10]對訓(xùn)練集數(shù)據(jù)進(jìn)行交叉驗(yàn)證,獲取精度最高的RBF核的參數(shù)gamma以及懲罰系數(shù)C,最優(yōu)gamma=0.0078125,C=0.03215,其交叉識別率為95%。廢舊鉛酸蓄電池圖像的識別界面,如圖4所示。由表1可以看出,在特征維數(shù)為10,訓(xùn)練樣本數(shù)量較小時,PCA特征提取方法的鉛酸蓄電池識別率較高,但隨著每類電池圖像的樣本數(shù)的上升,PCA特征提取方式逐漸下降,而二次LDA卻隨著樣本數(shù)目的增加,識別率由最初的83.3%提升至90%以上。PCA+LDA特征提取方式,首先對識別圖像采取降維處理,再對主成分進(jìn)行LDA的特征提取,隨著樣本數(shù)的增加,其識別率有所下降,但相對于PCA算法要高。
圖4 廢舊鉛酸蓄電池識別界面
Fig.4Used Lead-Acid Batteries Recognition Interface
表1 特征維數(shù)相同時各征提取方法識別結(jié)果
Tab.1Recognition Results of Methods in the Same Dimension
樣本數(shù)/每類56789PCA 96.7% 94.4% 91.4% 90% 86.7%二次LDA 83.3% 83.3% 88.6% 92.5% 92.5%PCA+LDA 96.7% 94.4% 91.4% 92.5% 88.9%
在訓(xùn)練集樣本為5時,特征維數(shù)與鉛酸蓄電池圖像的識別率的關(guān)系,當(dāng)維數(shù)大于15后,測試集的識別率趨于固定,如圖5所示。說明各種方法提取的前15維特征對鉛酸蓄電池圖像之間區(qū)分占有較大比例,其中由于二次LDA方法在原始的LDA方法上對測試集再一次進(jìn)行了運(yùn)算,不僅實(shí)現(xiàn)了降維過程,而且使得測試集數(shù)據(jù)之間的類間離散度增大,而類內(nèi)離散度更為緊密,因此分類結(jié)果較其他兩種方法更好。
圖5 特征維數(shù)與蓄電池識別率的關(guān)系
Fig.5The Relationship Between Feature Dimension and Recognition Rate of the Battery
實(shí)驗(yàn)對比了PCA,PCA+LDA,二次LDA算法在不同特征空間維度以及不同樣本數(shù)目下的識別率。在樣本數(shù)量不變的情況下,特征維數(shù)僅在一定范圍內(nèi)對三種特征提取法的識別有影響。但隨著圖像樣本的增加,PCA算法的識別率有所下降,體現(xiàn)了該算法面對圖像樣本數(shù)量增加時,去除相關(guān)性能力的弱化。而由于LDA算法強(qiáng)調(diào)不同圖像數(shù)據(jù)中的差別,增大不同類別數(shù)據(jù)間的離散度并減小同類數(shù)據(jù)間離散度,因此在樣本量增加的情況下,PCA+LDA算法的識別率高于PCA算法,而二次LDA算法高于PCA+LDA算法。這也說明,相比PCA算法,LDA算法去除了與分類無關(guān)的某些因素。
參考文獻(xiàn)
[1]談大偉.廢舊鉛酸電池回收預(yù)處理鋸切系統(tǒng)的研究[D].武漢:武漢科技大學(xué),2013:1-4.(Tan Da-wei.The study of sawing system for used lead-acid batteries’s recycling pretreatment[D].WuHan:Wuhan University of Science and Technology,2013:1-4.)
[2]華順剛,周羽,劉婷.基于PCA+LDA的熱紅外成像人臉識別[J].模式識別與人工智能,2008(2):160-164.(Hua Shun-gang,Zhou Yu,Liu Ting.Thermal infrared face image recognition based on PCA and LDA[J].Pattern Recognition and Artificial Intelligence,2008(2):160-164.)
[3]唐琎,劉波,蔡自興.基于二維主成分分析的交通標(biāo)志牌識別[J].計(jì)算機(jī)科學(xué),2010(11):287-288.(Tang Jin,Liu Bo,Cai Zi-xing.Traffic sign recognition based on two-dimensional principal component analysis [J].Computer Science,2010(11):287-288.)
[4]韓鴻哲,王志良,劉冀偉.基于線性判別分析和支持向量機(jī)的步態(tài)識別[J].模式識別與人工智能,2005(2):160-164.(Han Hong-zhe,Wang Zhi-liang,Liu Ji-wei.Gait recognition based on linear discriminant analysis and support vector machine[J].Pattern Recognition and Artificial Intelligence,2005(2):287-288.)
[5]潘越,方向忠,王慈.人臉圖像信息可用性影響因素的研究分析[J].電視技術(shù),2015(7):86-90.(Pan Yue,F(xiàn)ang Xiang-zhong,Wang Ci.Image validity analysis for face recognition[J].Video Engineering,2015(7):86-90.)
[6]Vladimir N.Vapnik.The Nature of Statistical Learning Theory[M].New York:Springer-Verlage,1995.
[7]陸光,滿慶麗,徐然.基于SVM的多特征融合的天牛圖像識別[J].森林工程,2012(4):21-25.(Lu Guang,Man Qing-li,Xu Ran.SVM-based multi-feature fusion longicorn image recognition[J].Forest Engineering,2012,28(4):21-25.)
[8]楊大鵬,高向東,劉紅.基于紋理特征的道路行人識別研究[J].機(jī)械設(shè)計(jì)與制造,2012(1):182-184.(Yang Da-peng,Gao Xiang-dong,Liu Hong.Study on pedestrian recognition based on texture feature[J].Machinery Design&Manufacture,2012(1):182-184.)
[9]吳峰,陳后金,姚暢.基于網(wǎng)格搜索的PCA-SVM道路交通標(biāo)志識別[J].鐵道學(xué)報(bào),2014(11):60-64.(Wu Feng,Chen Hou-jin,Yao Chang.Traffic sign recognition based on PCA-SVM with grid search[J].Journal of the China Railway Society,2014(11):60-64.)
[10]舒雙寶,羅家融,徐從東.一種基于支持向量機(jī)的人臉識別新方法[J].計(jì)算機(jī)仿真,2011,28(2):280-283.(Shu Shuang-bao,Luo Jia-rong,Xu Cong-dong.A new method of face recognition base on support vector machine[J].Computer Simulation.2011,28(2):280-283.)
The Study of X-Ray Image Recognition and Classification of Used Lead-Acid Batteries
YANG Jin-tang1,LIN Xiao-yi1,YANG Zheng-qun2,KE Chang-mei1
(1.College of Machinary and Aotumation,Wuhan University of Science and Technology,Hubei Wuhan 430081,China;2.Xiangyang Yuanrui Resources Engineering Technology Co.,Ltd.,Hubei Xiangyang 441000,China)
Abstract:In order to improve recycling efficiency of used lead-acid and recycling quality of metal,the automated method to classify used lead-acid was proposed.According to the recognition classification problem,first,used PCA and LDA to extract feature of X-ray image about used lead-acid batteries.Then,trained the extracted image feature vectors of the training set by SVM and identified test set in the classification experiment,finally,compared the recognition rate in different numbers of train data and different feature space dimensions.The result shows that PCA and LDA could be used to recognition of X-ray images about used lead-acid batteries,and with the increasing of number of test data and the train data,the Secondary LDA showed more stable than others in recognition.
Key Words:PCA;LDA;Support Vector Machines;Used Lead-Acid Batteries
中圖分類號:TH16;TM912;TP391
文獻(xiàn)標(biāo)識碼:A
文章編號:1001-3997(2017)10-0156-03
來稿日期:2017-04-08
基金項(xiàng)目:廢舊鉛酸蓄電池綜合利用新工藝項(xiàng)目—湖北省科技支撐計(jì)劃(2015BCA305);
石煤提釩清潔生產(chǎn)成套設(shè)備研發(fā)及中試—湖北省科技支撐計(jì)劃(2015BCA286)
作者簡介:楊金堂,(1964-),男,湖北武漢人,博士研究生,教授,主要研究方向:機(jī)電系統(tǒng)計(jì)算機(jī)建模及仿真;
林孝毅,(1990-),男,湖北武漢人,碩士研究生,主要研究方向:機(jī)電系統(tǒng)模式識別
聯(lián)系客服