GrowthNudge
你的成長,我來助推!
公眾號《成長助推》致力于分享成長需要的實用工具、技能、思維方式,以助推你的成長為目標(biāo),直接省心的提供高效有價值的內(nèi)容。
今日助推小目標(biāo):
1. 工具箱簡單說明。統(tǒng)計與機(jī)器學(xué)習(xí)工具箱;
2. 8046頁的PDF文檔下載。MathWorks的關(guān)于該工具箱的超詳細(xì)用戶手冊:Statistics and Machine Learning Toolbox User's Guide。
統(tǒng)計與機(jī)器學(xué)習(xí)工具箱
MathWorks公司有很多屬于機(jī)器學(xué)習(xí)分支的軟件包,提供用于數(shù)據(jù)分析的高質(zhì)量算法以及用于可視化圖形工具。這些軟件包可以相互集成或與其他Matlab函數(shù)集成,用以生成用于機(jī)器學(xué)習(xí)中的強(qiáng)大系統(tǒng)。
這些工具箱包括但不限于以下幾種:統(tǒng)計與機(jī)器學(xué)習(xí)工具箱;神經(jīng)網(wǎng)絡(luò)工具箱;計算機(jī)視覺系統(tǒng)工具箱;系統(tǒng)辨識工具箱等;
今天主要給大家簡單介紹《統(tǒng)計與機(jī)器學(xué)習(xí)工具箱》,它提供用于從大量數(shù)據(jù)中獲取趨勢和模式的數(shù)據(jù)分析方法,包括分類工具、回歸工具和聚類工具等;
分類方法用于將數(shù)據(jù)區(qū)分為不同的類別。例如圖像形式的數(shù)據(jù)可用于按照是否有腫瘤對器官圖像分類。分類學(xué)習(xí)通常應(yīng)用于手寫識別,信用評分和面部識別等問題中。分類方法包括支持向量機(jī)(SVM),決策樹和神經(jīng)網(wǎng)絡(luò)等。
回歸方法允許基于當(dāng)前數(shù)據(jù)構(gòu)建模型預(yù)測未來的數(shù)據(jù)。在有新數(shù)據(jù)可用時可以持續(xù)更新回歸模型;數(shù)據(jù)只使用一次來創(chuàng)建模型,那么它處于批處理方法;在數(shù)據(jù)可用時合并新數(shù)據(jù)的回歸方法,屬于遞歸方法。
聚類方法在數(shù)據(jù)中發(fā)現(xiàn)自然分組,目標(biāo)識別是聚類方法的一個應(yīng)用。例如,如果想識別圖像中的汽車,那么就去查找圖像中屬于汽車部分的關(guān)聯(lián)數(shù)據(jù),雖然汽車具有不同的形狀和尺寸,但他們?nèi)匀挥性S多共同的特征。
工具箱具有許多功能來支持這些應(yīng)用領(lǐng)域。
用戶手冊(User's Guide)
該手冊內(nèi)容豐富,共8046頁,2016年。
分類算法可以將一個分類應(yīng)變量建模為一個或多個預(yù)測元的函數(shù)。工具箱提供了涵蓋多種參數(shù)化和非參數(shù)化分類算法的應(yīng)用程序和函數(shù),如:
邏輯回歸;
促進(jìn)式和袋裝決策樹;
樸素貝葉斯分類;
K-最近鄰(kNN)分類;
判別分析(線性和二次變量);
支持向量機(jī)(SVM);
回歸方法可將一個連續(xù)應(yīng)變量建模為一個或多個預(yù)測元的函數(shù)。工具箱提供各種回歸算法,包括線性回歸、廣義線性模型、非線性回歸和混合效應(yīng)模型。
線性回歸是一種用于描述作為一個或多個預(yù)測元變量的連續(xù)應(yīng)變量的統(tǒng)計建模技術(shù)。它有助于您理解和預(yù)測復(fù)雜系統(tǒng)的行為,或者分析實驗、金融和生物數(shù)據(jù)。
非線性回歸是一種有助于描述實驗數(shù)據(jù)中非線性關(guān)系的統(tǒng)計建模技術(shù)。通常將非線性回歸模型假設(shè)為參數(shù)模型,將該模型稱為非線性方程。工具箱還提供強(qiáng)大的非線性擬合,用于處理數(shù)據(jù)中的異常值。
工具箱提供包括用于執(zhí)行聚類分析的算法,通過根據(jù)相似度測量對數(shù)據(jù)分組來發(fā)現(xiàn)數(shù)據(jù)集中的規(guī)律??捎玫乃惴ò?k-均值、k-中心點、分層聚類、高斯混合模型和隱馬爾可夫模型。當(dāng)不知道聚類的數(shù)量時,可以使用聚類評估技術(shù)根據(jù)特定指標(biāo)確定數(shù)據(jù)中存在的聚類數(shù)量。
進(jìn)入《成長助推》公眾號,給后臺發(fā)送關(guān)鍵詞“機(jī)器學(xué)習(xí)”即可,自動回復(fù)已備好。
聯(lián)系客服