◆ ◆ ◆ ◆
小編之前有個同事,有一天突然宣布辭職,高薪跳槽到一家互聯網公司從事數據挖掘工作,驚得小編下巴都要掉了。小編第一次聽到數據挖掘,就像第一次讀到《鬼吹燈》盜墓小說那種神秘感。不過,數據挖掘可能沒那么高深,也沒那么不可觸摸。有了統計工具,再加上操作方法,你也能做數據挖掘。這不,這么一門課程來啦,想成為數據挖掘高手的你,趕緊行動吧。
如果你是傳統市場研究、社會統計領域中的初級從業(yè)者或者學生,或許會為這些問題感到困擾:
如何做研究設計;
如何設計數據收集方法;
收集回來的數據如何分析。
本次課程旨在數據挖掘流程、傳統常用挖掘算法的原理和軟件操作的培訓。以實際案例數據為基礎,講解如何從數據預處理、挑選合適算法,直到模型檢驗,形成可行的分析結論。
錢兵,中國電信北京研究院云計算與大數據研究經理,CDA 二級數學建模師。
工作經歷:從事數據分析和數據挖掘的工作近7年,從2010 年陸續(xù)通過網絡遠程語音和面授有上百次教學經驗。3年傳統市場研究經驗,2年大數據領域工作,主要覆蓋消費者購買路徑、商業(yè)地理洞察、廣告效果評估等研究。
數據分析領域相關獲獎經歷:第十三屆中國市場研究“寶潔論文獎”專業(yè)組一等獎、第十五屆、十一屆中國市場研究“寶潔論文獎”專業(yè)組三等獎、第八屆全國研究生數學建模競賽全國一等獎、第七屆全國研究生數學建模競賽全國二等獎、2008年中國大學生數學建模競賽全國二等獎、2007 年中國大學生數學建模競賽湖北省二等獎。
擅長軟件:SPSS、SAS、SPSSModeler、AMOS、Weka、ucinet、matlab、lingo、Tagxedo
1、無數理基礎,但有較強數據分析挖掘興趣的學生或從業(yè)人員;
2、有一定數理統計基礎的學生或從業(yè)人員。
第一講數據預處理及基礎挖掘算法1(1月21日上午9:30-12:30)
1. 字段選擇
2. 數據清洗
3. 字段擴充
4. 數據編碼
5. KNN 算法(KNearest Neighbors)
第二講基礎挖掘算法 2(1月21日下午14:30-17:30)
1. 訓練和測試樣本數據的選取
2. 進入模型的變量篩選
3. 決策樹(ID3、C5.0、CART、CHAID)
4. 回歸分析(線性、非線性、Logistic 回歸、時間序列分析)
第三講進階挖掘算法 1(1月22日上午9:30-12:30)
1. 關聯規(guī)則(支持度、信賴度、提升度及 Apriori算法)
2. 聚類分析(階層式聚類、分割式聚類)
3. 神經網絡
第四講進階挖掘算法2(1月22日下午14:30-17:30)
1. 支持向量機
2. 集成算法(Bagging、Boosting、Random Forest)
3. 模型評估(混亂矩陣(正確率、響應率、捕捉率、F-指標)、ROC 曲線、GINI 圖)
培訓形式:知深平臺直播
報名截止:2017年1月20日17:00
課程費用:426元/人
培訓時間:1月21日和1月22日
詳情請咨詢:學長微信(xueshuxuezhang)
1.學術中國研習營會員免費,單獨找學長(微信ID:xueshuxuezhang)報名;多說一句,研習營會員采用分批招募,招募時間會以公告的形式發(fā)布,請各位學友多多關注學術中國和知深平臺了解會員招募信息。
聯系客服