簡(jiǎn)介
隨著互聯(lián)網(wǎng)和移動(dòng)智能設(shè)備的快速普及,人和物可以隨時(shí)隨地接入互聯(lián)網(wǎng),再互聯(lián)網(wǎng)上產(chǎn)生海量的數(shù)據(jù),這些數(shù)據(jù)隱藏著巨大的商業(yè)價(jià)值,這些數(shù)據(jù)的收集與采集,隱藏價(jià)值的挖掘都存在巨大的困難。但是大數(shù)據(jù)所隱藏的價(jià)值遠(yuǎn)遠(yuǎn)大于它所帶來(lái)的困難,因此,近些年大數(shù)據(jù)如火如荼的發(fā)展,成為企業(yè)掌握市場(chǎng)脈搏、增加企業(yè)銷售額的法寶,現(xiàn)實(shí)已經(jīng)證明對(duì)大數(shù)據(jù)投入大的企業(yè)都獲得了巨大的成功,如Google、阿里巴巴等。本課程結(jié)合物流與供應(yīng)鏈管理等業(yè)務(wù),采用以課堂講解、演示、案例分析為主,輔以互動(dòng)研討、現(xiàn)場(chǎng)答疑、學(xué)以致用。的培訓(xùn)方式,分析大數(shù)據(jù)的應(yīng)用案例,實(shí)現(xiàn)企業(yè)的精細(xì)化管理、倉(cāng)儲(chǔ)的精準(zhǔn)預(yù)測(cè)、物流信息的快速處理、供應(yīng)鏈的低成本調(diào)配。
目標(biāo)
1、全面介紹大數(shù)據(jù)體系,使學(xué)員初步了解大數(shù)據(jù)有什么?能做什么?不能做什么?
2、大數(shù)據(jù)與普通數(shù)據(jù)的區(qū)別;
3、結(jié)合物流、供應(yīng)鏈講解大數(shù)據(jù)的應(yīng)用案例;
4、依據(jù)物流、供應(yīng)鏈業(yè)務(wù),分析大數(shù)據(jù)使用場(chǎng)景以及技術(shù)點(diǎn),包括倉(cāng)儲(chǔ)預(yù)測(cè)、物流到達(dá)時(shí)間、使用的技術(shù)、算法等;
5、海量數(shù)據(jù)的采集、存儲(chǔ)、計(jì)算采用的技術(shù)架構(gòu)和對(duì)應(yīng)的使用場(chǎng)景;
課程時(shí)長(zhǎng)
2天(12H)
受眾人群
1、對(duì)大數(shù)據(jù)、分布式存儲(chǔ)、分析等感興趣的朋友;
2、大型網(wǎng)站、電商網(wǎng)站等運(yùn)維人員;
3、云計(jì)算、大數(shù)據(jù)從業(yè)者;
4、系統(tǒng)架構(gòu)師、系統(tǒng)分析師、高級(jí)程序員、資深開發(fā)人員;
5、牽涉到大數(shù)據(jù)處理的數(shù)據(jù)中心運(yùn)行、規(guī)劃、設(shè)計(jì)負(fù)責(zé)人;
6、政府機(jī)關(guān),金融保險(xiǎn)、移動(dòng)互聯(lián)網(wǎng)、能源行業(yè)等人工智能相關(guān)人員;
7、高校、科研院所統(tǒng)計(jì)分析研究員,涉及到人工智能的人員;
8、政府機(jī)關(guān),金融保險(xiǎn)、移動(dòng)互聯(lián)網(wǎng)等大數(shù)據(jù)單位的負(fù)責(zé)人;
9、高校、科研院所大數(shù)據(jù)研究人員,涉及到大數(shù)據(jù)與分布式數(shù)據(jù)處理的人員;
10、數(shù)據(jù)倉(cāng)庫(kù)管理人員、建模人員,分析和開發(fā)人員、系統(tǒng)管理人員、數(shù)據(jù)庫(kù)管理人員以及對(duì)數(shù)據(jù)倉(cāng)庫(kù)感興趣的其他人員;
分享提綱
時(shí)間主題內(nèi)容
第一天第1個(gè)主題: 大數(shù)據(jù)基礎(chǔ)知識(shí)(深入理解大數(shù)據(jù)基本概念)(90分鐘)1、 什么是大數(shù)據(jù)
2、 大數(shù)據(jù)的特征
3、 大數(shù)據(jù)應(yīng)用現(xiàn)狀
4、 大數(shù)據(jù)發(fā)展趨勢(shì)
5、 大數(shù)據(jù)生態(tài)體系介紹
6、 大數(shù)據(jù)優(yōu)勢(shì)
7、 大數(shù)據(jù)的核心技術(shù)
8、 Hadoop是大數(shù)據(jù)架構(gòu)的事實(shí)標(biāo)準(zhǔn)
9、 什么是Hadoop
10、 Hadoop由來(lái)介紹
11、 Google四篇論文的剖析
a) GFS、MapReduce、BigTable、Chubby
12、 Hadoop的四大核心組件
13、 Hadoop相關(guān)概念
a) 塊、副本
14、 大數(shù)據(jù)能什么?不能什么?
15、 大數(shù)據(jù)與普通數(shù)據(jù)的區(qū)別
16、 案例分享:大數(shù)據(jù)與供應(yīng)商剖析
17、 案例分享:大數(shù)據(jù)與成本投入的關(guān)系剖析
18、 案例分享:大數(shù)據(jù)與云計(jì)算之間的關(guān)系剖析
19、 案例分享:大數(shù)據(jù)與虛擬化之間的關(guān)系剖析
20、 案例剖析:Hadoop與RAID之間的關(guān)系
21、 案例分享:基于共享存儲(chǔ)的Hadoop集群部署案例分享
第2個(gè)主題: 大數(shù)據(jù)的核心技術(shù)(介紹大數(shù)據(jù)包括的核心技術(shù),并剖析如何做大數(shù)據(jù)能成功,如何做是失敗的)(60分鐘)1、 大數(shù)據(jù)的數(shù)據(jù)中心
2、 大數(shù)據(jù)基礎(chǔ)設(shè)施
3、 海量的數(shù)據(jù)
4、 分布式技術(shù)
5、 數(shù)據(jù)挖掘算法
6、 創(chuàng)新應(yīng)用
7、 行業(yè)知識(shí)
8、 實(shí)例分享:馬云預(yù)測(cè)經(jīng)濟(jì)危機(jī)案例剖析
第3個(gè)主題: 數(shù)據(jù)挖掘基礎(chǔ)(介紹數(shù)據(jù)挖掘基礎(chǔ)知識(shí))(60分鐘)1、 數(shù)據(jù)挖掘的基本任務(wù)
2、 數(shù)據(jù)挖掘建模過(guò)程
a) 定義挖掘目標(biāo)
b) 數(shù)據(jù)取樣
c) 數(shù)據(jù)探索
d) 數(shù)據(jù)預(yù)處理
e) 數(shù)據(jù)質(zhì)量與元數(shù)據(jù)管理
f) 挖掘建模
g) 模型評(píng)價(jià)
3、 實(shí)例分享:大型企業(yè)數(shù)據(jù)挖掘存在的問(wèn)題剖析
第4個(gè)主題: 物流倉(cāng)庫(kù)選址大數(shù)據(jù)應(yīng)用(剖析物流中倉(cāng)庫(kù)選址)(60分鐘)1、 倉(cāng)庫(kù)選址的重要性剖析
2、 節(jié)約成本
3、 提升服務(wù)質(zhì)量與效率
4、 收集客戶地址數(shù)據(jù)
5、 倉(cāng)庫(kù)選址建模
6、 地址數(shù)據(jù)轉(zhuǎn)化為經(jīng)緯度
7、 數(shù)據(jù)探知
8、 聚類客戶群體
9、 選址方案
10、 選址方案優(yōu)化
11、 數(shù)據(jù)可視化
12、 案例分享:物流行業(yè)倉(cāng)庫(kù)選址
第5個(gè)主題: 大數(shù)據(jù)實(shí)現(xiàn)倉(cāng)儲(chǔ)精準(zhǔn)預(yù)測(cè)(介紹大數(shù)據(jù)在倉(cāng)儲(chǔ)管理中的應(yīng)用案例)(60分鐘)1、 精準(zhǔn)倉(cāng)儲(chǔ)的價(jià)值剖析
2、 避免倉(cāng)儲(chǔ)貨物積壓
3、 避免缺貨
4、 提升服務(wù)質(zhì)量與效率
5、 數(shù)據(jù)收集與清洗
6、 倉(cāng)庫(kù)覆蓋范圍聚類
7、 回歸分析銷售趨勢(shì)
8、 預(yù)測(cè)客戶將來(lái)購(gòu)買需求
9、 倉(cāng)儲(chǔ)精準(zhǔn)配貨方案
10、 案例分享:京東物流倉(cāng)儲(chǔ)預(yù)測(cè)
第二天第6個(gè)主題: 大數(shù)據(jù)實(shí)現(xiàn)物流運(yùn)輸?shù)竭_(dá)時(shí)間精準(zhǔn)預(yù)測(cè)(剖析大數(shù)據(jù)實(shí)現(xiàn)物流運(yùn)輸?shù)竭_(dá)時(shí)間精準(zhǔn)預(yù)測(cè))(60分鐘)1、 物流運(yùn)輸?shù)竭_(dá)時(shí)間問(wèn)題分析
2、 不可控因素分析
3、 到達(dá)時(shí)間對(duì)客戶的重要性
4、 提升服務(wù)質(zhì)量與效率
5、 數(shù)據(jù)的收集與清洗、轉(zhuǎn)換
6、 數(shù)據(jù)探知與模型選擇
7、 回歸分析與建模
8、 模型實(shí)施與預(yù)測(cè)
第7個(gè)主題: 大數(shù)據(jù)實(shí)現(xiàn)供應(yīng)鏈管理與優(yōu)化(介紹大數(shù)據(jù)實(shí)現(xiàn)供應(yīng)鏈管理與優(yōu)化)(60分鐘)1、 供應(yīng)鏈管理的重要性剖析
2、 節(jié)約成本
3、 提升服務(wù)質(zhì)量與效率
4、 數(shù)據(jù)的收集與清洗、轉(zhuǎn)換
5、 數(shù)據(jù)探知與模型選擇
6、 決策樹與建模
7、 模型訓(xùn)練
8、 模型實(shí)施與預(yù)測(cè)
第8個(gè)主題: 機(jī)器學(xué)習(xí)算法介紹(典型的大數(shù)據(jù)機(jī)器學(xué)習(xí)算法介紹)(60分鐘)1、 監(jiān)督式學(xué)習(xí)
2、 非監(jiān)督式學(xué)習(xí)
3、 半監(jiān)督式學(xué)習(xí)
4、 回歸(預(yù)測(cè))與分類
5、 決策樹與隨機(jī)森林
6、 聚類分析
7、 關(guān)聯(lián)規(guī)則
8、 協(xié)同過(guò)濾算法解析
9、 關(guān)聯(lián)規(guī)則算法
10、 人工智能
11、 神經(jīng)網(wǎng)絡(luò)
12、 深度學(xué)習(xí)
第9個(gè)主題: 海量數(shù)據(jù)的采集、存儲(chǔ)、計(jì)算采用的分布式技術(shù)架構(gòu)和對(duì)應(yīng)的使用場(chǎng)景(海量數(shù)據(jù)的采集、存儲(chǔ)、計(jì)算采用的分布式技術(shù)架構(gòu)和對(duì)應(yīng)的使用場(chǎng)景)(60分鐘)1、 海量數(shù)據(jù)特征剖析
2、 海量數(shù)據(jù)采集
3、 海量數(shù)據(jù)存儲(chǔ)
4、 實(shí)時(shí)流式數(shù)據(jù)采集
5、 網(wǎng)絡(luò)數(shù)據(jù)爬取
6、 HDFS分布式文件系統(tǒng)
7、 HDFS架構(gòu)剖析
8、 磁盤順序讀寫優(yōu)化
9、 MapReduce分布式批處理計(jì)算框架
10、 MapReduce的使用場(chǎng)景
11、 Spark分布式內(nèi)存計(jì)算框架
12、 Spark的使用場(chǎng)景
13、 Storm分布式實(shí)時(shí)計(jì)算框架
14、 Storm的使用場(chǎng)景
第10個(gè)主題: 大數(shù)據(jù)推薦實(shí)戰(zhàn)(深入理解大數(shù)據(jù)推薦技術(shù)以及推薦技術(shù)編程)(60分鐘)1、 個(gè)性化推薦的理論依據(jù)
2、 個(gè)性化推薦的價(jià)值
3、 個(gè)性化推薦能達(dá)到的目的
4、 個(gè)性化推薦的原則
5、 個(gè)性化推薦技術(shù)發(fā)展史
6、 個(gè)性化推薦的相關(guān)技術(shù)
7、 協(xié)同過(guò)濾
8、 顯式與隱式反饋
9、 正則化參數(shù)的尺度
10、 基于用戶的常用推薦算法
a) 歐幾里德距離(Euclidean Distance)
b) 皮爾遜相關(guān)系數(shù)(Pearson Correlation Coefficient)
c) Cosine 相似度(Cosine Similarity)
d) Tanimoto 系數(shù)(Tanimoto Coefficient)
11、 基于用戶的協(xié)同過(guò)濾推薦
第11個(gè)主題: 大數(shù)據(jù)物流及供應(yīng)鏈管理課堂實(shí)戰(zhàn)演練(使學(xué)員深入理解大數(shù)據(jù)的應(yīng)用)(120分鐘)1、 學(xué)員分組、選擇課題
2、 數(shù)據(jù)收集與整理
3、 大數(shù)據(jù)應(yīng)用思路
4、 算法使用等
5、 講師點(diǎn)評(píng)與指導(dǎo)