內(nèi)容簡介:
本書以SQL Server分析服務(wù)為環(huán)境介紹數(shù)據(jù)倉庫和數(shù)據(jù)挖掘應(yīng)用技術(shù),包括數(shù)據(jù)倉庫和數(shù)據(jù)挖掘概述、OLAP和多維數(shù)據(jù)模型、數(shù)據(jù)倉庫設(shè)計和SQL Server數(shù)據(jù)倉庫開發(fā)實例、關(guān)聯(lián)分析算法、決策樹分類算法、貝葉斯分類算法、神經(jīng)網(wǎng)絡(luò)算法、回歸分析算法、時間序列分析和聚類算法。
本書內(nèi)容翔實,循序漸進地介紹各個知識點,并提供全面而豐富的教學(xué)資源,可作為各類高等院校計算機及相關(guān)專業(yè)“數(shù)據(jù)倉庫和數(shù)據(jù)挖掘應(yīng)用技術(shù)”和“SQL Server高級應(yīng)用”課程的教學(xué)用書,也適合計算機應(yīng)用人員和計算機愛好者參考。
目錄:
第1章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘概述
1.1數(shù)據(jù)倉庫概述
1.1.1數(shù)據(jù)倉庫的定義
1.1.2數(shù)據(jù)倉庫與操作型數(shù)據(jù)庫的關(guān)系
1.1.3數(shù)據(jù)倉庫的應(yīng)用
1.2數(shù)據(jù)倉庫系統(tǒng)及開發(fā)工具
1.2.1數(shù)據(jù)倉庫系統(tǒng)的組成
1.2.2數(shù)據(jù)倉庫系統(tǒng)開發(fā)工具
1.3商業(yè)智能和數(shù)據(jù)倉庫
1.3.1什么是商業(yè)智能
1.3.2商業(yè)智能和數(shù)據(jù)倉庫的關(guān)系
1.4數(shù)據(jù)挖掘概述
1.4.1數(shù)據(jù)挖掘的定義
1.4.2數(shù)據(jù)挖掘的主要任務(wù)
1.4.3數(shù)據(jù)挖掘的對象
1.4.4數(shù)據(jù)挖掘的知識表示
1.4.5數(shù)據(jù)挖掘與數(shù)據(jù)倉庫及OLAP的關(guān)系
1.4.6數(shù)據(jù)挖掘的應(yīng)用
1.5數(shù)據(jù)挖掘過程
1.5.1數(shù)據(jù)挖掘步驟
1.5.2數(shù)據(jù)清理
1.5.3數(shù)據(jù)集成
1.5.4數(shù)據(jù)變換
1.5.5數(shù)據(jù)歸約
1.5.6離散化和概念分層生成
1.5.7數(shù)據(jù)挖掘的算法
練習(xí)題
第2章OLAP和多維數(shù)據(jù)模型
2.1OLAP概述
2.1.1什么是OLAP
2.1.2OLAP和OLTP的區(qū)別
2.1.3數(shù)據(jù)倉庫與OLAP的關(guān)系
2.2多維數(shù)據(jù)模型
2.2.1多維數(shù)據(jù)模型的相關(guān)概念
2.2.2OLAP的基本分析操作
2.2.3多維數(shù)據(jù)模型的實現(xiàn)途徑
2.3數(shù)據(jù)倉庫的維度建模
2.3.1數(shù)據(jù)倉庫建模概述
2.3.2星形模型
2.3.3雪花模型
2.3.4事實星座模型
練習(xí)題
第3章數(shù)據(jù)倉庫設(shè)計
3.1數(shù)據(jù)倉庫設(shè)計概述
3.1.1數(shù)據(jù)倉庫設(shè)計原則
3.1.2建立數(shù)據(jù)倉庫系統(tǒng)的兩種模式
3.1.3數(shù)據(jù)倉庫設(shè)計過程
3.2數(shù)據(jù)倉庫規(guī)劃與需求分析
3.2.1數(shù)據(jù)倉庫規(guī)劃
3.2.2數(shù)據(jù)倉庫需求分析
3.3數(shù)據(jù)倉庫建模
3.3.1數(shù)據(jù)倉庫建模的主要工作
3.3.2維表設(shè)計
3.3.3事實表設(shè)計
3.4數(shù)據(jù)倉庫物理模型設(shè)計
3.4.1確定數(shù)據(jù)的存儲結(jié)構(gòu)
3.4.2確定索引策略
3.4.3確定存儲分配
3.5數(shù)據(jù)倉庫部署與維護
3.5.1數(shù)據(jù)倉庫的部署
3.5.2數(shù)據(jù)倉庫的維護
練習(xí)題
第4章SQLServer數(shù)據(jù)倉庫開發(fā)實例
4.1OnRetDW系統(tǒng)需求分析
4.1.1OnRetDW系統(tǒng)的主題
4.1.2OnRetDW系統(tǒng)的功能
4.2OnRetDW的建模
4.2.1維表設(shè)計
4.2.2事實表設(shè)計
4.3數(shù)據(jù)抽取工具設(shè)計
4.4基于SQL Server 2012設(shè)計OnRetDW
4.4.1創(chuàng)建數(shù)據(jù)倉庫OnRetDW項目
4.4.2創(chuàng)建數(shù)據(jù)源
4.4.3創(chuàng)建數(shù)據(jù)源視圖
4.4.4創(chuàng)建維表
4.4.5創(chuàng)建多維數(shù)據(jù)集
4.4.6部署SDWS
4.4.7瀏覽已部署的多維數(shù)據(jù)集
4.5MDX簡介*
4.5.1MDX語言概述
4.5.2執(zhí)行MDX查詢
4.5.3多維數(shù)據(jù)查詢
練習(xí)題
上機實驗題
第5章關(guān)聯(lián)分析算法
5.1關(guān)聯(lián)分析概述
5.1.1什么是關(guān)聯(lián)分析
5.1.2事務(wù)數(shù)據(jù)庫
5.1.3關(guān)聯(lián)規(guī)則及其度量
5.1.4頻繁項集
5.1.5挖掘關(guān)聯(lián)規(guī)則的基本過程
5.2Apriori算法
5.2.1Apriori性質(zhì)
5.2.2Apriori算法求頻繁項集
5.2.3由頻繁項集產(chǎn)生強關(guān)聯(lián)規(guī)則
5.3SQL Server挖掘關(guān)聯(lián)規(guī)則
5.3.1創(chuàng)建DMK數(shù)據(jù)庫
5.3.2建立關(guān)聯(lián)挖掘項目
5.3.3部署關(guān)聯(lián)挖掘項目并瀏覽結(jié)果
5.4電子商務(wù)數(shù)據(jù)的關(guān)聯(lián)規(guī)則挖掘
5.4.1創(chuàng)建OnRetDMK數(shù)據(jù)庫
5.4.2數(shù)據(jù)加載功能設(shè)計
5.4.3建立關(guān)聯(lián)挖掘項目
5.4.4部署關(guān)聯(lián)挖掘項目并瀏覽結(jié)果
練習(xí)題
上機實驗題
第6章決策樹分類算法
6.1分類過程
6.1.1分類概述
6.1.2分類過程的學(xué)習(xí)階段
6.1.3分類過程的分類階段
6.2決策樹分類
6.2.1決策樹
6.2.2建立決策樹的ID3算法
6.3SQL Server決策樹分類
6.3.1建立數(shù)據(jù)表
6.3.2建立決策樹分類挖掘模型
6.3.3瀏覽決策樹模型和分類預(yù)測
6.4電子商務(wù)數(shù)據(jù)的決策樹分類
6.4.1創(chuàng)建OnRetDMK.DST數(shù)據(jù)表
6.4.2數(shù)據(jù)加載功能設(shè)計
6.4.3建立決策樹分類模型
6.4.4瀏覽決策樹
練習(xí)題
上機實驗題
第7章貝葉斯分類算法
7.1貝葉斯分類概述
7.1.1貝葉斯定理
7.1.2貝葉斯信念網(wǎng)絡(luò)
7.2樸素貝葉斯分類
7.2.1樸素貝葉斯分類原理
7.2.2樸素貝葉斯分類算法
7.3SQL Server樸素貝葉斯分類
7.3.1建立樸素貝葉斯分類挖掘模型
7.3.2瀏覽樸素貝葉斯分類模型和分類預(yù)測
7.4電子商務(wù)數(shù)據(jù)的貝葉斯分類
7.4.1建立樸素貝葉斯分類挖掘模型
7.4.2瀏覽挖掘結(jié)果及分析
練習(xí)題
上機實驗題
第8章神經(jīng)網(wǎng)絡(luò)算法
8.1人工神經(jīng)網(wǎng)絡(luò)概述
8.1.1人工神經(jīng)元
8.1.2人工神經(jīng)網(wǎng)絡(luò)
8.1.3神經(jīng)網(wǎng)絡(luò)應(yīng)用
8.2用于分類的前饋神經(jīng)網(wǎng)絡(luò)
8.2.1前饋神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過程
8.2.2前饋神經(jīng)網(wǎng)絡(luò)用于分類的算法
8.3SQL Server神經(jīng)網(wǎng)絡(luò)分類
8.3.1建立神經(jīng)網(wǎng)絡(luò)分類挖掘模型
8.3.2瀏覽神經(jīng)網(wǎng)絡(luò)分類模型和分類預(yù)測
8.4電子商務(wù)數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)分類
8.4.1建立神經(jīng)網(wǎng)絡(luò)分類挖掘模型
8.4.2瀏覽挖掘結(jié)果及分析
練習(xí)題
上機實驗題
第9章回歸分析算法
9.1回歸分析概述
9.2線性回歸分析
9.2.1一元線性回歸分析
9.2.2多元線性回歸分析
9.2.3SQL Server線性回歸分析
9.3非線性回歸分析
9.3.1非線性回歸分析的處理方法
9.3.2可轉(zhuǎn)換成線性回歸的非線性回歸
9.3.3不可變換成線性回歸的非線性回歸分析*
9.4邏輯回歸分析
9.4.1邏輯回歸原理
9.4.2邏輯回歸模型
9.4.3SQL Server邏輯回歸分析
9.5電子商務(wù)數(shù)據(jù)的邏輯回歸分析
9.5.1建立邏輯回歸挖掘模型
9.5.2瀏覽挖掘結(jié)果及分析
練習(xí)題
上機實驗題
第10章時間序列分析
10.1時間序列分析概述
10.1.1什么是時間序列和時間序列分析
10.1.2時間序列的分類和平穩(wěn)性判斷
10.1.3時間序列建模的兩種基本假設(shè)
10.1.4回歸分析與時間序列分析
10.2確定性時間序列分析
10.2.1移動平均模型
10.2.2指數(shù)平滑模型
10.3隨機時間序列模型*
10.3.1隨機時間序列模型概述
10.3.2自回歸模型AR(p)
10.4SQL Server時間序列分析
10.4.1建立數(shù)據(jù)表
10.4.2建立時間序列分析模型
10.4.3瀏覽時間序列分析模型
10.5電子商務(wù)數(shù)據(jù)的時間序列分析
10.5.1創(chuàng)建OnRetDMK.TS數(shù)據(jù)表
10.5.2數(shù)據(jù)加載功能設(shè)計
10.5.3建立時間序列分析模型
10.5.4瀏覽時間序列分析模型
練習(xí)題
上機實驗題
第11章聚類算法
11.1聚類概述
11.1.1什么是聚類
11.1.2相似性度量
11.1.3聚類過程
11.1.4常見的聚類算法
11.1.5聚類分析的應(yīng)用
11.2k均值算法及其應(yīng)用
11.2.1k均值算法
11.2.2SQL Server的k均值算法應(yīng)用
11.3EM算法及其應(yīng)用
11.3.1EM算法
11.3.2SQL Server中EM算法
11.4電子商務(wù)數(shù)據(jù)的聚類分析
11.4.1建立聚類挖掘模型
11.4.2兩種算法結(jié)果的比較
11.5Microsoft順序分析和聚類分析算法*
11.5.1Microsoft順序分析和聚類分析算法概述
11.5.2Microsoft順序分析和聚類分析算法的應(yīng)用
練習(xí)題
上機實驗題
附錄A部分練習(xí)題參考答案
第1章
第2章
第3章
第4章
第5章
第6章
第7章
第8章
第9章
第10章
第11章
附錄B上機實驗題參考答案
第4章
第5章
第6章
第7章
第8章
第9章
第10章
第11章
附錄C書中數(shù)據(jù)庫和包含的數(shù)據(jù)表
1. OnRet數(shù)據(jù)庫
2. SDW數(shù)據(jù)庫
3. OnRetDMK數(shù)據(jù)庫
4. DMK數(shù)據(jù)庫
參考文獻(xiàn)
聯(lián)系客服