編輯推薦
《數據倉庫與數據挖掘實踐》力求繁中取簡,讓讀者易學易懂:信息係統安全等級保護標準比較多,覆蓋瞭等級保護的各個階段,並且對每個保護等級都做瞭詳細的規定和描述,閱讀起來難免有些眼花繚亂,不易理解和掌握。本書對相關標準進行瞭梳理,主要以第三級係統安全保護為主綫來介紹等級保護的原理和方法,為進一步掌握和運用相關標準打下良好的基礎。
內容簡介
《數據倉庫與數據挖掘實踐》係統地介紹瞭數據倉庫和數據挖掘技術,全本由兩部分組成,第1章到第3章介紹數據倉庫的基本概念和相關技術,第4章到第11章介紹數據挖掘的基本概念和各種算法,包括數據倉庫構建、OLAP技術、分類方法、聚類方法、關聯分析、序列模式挖掘方法、迴歸和時序分析、粗糙集理論、文本挖掘、Web挖掘和空間數據挖掘方法等。
《數據倉庫與數據挖掘實踐》既注重原理,又注重實踐,配有大量圖錶、示例和練習題,內容豐富,概念講解清楚,錶達嚴謹,邏輯性強,語言精練,可讀性好。
《數據倉庫與數據挖掘實踐》既便於教師課堂講授,又便於自學者閱讀。適閤作為高等院校高年級學生和研究生“數據倉庫和數據挖掘”或“數據挖掘算法”課程的教材。
作者簡介
李春葆,武漢大學計算機學院教授,主持和參加3S係統集成關鍵技術的研究(國傢自然科學基金重點科技攻關項目,49631050)、城市地理信息係統標準規範的研究(國傢測繪局項目)、伊藤算法及其在動態仿真優化中的理論研究(60873114/F020102)、湖北省財政廳三查管理信息係統、湖北省財政廳外匯管理信息係統、湖北省財政廳財政監督管理信息係統、武漢英華ERP係統等項目。
內頁插圖
目錄
第1章 數據倉庫概述
1.1 數據倉庫及其曆史
1.1.1 數據庫技術的發展
1.1.2 什麼是數據倉庫
1.2 數據倉庫係統及其開發工具
1.2.1 數據倉庫係統的組成
1.2.2 ETL
1.2.3 數據倉庫和數據集市的關係
1.2.4 元數據及其管理
1.3 數據倉庫係統開發工具
1.4 數據倉庫與操作型數據庫的關係
1.4.1 從數據庫到數據倉庫
1.4.2 數據倉庫為什麼是分離的
1.4.3 數據倉庫與操作型數據庫的對比
1.4.4 ODS
1.5 商務智能與數據倉庫的關係
練習題1
思考題1
第2章 數據倉庫設計
2.1 數據倉庫設計概述
2.1.1 數據倉庫設計原則
2.1.2 數據倉庫構建模式
2.1.3 數據倉庫設計步驟
2.2 數據倉庫的規劃和需求分析
2.2.1 數據倉庫的規劃
2.2.2 數據倉庫的需求分析
2.3 數據倉庫的建模
2.3.1 多維數據模型及相關概念
2.3.2 多維數據模型的實現
2.3.3 數據倉庫建模的主要工作
2.3.4 幾種常見的基於關係數據庫的多維數據模型
2.4 數據倉庫的物理模型設計
2.4.1 確定數據的存儲結構
2.4.2 確定索引策略
2.4.3 確定存儲分配
2.5 數據倉庫的部署和維護
2.5.1 數據倉庫的部署
2.5.2 數據倉庫的維護
2.6 一個簡單的數據倉庫SDWS設計示例
2.6.1 SDWS的需求分析
2.6.2 SDWS的建模
2.6.3 基於SQLServer2008設計SDWS
練習題2
思考題2
第3章 OLAP技術
3.1 OLAP概述
3.1.1 什麼是OLAP
3.1.2 OLAP技術的特性
3.1.3 OLAP和OLTP的區彆
3.1.4 數據倉庫與OLAP的關係
3.1.5 OLAP分類
3.2 OLAP的多維數據模型
3.2.1 多維數據模型的定義
3.2.2 OLAP的基本分析操作
3.2.3 一個簡單的多維數據模型
3.3 OLAP實現
3.3.1 數據立方體的有效計算
3.3.2 索引OLAP數據
3.3.3 OLAP查詢的有效處理
練習題3
思考題3
第4章 數據挖掘概述
4.1 什麼是數據挖掘
4.1.1 數據挖掘的定義
4.1.2 數據挖掘的知識錶示
4.1.3 數據挖掘的主要任務
4.1.4 數據挖掘的發展
4.1.5 數據挖掘的對象
4.1.6 數據挖掘的分類
4.1.7 數據挖掘與數據倉庫及OLAP的關係
4.1.8 數據挖掘的應用
4.2 數據挖掘係統
4.2.1 數據挖掘係統的結構
4.2.2 數據挖掘係統的設計
4.2.3 常用的數據挖掘係統及其發展
4.3 數據挖掘過程
4.3.1 數據挖掘步驟
4.3.2 數據清理
4.3.3 數據集成
4.3.4 數據變換
4.3.5 數據歸約
4.3.6 離散化和概念分層生成
4.3.7 數據挖掘的算法
4.4 數據挖掘的未來展望
練習題4
思考題4
第5章 關聯分析
5.1 關聯分析的概念
5.1.1 事務數據庫
5.1.2 關聯規則及其度量
5.1.3 頻繁項集
5.1.4 挖掘關聯規則的基本過程
5.2 Apriori算法
5.2.1 Apriori性質
5.2.2 Apriori算法
5.2.3 由頻繁項集産生關聯規則
5.2.4 提高Apriori算法的有效性
5.2.5 非二元屬性的關聯規則挖掘
5.3 頻繁項集的緊湊錶示
5.3.1 最大頻繁項集
5.3.2 頻繁閉項集
5.4 FP-growth算法
5.4.1 FP-growth算法框架
5.4.2 FP樹構造
5.4.3 由FP樹産生頻繁項集
5.5 多層關聯規則的挖掘
5.5.1 多層關聯規則的挖掘概述
5.5.2 多層關聯規則的挖掘算法
5.5.3 多維關聯規則
5.6 其他類型的關聯規則
5.6.1 基於約束的關聯規則
5.6.2 負關聯規則
5.7 SQLServer挖掘關聯規則的示例
5.7.1 建立DM數據庫
5.7.2 建立關聯挖掘項目
5.7.3 部署關聯挖掘項目並瀏覽結果
練習題5
思考題5
第6章 序列模式挖掘
6.1 序列模式挖掘概述
6.1.1 序列數據庫
6.1.2 序列模式挖掘算法
6.2 Apriori類算法
6.2.1 AprioriAll算法
6.2.2 AprioriSome算法
6.2.3 DynamicSome算法
6.2.4 GSP算法
6.2.5 SPADE算法
6.3 模式增長框架的序列挖掘算法
6.3.1 FreeSpan算法
6.3.2 PrefixSpan算法
練習題6
思考題6
第7章 分類方法
7.1 分類過程
7.1.1 學習階段
7.1.2 分類階段
7.2 k-最鄰近分類算法
7.3 決策樹分類算法
7.3.1 決策樹
7.3.2 建立決策樹的ID3算法
7.3.3 建立決策樹的C4.5 算法
7.4 貝葉斯分類算法
7.4.1 貝葉斯分類概述
7.4.2 樸素貝葉斯分類
7.4.3 樹增強樸素貝葉斯分類
7.5 神經網絡算法
7.5.1 生物神經元和人工神經元
7.5.2 人工神經網絡
7.5.3 前饋神經網絡用於分類
7.5.4 SQLServer中神經網絡分類示例
7.6 支持嚮量機
7.6.1 綫性可分時的二元分類問題
7.6.2 綫性不可分時的二元分類問題
練習題7
思考題7
第8章 迴歸分析和時序挖掘
8.1 綫性和非綫性迴歸分析
8.1.1 一元綫性迴歸分析
8.1.2 多元綫性迴歸分析
8.1.3 非綫性迴歸分析
8.2 邏輯迴歸分析
8.2.1 邏輯迴歸原理
8.2.2 邏輯迴歸模型
8.2.3 SQL Server中邏輯迴歸分析示例
8.3 時序分析模型
8.3.1 時序分析概述
8.3.2 時序預測的常用方法
8.3.3 迴歸分析與時序分析的關係
8.3.4 確定性時序模型
8.3.5 隨機時序模型
8.3.6 SQL Server建立隨機時序模型示例
8.4 時序的相似性搜索
8.4.1 相似性搜索的概念
8.4.2 完全匹配
8.4.3 基於離散傅裏葉變換的子序列匹配
8.4.4 基於規範變換的子序列匹配
練習題8
思考題8
第9章 粗糙集理論
9.1 粗糙集理論概述
9.1.1 粗糙集理論的産生
9.1.2 粗糙集理論的特點
9.1.3 粗糙集理論在數據挖掘中的應用
9.2 粗糙集理論中的基本概念
9.2.1 集閤的基本概念
9.2.2 信息係統和粗糙集
9.2.3 分類的近似度量
9.3 信息係統的屬性約簡
9.3.1 約簡和核
9.3.2 分辨矩陣求核
9.4 決策錶及其屬性約簡
9.4.1 決策錶及相關概念
9.4.2 決策錶的屬性約簡算法
9.5 決策錶的值約簡及其算法
9.5.1 決策規則及其簡化
9.5.2 決策規則的極小化
9.6 粗糙集在數據挖掘中的應用示例
練習題9
思考題9
第10章 聚類方法
10.1 聚類概述
10.1.1 什麼是聚類
10.1.2 相似性測度
10.1.3 聚類過程
10.1.4 聚類算法的評價
10.1.5 聚類方法的分類
10.1.6 聚類分析在數據挖掘中的應用
10.1.7 聚類算法的要求
10.2 基於劃分的聚類算法
10.2.1 k-均值算法
10.2.2 k-中心點算法
10.3 基於層次的聚類算法
10.3.1 層次聚類算法概述
10.3.2 DIANA算法和AGNES算法
10.3.3 BIRCH算法
10.3.4 CURE算法
10.3.5 ROCK算法
10.3.6 Chameleon算法
10.4 基於密度的聚類算法
10.4.1 DBSCAN算法
10.4.2 OPTICS算法
10.5 基於網格的聚類算法
10.5.1 STING算法
10.5.2 Wave Cluster算法
10.5.3 CLIQUE算法
10.6 基於模型的聚類算法
10.6.1 EM算法
10.6.2 COBWEB算法
10.7 離群點分析
10.7.1 離群點概述
10.7.2 常見的離群點檢測方法
練習題10
思考題10
第11章 其他挖掘方法
11.1 文本挖掘
11.1.1 文本挖掘概述
11.1.2 數據預處理技術
11.1.3 文本結構分析
11.1.4 文本分類
11.1.5 文本聚類
11.1.6 文本摘要
11.1.7 文本關聯分析
11.2 Web挖掘
11.2.1 Web挖掘概述
11.2.2 Web結構挖掘
11.2.3 Web內容挖掘
11.2.4 Web使用挖掘
11.2.5 Web挖掘的發展方嚮
11.3 空間數據挖掘
11.3.1 空間數據概述
11.3.2 空間數據立方體和空間OLAP
11.3.3 空間數據挖掘方法
練習題11
思考題11
附錄A常用的優化方法
參考文獻
前言/序言
數據倉庫與數據挖掘實踐 [Data Warehouse and Data Mining Practice and Application] 下載 mobi epub pdf txt 電子書 格式
數據倉庫與數據挖掘實踐 [Data Warehouse and Data Mining Practice and Application] 下載 mobi pdf epub txt 電子書 格式 2024
評分
☆☆☆☆☆
快遞非常給力,書質量不錯。包裝沒以前好瞭,沒看到發票。可能過年忙導緻的吧
評分
☆☆☆☆☆
很不錯,是正品,比彆的地方價格都好
評分
☆☆☆☆☆
作為教材參考書使用的,感覺還行吧,印刷不錯
評分
☆☆☆☆☆
很好的書 好好看
評分
☆☆☆☆☆
理論太強
評分
☆☆☆☆☆
公司的技術部門需要使用,購買學習,應該不錯。
評分
☆☆☆☆☆
滿意、滿意、滿意、滿意、
評分
☆☆☆☆☆
很不錯? 講解的很清楚 適閤數據挖掘入門的朋友看
評分
☆☆☆☆☆
《數據倉庫與數據挖掘實踐》力求繁中取簡,讓讀者易學易懂:信息係統安全等級保護標準比較多,覆蓋瞭等級保護的各個階段,並且對每個保護等級都做瞭詳細的規定和描述,閱讀起來難免有些眼花繚亂,不易理解和掌握。本書對相關標準進行瞭梳理,主要以第三級係統安全保護為主綫來介紹等級保護的原理和方法,為進一步掌握和運用相關標準打下良好的基礎。
數據倉庫與數據挖掘實踐 [Data Warehouse and Data Mining Practice and Application] mobi epub pdf txt 電子書 格式下載 2024