發表於2024-11-13
這是一本真正具備中國特色的數據挖掘手冊,各種常規方法一應俱全,作者是高校教授,同時也是若乾公司的數據挖掘顧問,難得的理論儲備與實踐經驗都十分深厚,錶達能力也很強,也瞭解痛點。基於這些背景創作的這本書,非常好。
大數據時代,我們需要對各種海量數據進行篩選、清洗、挖掘,在這個過程中,獲取有效數據的方式方法和模型算法成為瞭整個數據挖掘過程的重點,MATLAB作為一個數據挖掘工具,如何正確和準確地使用它成為瞭重中之重。
針對實際應用數據挖掘技術的要求,本書既介紹瞭數據挖掘的基礎理論和技術,又較為詳細地介紹瞭各種算法以及MATLAB程序。本書共分4篇,分彆介紹瞭數據挖掘的基本概念、技術與算法以及應用實例。期望通過大量的實例分析幫助廣大讀者掌握數據挖掘技術,並應用於實際的研究中,提高對海量數據信息的處理及挖掘能力。本書針對性和實用性強,具有較高的理論和實用價值。
本書作者就職於部隊高校,專攻數據挖掘,並應用於大量實際項目,本書同時得到瞭國內著名數據挖掘公司的技術支持,很多案例來自實際項目。
本書可作為高等院校計算機工程、信息工程、生物醫學工程、化學、環境、經濟、管理等學科的研究生、本科生的教材或教學參考書,亦可作為企事業單位管理者、信息分析人員、市場營銷人員和研究與開發人員的參考資料。
第1章 緒論 1
1.1 數據挖掘概述 2
1.2 數據挖掘的分類 4
1.3 數據挖掘的過程 5
1.4 數據挖掘的任務 6
1.5 數據挖掘的對象 8
1.5.1 數據庫 8
1.5.2 文本 10
1.5.3 圖像與視頻數據 10
1.5.4 Web數據 11
1.6 數據挖掘建模方法 11
1.6.1 業務理解 12
1.6.2 數據理解 13
1.6.3 數據準備 13
1.6.4 建模 14
1.6.5 評估 15
1.6.6 部署 16
1.7 數據挖掘的應用 16
1.7.1 在金融領域的應用 16
1.7.2 在零售業中的應用 17
1.7.3 在電信業的應用 18
1.7.4 在管理中的應用 19
1.7.5 在化學研究領域中的應用 19
1.7.6 在材料研究、生産方麵的應用 20
1.7.7 在機械故障診斷與監測中的應用 21
1.7.8 在醫療領域中的應用 22
第2章 數據挖掘算法 25
2.1 決策樹算法 26
2.1.1 決策樹基本算法 27
2.1.2 ID3算法 29
2.1.3 C4.5算法 30
2.1.4 CART算法 31
2.1.5 決策樹的評價標準 32
2.1.6 決策樹的剪枝及優化 33
2.1.7 基於matlab的決策樹分析 34
2.2 人工神經網絡算法 41
2.2.1 人工神經網絡概述 41
2.2.2 人工神經網絡的基本模型 41
2.2.3 BP神經網絡 43
2.2.4 RBF神經網絡 45
2.2.5 SOM神經網絡 46
2.2.6 反饋型神經網絡(Hopfield) 47
2.2.7 基於matlab的神經網絡方法 49
2.3 進化算法 55
2.3.1 進化算法的基本原理 56
2.3.2 基因算法的主要步驟 60
2.3.3 基本遺傳算法 61
2.3.4 進化規劃算法 63
2.3.5 進化策略計算 64
2.3.6 量子遺傳算法 68
2.3.7 人工免疫算法 72
2.3.8 基於matlab的進化算法 80
2.4 統計分析方法 87
2.4.1 假設檢驗 87
2.4.2 迴歸分析 91
2.4.3 二項邏輯(logistic)迴歸 100
2.4.4 方差分析 104
2.4.5 主成分分析 107
2.4.6 因子分析 110
2.4.7 基於matlab的統計分析方法 113
2.5 貝葉斯網絡方法 141
2.5.1 貝葉斯定理、先驗和後驗 142
2.5.2 貝葉斯網絡 142
2.5.3 貝葉斯網絡學習 143
2.5.4 主要貝葉斯網絡模型 145
2.5.5 基於matlab的貝葉斯網絡方法 148
2.6 支持嚮量機 160
2.6.1 支持嚮量機概述 160
2.6.2 核函數 162
2.6.3 基於matlab的支持嚮量機方法 164
2.7 關聯分析 167
2.7.1 概述 167
2.7.2 Apriori關聯規則算法 170
2.7.3 基於分類搜索的關聯規則算法 171
2.7.4 時序關聯規則算法 173
2.7.5 多值屬性關聯規則算法 174
2.7.6 增量關聯規則算法 175
2.7.7 基於關聯規則的分類算法 176
2.7.8 模糊關聯分類算法 177
2.7.9 關聯規則的評價 178
2.7.10 辛普森悖論 179
2.7.11 基於matlab的關聯規則分析 180
2.8 其他數據挖掘方法 182
2.8.1 近鄰法 182
2.8.2 K-means聚類 184
2.8.3 基於matlab的近鄰法及k-means聚類法 187
第3章 數據挖掘相關技術 191
3.1 數據倉庫 192
3.1.1 概述 192
3.1.2 數據倉庫設計 195
3.1.3 數據倉庫的開發應用 199
3.1.4 數據倉庫的技術管理 209
3.1.5 OLAP技術 210
3.1.6 基於matlab的數據倉庫開發技術 214
3.2 模糊集理論 234
3.1.1 模糊集閤 234
3.1.2 模糊關係 237
3.1.3 模糊聚類 239
3.3.5 基於matlab的模糊集處理技術 244
3.3 粗糙集技術 255
3.3.1 粗糙集理論的基本概念 256
3.3.2 分類規則的形成 259
3.3.3 知識的約簡 259
3.3.4 模糊集與粗糙集 261
3.3.5 基於matlab的粗糙集處理方法 262
3.4 目標優化技術 265
3.4.1 極值問題 266
3.4.2 無約束非綫性規劃 267
3.4.3 有約束非綫性規劃 270
3.4.4 大規模優化問題的分解算法 270
3.4.5 其他優化方法 273
3.4.6 基於matlab的目標優化方法 274
3.5 可視化技術 281
3.5.1 可視化技術分類 282
3.5.2 多維數據可視化 283
3.5.3 圖形的特徵分析 294
3.5.4 基於多元圖的圖形分類方法 297
3.5.5 基於色度學空間的多元圖錶示 299
3.5.6 基於matlab的數據可視化技術 300
3.6 公式發現 314
3.6.1 概述 315
3.6.2 公式發現係統中的知識 315
3.6.3 基於matlab的公式發現 319
3.7 多媒體數據挖掘技術 320
3.7.1 文本挖掘 323
3.7.2 圖像挖掘 331
3.7.3 視頻挖掘 331
3.7.4 音頻挖掘 332
3.7.5 復閤類型數據的挖掘 333
3.8 Web數據挖掘技術 334
3.8.1 Web內容挖掘 335
3.8.2 Web結構挖掘 337
3.8.3 Web使用挖掘 338
第4章 數據挖掘應用實戰 343
4.1 數據關係發現 344
4.2 數據統計特性 344
4.3 數據預處理 349
4.3.1 數據清理 349
4.3.2 數據集成與轉換 351
4.3.3 數據歸約與濃縮 353
4.3.4 數值數據的概念分層與離散化 360
4.3.5 例題 362
4.4 分類 373
4.5 例題 376
4.6 預測 381
4.6.1 迴歸分析 381
4.6.2 時間序列預測模型 385
4.6.3 馬爾可夫鏈 389
4.6.4 灰色係統方法 390
4.6.5 例題 398
4.7 聚類 418
4.7.1 聚類分析概述 418
4.7.2 聚類分析中的數據類型 419
4.7.3相似性度量 422
4.7.4 聚類的特徵 427
4.7.5 聚類準則 427
4.7.6 劃分方法 429
4.7.7 層次方法 430
4.7.8 基於密度的方法 433
4.7.9 基於網格的方法 434
4.7.10 基於模型的聚類方法 435
4.4.11 基於目標函數的方法 436
4.7.12 離群點檢測 438
4.7.13 聚類有效性 445
4.7.14 例題 448
4.8 時序數據挖掘 462
4.8.1 基本定義 463
4.8.2 時序數據挖掘參數 464
4.8.3 時序關聯規則 464
4.8.4 時間序列挖掘 466
4.8.5 時間序列分段綫性錶示 468
4.8.6 時間序列的預測 469
4.8.7 例題 469
4.9 關聯規則挖掘 481
4.9.1 關聯規則的類型及挖掘算法 481
4.9.2 基於組織進化的關聯規則挖掘 481
4.9.3 基於組織層次進化的關聯規則挖掘 483
4.9.4 多維關聯規則挖掘 484
4.9.5 關聯規則擴展 485
4.9.6 例題 487
參考文獻 500
實戰大數據 MATLAB數據挖掘詳解與實踐 下載 mobi pdf epub txt 電子書 格式 2024
實戰大數據 MATLAB數據挖掘詳解與實踐 下載 mobi epub pdf 電子書挺厚實
評分書完好沒有損壞
評分速度快,質量好,支持京東!
評分此用戶未填寫評價內容
評分這本書不錯。
評分很好的書,買來充實小書庫。可以慢慢研讀,作為參考資料很不錯的。
評分內容東拼西湊,居然寫到547頁,書的例子不多卻很簡單,還冠名為大數據,照這樣的寫作方式我可以寫1000000000000000000000000000000萬本。誰賣誰後悔
評分挺厚實
評分給學生買的作為入門級學習
實戰大數據 MATLAB數據挖掘詳解與實踐 mobi epub pdf txt 電子書 格式下載 2024