編輯推薦
1.從理論基礎到實例應用,邊學習邊實踐!
2.網羅數據挖掘中10種經典、常用的方法!
迴歸分析/Logistic迴歸分析/決策樹分析/支持嚮量機/記憶基礎推理/聚類分析/自組織映射/主成分分析/對應分析/關聯規則分析
3.圖文並茂,示例豐富,結閤可下載的R代碼和數據,讓你親自體驗數據挖掘的流程!
如何預測郵件是否為垃圾郵件?
如何判斷顧客會同時購買哪些商品?
如何根據股價數據判斷經濟的景氣程度?
如何從SNS獲取數據並分析?
……
大數據時代,必須瞭解數據挖掘!
本書首先介紹R的基礎知識以及使用R進行數據挖掘的流程;然後結閤具體示例、代碼和圖錶介紹數據挖掘的10種常用方法;* 後介紹數據挖掘的實戰案例,涉及多種方法的比較以及實際的大規模數據的分析。本書詳略得當,脈絡清晰,讓你輕鬆入門數據挖掘。
內容簡介
本書使用R,結閤大量實例,詳細介紹瞭數據挖掘的理論和分析方法。全書分為3部分:* 1部分簡單介紹瞭使用R進行數據挖掘的流程和數據挖掘的概要;* 2部分介紹瞭數據挖掘的10種常用方法,並在此基礎上使用R實際進行數據挖掘;第3部分結閤實際的數據挖掘事例介紹瞭如何使用這些方法。本書適閤數據挖掘的初學者,以及正在從事數據分析相關工作,想瞭解更多分析方法的讀者閱讀。
作者簡介
山本義郎(作者)
日本東海大學理學部數學係教授。著有《統計數據的可視化》《統計學序論》《概率統計序論 第 2版》(閤著)。執筆本書* 2章、第6章、第9章、* 11章、* 12章、* 13章。
藤野友和(作者)
日本福岡女子大學國際文理學部講師。著有《統計數據的可視化》(閤著)。執筆本書* 1章、第3章、第4章、第8章。
久保田貴文(作者)
日本多摩大學經營信息學部副教授。執筆本書第5章、第7章、* 10章、* 14章。
硃建春(譯者)
畢業於北京大學計算機係,曾在聯想集團任職多年,是國內較早從事Windows掌上電腦和智能手機的係統和應用軟件開發的IT工作者。後長期擔任對日軟件外包開發項目經理。
目錄
第I部分 使用R進行數據挖掘的準備 1
* 1章 基於R的數據分析入門..............................................................3
1.1 R及RStudio的安裝..................................................................................4
1.2 RStudio的基本操作...................................................................................6
1.3 R語言入門.................................................................................................10
1.3.1 作為計算器使用的方法........................................................................10
1.3.2 嚮量——R的基本數據結構................................................................11
1.3.3 嚮量變量的賦值和運算........................................................................12
1.3.4 數組和矩陣.............................................................................................13
1.3.5 因子型.....................................................................................................15
1.3.6 列錶.........................................................................................................16
1.3.7 數據框.....................................................................................................17
1.4 獲取外部數據............................................................................................18
1.5 數據匯總.....................................................................................................19
1.6 安裝程序包.................................................................................................21
1.7 基於dplyr程序包的數據框操作..........................................................22
1.8 數據的可視化............................................................................................25
1.8.1 柱狀圖.....................................................................................................26
1.8.2 直方圖.....................................................................................................29
1.8.3 箱形圖.....................................................................................................30
1.8.4 散點圖.....................................................................................................32
1.8.5 逐層繪製的圖.........................................................................................34
* 2章 數據挖掘概述..................................................................................36
2.1 大數據和數據挖掘...................................................................................36
2.2.1 業務理解(Business Understanding)..............................................37
2.2 CRISP-DM................................................................................................37
2.2.2 數據理解(Data Understanding).......................................................38
2.2.3 數據準備(Data Preparation)............................................................38
2.2.4 建模(Modeling)..................................................................................39
2.2.5 評估(Evaluation)................................................................................39
2.2.6 運用(Deployment).............................................................................39
2.3.1 數據的種類和建模................................................................................40
2.3 數據挖掘的方法........................................................................................40
2.3.2 預測和判彆.............................................................................................41
2.3.3 分類和聚類.............................................................................................41
2.3.4 維規約.....................................................................................................41
2.3.5 規則發現.................................................................................................41
第II部分 數據挖掘的方法 43
第3章 迴歸分析............................................................................................45
3.1 一元迴歸分析............................................................................................45
3.2 多元迴歸分析............................................................................................50
第4章 Logistic迴歸分析..........................................................................60
4.1 數據準備.....................................................................................................60
4.2 使用一個解釋變量進行預測..................................................................61
4.3 使用兩個及以上的解釋變量進行預測................................................67
第5章 決策樹分析.......................................................................................71
5.1 使用分類樹的判彆...................................................................................71
5.2 使用迴歸樹的預測...................................................................................77
第6章 支持嚮量機.......................................................................................81
6.1 支持嚮量機的概念...................................................................................81
6.2 類彆預測的例子........................................................................................83
6.3 數值預測的例子........................................................................................86
第7章 記憶基礎推理..................................................................................89
7.1 k* 近鄰法的概念....................................................................................89
7.2 變量的基準化和標準化..........................................................................94
第8章 聚類分析............................................................................................96
8.1 聚類分析的概念........................................................................................96
8.2 層次聚類分析............................................................................................97
8.3 執行層次聚類分析...................................................................................99
8.4 可視化進階...............................................................................................103
8.5 非層次聚類分析......................................................................................107
8.6 執行非層次聚類分析.............................................................................107
第9章 自組織映射....................................................................................110
9.1 自組織映射的概念.................................................................................110
9.2 基於自組織映射的分析實例................................................................111
9.3 基於自組織映射的分類........................................................................120
* 10章 主成分分析.................................................................................129
10.1 主成分分析的概念...............................................................................129
10.2 對象數據的準備...................................................................................132
10.3 執行主成分分析...................................................................................135
* 11章 對應分析......................................................................................141
11.1 對應分析.................................................................................................141
11.2 多重對應分析........................................................................................144
* 12章 關聯規則分析............................................................................149
12.1 關聯規則及其評價指標......................................................................149
12.2 關聯規則分析的實例..........................................................................151
12.3 關聯規則分析的應用實例..................................................................159
第III部分 數據挖掘實戰 165
* 13章 對各種預測方法的評估...............
R數據挖掘入門 下載 mobi epub pdf txt 電子書 格式