海報:
  數據挖掘技術是當下大數據時代最關鍵的技術,其應用領域及前景不可估量。R是一款極其優秀的統計分析和數據挖掘軟件,《大數據時代的R語言·數據挖掘:R語言實戰》側重使用R進行數據挖掘,重點講述瞭R的數據挖掘流程、算法包的使用及相關工具的應用,同時結閤大量精選的數據挖掘實例對R軟件進行深入潛齣和全麵的介紹,以便讀者能深刻理解R的精髓並能快速、高效和靈活地掌握使用R進行數據挖掘的技巧。
  通過《大數據時代的R語言·數據挖掘:R語言實戰》,讀者不僅能掌握使用R及相關的算法包來快速解決實際問題的方法,而且能得到從實際問題分析入手,到利用R進行求解,以及對挖掘結果進行分析的全麵訓練。
第0章 緻敬,R!
緻敬,肩膀!
緻敬,時代!
緻敬,人纔!
緻敬,R 瑟!
上篇 數據預處理
第1章 數據挖掘導引
1.1 數據挖掘概述
1.1.1 數據挖掘的過程
1.1.2 數據挖掘的對象
1.1.3 數據挖掘的方法
1.1.4 數據挖掘的應用
1.2 數據挖掘的算法
1.3 數據挖掘的工具
1.3.1 工具的分類
1.3.2 工具的選擇
1.3.3 商用的工具
1.3.4 開源的工具
1.4 R 在數據挖掘中的優勢
數據挖掘:R 語言實戰
VI
第2章 數據概覽
2.1 n×m 數據集
2.2 數據的分類
2.2.1 一般的數據分類
2.2.2 R 的數據分類
2.2.3 用R 簡單處理數據
2.3 數據抽樣及R 實現
2.3.1 簡單隨機抽樣
2.3.2 分層抽樣
2.3.3 整群抽樣
2.4 訓練集與測試集
2.5 本章匯總
第3章 用R 獲取數據
3.1 獲取內置數據集
3.1.1 datasets 數據集
3.1.2 包的數據集
3.2 獲取其他格式的數據
3.2.1 CSV 與TXT 格式
3.2.2 從Excel 直接獲取數據
3.2.3 從其他統計軟件中獲取數據
3.3 獲取數據庫數據
3.4 獲取網頁數據
3.5 本章匯總
第4章 探索性數據分析
4.1 數據集
4.2 數字化探索
4.2.1 變量概況
4.2.2 變量詳情
4.2.3 分布指標
4.2.4 稀疏性
4.2.5 缺失值
4.2.6 相關性
4.3 可視化探索
4.3.1 直方圖
目 錄
VII
4.3.2 纍積分布圖
4.3.3 箱形圖
4.3.4 條形圖
4.3.5 點陣圖
4.3.6 餅圖
4.5 本章匯總
第5章 數據預處理
5.1 數據集加載
5.2 數據清理
5.2.1 缺失值處理
5.2.2 噪聲數據處理
5.2.3 數據不一緻的處理
5.3 數據集成
5.4 數據變換
5.5 數據歸約
5.6 本章匯總
中篇 基本算法及應用
第6章 關聯分析
6.1 概述
6.2 R 中的實現
6.2.1 相關軟件包
6.2.2 核心函數
6.2.3 數據集
6.3 應用案例
6.3.1 數據初探
6.3.2 對生成規則進行強度控製
6.3.3 一個實際應用
6.3.4 改變輸齣結果形式
6.3.5 關聯規則的可視化
6.4 本章匯總
第7章 聚類分析
7.1 概述
7.1.1 K-均值聚類
數據挖掘:R 語言實戰
VIII
7.1.2 K-中心點聚類
7.1.3 係譜聚類
7.1.4 密度聚類
7.1.5 期望最大化聚類
7.2 R 中的實現
7.2.1 相關軟件包
7.2.2 核心函數
7.2.3 數據集
7.3 應用案例
7.3.1 K-均值聚類
7.3.2 K-中心點聚類
7.3.3 係譜聚類
7.3.4 密度聚類
7.3.5 期望最大化聚類
7.4 本章匯總
第8章 判彆分析
8.1 概述
8.1.1 費希爾判彆
8.1.2 貝葉斯判彆
8.1.3 距離判彆
8.2 R 中的實現
8.2.1 相關軟件包
8.2.2 核心函數
8.2.3 數據集
8.3 應用案例
8.3.1 綫性判彆分析
8.3.2 樸素貝葉斯分類
8.3.3 K 最近鄰
8.3.4 有權重的K 最近鄰算法
8.4 推薦係統綜閤實例
8.4.1 kNN 與推薦
8.4.2 MovieLens 數據集說明
8.4.3 綜閤運用
8.5 本章匯總
目 錄
IX
第9章 決策樹
9.1 概述
9.1.1 樹形結構
9.1.2 樹的構建
9.1.3 常用算法
9.2 R 中的實現
9.2.1 相關軟件包
9.2.2 核心函數
9.2.3 數據集
9.3 應用案例
9.3.1 CART 應用
9.3.2 C4.5 應用
9.4 本章匯總
下篇 高級算法及應用
第10章 集成學習
10.1 概述
10.1.1 一個概率論小計算
10.1.2 Bagging 算法
10.1.3 AdaBoost 算法
10.2 R 中的實現
10.2.1 相關軟件包
10.2.2 核心函數
10.2.3 數據集
10.3 應用案例
10.3.1 Bagging 算法
10.3.2 Adaboost 算法
10.4 本章匯總
第11章 隨機森林
11.1 概述
11.1.1 基本原理
11.1.2 重要參數
11.2 R 中的實現
11.2.1 相關軟件包
數據挖掘:R 語言實戰
X
11.2.2 核心函數
11.2.3 可視化分析
11.3 應用案例
11.3.1 數據處理
11.3.2 建立模型
11.3.3 結果分析
11.3.4 自變量的重要程度
11.3.5 優化建模
11.4 本章匯總
第12章 支持嚮量機
12.1 概述
12.1.1 結構風險最小原理
12.1.2 函數間隔與幾何間隔
12.1.3 核函數
12.2 R 中的實現
12.2.1 相關軟件包
12.2.2 核心函數
12.2.3 數據集
12.3 應用案例
12.3.1 數據初探
12.3.2 建立模型
12.3.3 結果分析
12.3.4 預測判彆
12.3.5 綜閤建模
12.3.6 可視化分析
12.3.7 優化建模
12.4 本章匯總
第13章 神經網絡
13.1 概述
13.2 R 中的實現
13.2.1 相關軟件包
13.2.2 核心函數
13.3 應用案例
13.3.1 數據初探
目 錄
XI
13.3.2 數據處理
13.3.3 建立模型
13.3.4 結果分析
13.3.5 預測判彆
13.3.6 模型差異分析
13.3.7 優化建模
13.4 本章匯總
第14章 模型評估與選擇
14.1 評估過程概述
14.2 安裝Rattle 包
14.3 Rattle 功能簡介
14.3.1 Data――選取數據
14.3.2 Explore――數據探究
14.3.3 Test――數據相關檢驗
14.3.4 Transform――數據預處理
14.3.5 Cluster――數據聚類
14.3.6 Model――模型評估
14.3.7 Evaluate――模型評估
14.3.8 Log――模型評估記錄
14.4 模型評估相關概念
14.4.1 誤判率
14.4.2 正確/錯誤的肯定判斷、正確/錯誤的否定判斷
14.4.3 精確度、敏感度及特異性
14.5 Rattle 在模型評估中的應用
14.5.1 混淆矩陣
14.5.2 風險圖
14.5.3 ROC 圖及相關圖錶
14.5.4 模型得分數據集
14.6 綜閤實例
14.6.1 數據介紹
14.6.2 模型建立
14.6.3 模型結果分析
數據挖掘:R 語言實戰
  在大數據時代,數據挖掘無疑將是最炙手可熱的技術。數據挖掘的理論和方法正曰新月異地發展,數據挖掘的技術及工具,已經滲透到互聯網、金融、電商、管理、生産、決策等各個領域,數據挖掘的軟件也是層齣不窮,其中R是最引入關注的軟件。
  R是一個免費的開源軟件,它提供瞭首屈一指的統計計算和繪圖功能,尤其是大量的數據挖掘方麵的算法包,使得它成為一款優秀的、不可多得的數據挖掘工具軟件。
  本書的主要目的是嚮讀者介紹如何用R進行數據挖掘,通過大量的精選實例,循序漸進、全麵係統地講述R在數據挖掘領域的應用。
  本書以數據預處理、基本算法及應用和高級算法及應用這三篇展開。
  (1)上篇:數據預處理’
  由第1—5章組成,首先簡要介紹數據挖掘流程、算法和工具,然後介紹R中的數據分類和數據集,以及使用R獲取數據的多種靈活的方法。最後講述對數據進行探索性分析和預處理的方法。這些內容是使用R進行數據挖掘的最基礎內容。
  (2)中篇:基本算法及應用
  由第6—9章組成,主要講述數據挖掘的基本算法及應用,包括關聯分析、聚類分析、判彆分析和決策樹,這些算法也是數據挖掘使用最多最普遍的算法。R中提供瞭豐富的、功能強大的算法包和實現函數,數據挖掘的初級和中級用戶務必掌握。
  (3)下篇:高級算法及應用
  由第10—14章組成,主要講述數據挖掘的高級算法及應用,包括集成學習、隨機森林、支持嚮量機和神經網絡,以及使用R中的工具對數據挖掘的模型進行評估與選擇。對於中高級的用戶,可以深入學習一下本篇的內容。
  R的特點是入門非常容易,使用也非常簡單,因此本書不需要讀者具備R和數據挖掘的基礎知識。不管是R初學者,還是熟練的R用戶都能從書中找到對自己有用的內容,快速入門和提高。讀者既可以把本書作為學習如何應用R的一本優秀的教材,也可以作為數據挖掘的工具書。
  全書以實際問題、解決方案和對解決方案的討論為主綫來組織內容,脈絡清晰,並且各章自成體係。讀者可以從頭至尾逐章學習,也可以根據自己的需要進行學習,根據自己在實際中遇到的問題尋找解決方案。
  本書所編寫的源程序,都通過瞭反復調試,方便讀者使用。
  本書主要由黃文、王正林編寫,其他參與編寫的人員有付東旭、王思琪、鍾太平、劉擁軍、陳菜枚、李燦輝、鍾事沅、王曉麗、王龍躍、夏路生、鍾頌飛、鍾杜清、王殿祜等。在此對所有參與編寫的人員錶示感謝!對關心、支持我們的讀者錶示感謝!
  由於時間倉促,作者水平和經驗有限,書中錯漏之處在所難免,敬請讀者指正。
  編者
  2014年4月18日於北京
對於許多想要深入瞭解數據科學領域的人來說,R語言無疑是一扇重要的門。我是一名在校的學生,對機器學習和數據挖掘充滿熱情,但常常苦於找不到一條既係統又實用的學習路徑。《大數據時代的R語言·數據挖掘:R語言實戰》這本書的書名就深深吸引瞭我,它似乎承諾瞭一次在大數據浪潮中,利用R語言進行深度數據挖掘的全麵實踐。我非常期待書中能夠提供關於大數據基礎概念的清晰講解,以及R語言在應對海量數據時的相應策略。更重要的是,我希望這本書能夠詳細闡述各種經典和前沿的數據挖掘算法,並配以詳實的R語言代碼示例,讓我在學習理論的同時,能夠動手實踐,真正理解算法的運行機製。我尤其看重“實戰”二字,這意味著書中應該會有豐富的案例,能夠讓我將所學知識應用於解決實際問題,例如用戶行為分析、風險預測、推薦係統構建等。如果這本書能幫助我打下堅實的數據挖掘基礎,並培養齣獨立解決復雜數據問題的能力,那將是我在這條學習道路上邁齣的重要一步。
評分當我翻開這本書時,我立刻被它所呈現的清晰邏輯和豐富內容所吸引。我是一名在市場研究領域工作的分析師,近年來,隨著市場數據的爆炸式增長,傳統的分析方法已經難以滿足需求,我迫切需要掌握更先進的數據挖掘技術,而R語言無疑是實現這一目標的重要工具。這本書的書名——《大數據時代的R語言·數據挖掘:R語言實戰》——精準地擊中瞭我的需求痛點。我非常好奇書中會如何介紹R語言在處理大規模數據集時的優勢,以及如何利用R語言進行有效的特徵選擇和特徵工程。更重要的是,我期待它能提供一係列真實世界的案例,涵蓋從數據清洗、探索性數據分析到模型構建和結果解讀的完整流程。我希望書中不僅僅是羅列算法,而是能夠深入剖析每個算法的原理,並提供如何根據具體業務場景選擇最閤適的算法的指導。這本書的“實戰”二字,讓我看到瞭它將理論與實踐完美結閤的潛力,我希望它能幫助我成為一個更具洞察力的數據分析師。
評分說實話,我之前嘗試過幾本R語言的書,有些過於理論化,讀起來像是在啃一本統計學教材,有些則過於碎片化,講瞭一些零散的函數用法,卻難以形成係統的知識體係。因此,當我在書店看到《大數據時代的R語言·數據挖掘:R語言實戰》時,我的內心是充滿渴望又夾雜著一絲顧慮的。我希望能找到一本既有深度又能貼近實際應用的書籍。這本書的書名聽起來就很“硬核”,大數據、數據挖掘、R語言實戰,這些都是我工作中最頭疼也是最想突破的方嚮。我尤其關注書中是否能詳細介紹如何利用R語言處理海量數據,如何構建高效的數據挖掘流程,以及如何對模型進行評估和優化。我期待它能提供一些“乾貨”,例如如何使用R語言連接各種大數據存儲(如Hadoop、Spark),如何進行分布式數據處理,以及如何利用R的強大生態係統來解決復雜的現實問題。如果書中能提供清晰的代碼示例和詳盡的步驟說明,那對我來說將是莫大的福音。
評分這是一本讓我眼前一亮的書!作為一名半路齣傢的程序員,之前接觸的編程語言大多是麵嚮過程的,最近因為工作需要開始涉足數據分析,R語言因其強大的統計功能和豐富的可視化庫吸引瞭我。然而,零基礎上手R語言,尤其是在涉及“大數據”和“數據挖掘”這些聽起來就很“高大上”的領域,確實讓人有些望而卻步。這本書的齣現,恰恰彌補瞭我在這個方嚮上的知識鴻溝。從目錄的編排來看,它似乎循序漸進,從基礎的R語言語法和數據結構講起,逐步深入到各種數據挖掘的算法,而且強調“實戰”,這讓我看到瞭它將理論知識轉化為實際操作能力的潛力。我特彆想知道,書中是如何將復雜的算法用淺顯易懂的方式講解清楚,並且通過實際案例來展示如何用R語言去實現和應用這些算法的。我希望它能像一位耐心的導師,引導我一步步揭開數據挖掘的神秘麵紗,讓我不再是隻會寫代碼的“碼農”,而是能真正從數據中“挖”齣價值的“數據煉金術士”。
評分剛拿到這本《大數據時代的R語言·數據挖掘:R語言實戰》,就被厚實的紙張和精美的裝幀吸引瞭,這讓我對內容充滿瞭期待。我是一名在數據分析領域摸爬滾打多年的從業者,雖然工作中也接觸R語言,但總覺得自己的技能樹不夠茂盛,尤其是在大數據處理和深度挖掘方麵,總有些力不從心。市麵上關於R語言的書籍汗牛充棟,但真正能打通理論與實踐、兼顧深度與廣度的卻不多。我尤其看重的是書中能否提供實際案例,能夠讓我將學到的知識快速應用到實際工作中,解決我遇到的那些棘桑的難題。這本書的書名就點明瞭它的核心——大數據時代下的R語言數據挖掘,這正是我目前最迫切需要提升的方嚮。我非常好奇它在數據預處理、特徵工程、模型選擇、性能優化等方麵會提供哪些“實戰”的技巧和方法,以及如何在新興的大數據環境下,R語言依然能夠扮演舉足輕重的角色。期待書中能有一些我從未接觸過的新穎算法或思路,或者對現有算法有更深入、更獨到的解析,能夠幫助我突破瓶頸,實現數據分析能力的飛躍。
評分幫同學買的,挺好的,非常實惠,贊一個,非常棒?!!!!!!!!!!!!!!
評分這些中文書就彆浪費生命看瞭
評分非常全麵,適閤初學和深入研究!贊!
評分還沒開始看 應該不錯吧
評分書的質量很好,確實值得買
評分很好,京東搞活動,很便宜,超值,物流也是棒棒的!
評分質量有點差,感覺像盜版的。不知道怎麼會這樣
評分書的紙張不好,有點像盜版的感覺
評分書挺好滴,是正版,包裝也挺好,沒毛病
本站所有內容均為互聯網搜尋引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度,google,bing,sogou 等
© 2025 book.teaonline.club All Rights Reserved. 圖書大百科 版權所有