正版 機器學習 周誌華 西瓜書 機器學習基礎知識 機器學習方法 人工智能 權威的機器學習中文教科

正版 機器學習 周誌華 西瓜書 機器學習基礎知識 機器學習方法 人工智能 權威的機器學習中文教科 下載 mobi epub pdf 電子書 2025

周誌華著 著
圖書標籤:
  • 機器學習
  • 人工智能
  • 周誌華
  • 西瓜書
  • 機器學習基礎
  • 機器學習方法
  • 模式識彆
  • 數據挖掘
  • 算法
  • 教科書
想要找書就要到 圖書大百科
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!
店鋪: 恒久圖書專營店
齣版社: 清華大學齣版社
ISBN:9787302423287
商品編碼:10717804774
包裝:平裝
開本:16
齣版時間:2016-01-01

具體描述



商品參數
機器學習
            定價 88.00
齣版社 清華大學齣版社
版次 1
齣版時間 2016年01月
開本 16
作者 周誌華 著
裝幀 平裝
頁數
字數
ISBN編碼 9787302423287


內容介紹

機器學習是計算機科學與人工智能的重要分支領域. 本書作為該領域的入門教材,在內容上盡可能涵蓋機器學習基礎知識的各方麵. 全書共16 章,大緻分為3 個部分:第1 部分(第1~3 章)介紹機器學習的基礎知識;第2 部分(第4~10 章)討論—些經典而常用的機器學習方法(決策樹、神經網絡、支持嚮量機、貝葉斯分類器、集成學習、聚類、降維與度量學習);第3 部分(第11~16 章)為進階知識,內容涉及特徵選擇與稀疏學習、計算學習理論、半監督學習、概率圖模型、規則學習以及強化學習等. 每章都附有習題並介紹瞭相關閱讀材料,以便有興趣的讀者進—步鑽研探索。

本書可作為高等院校計算機、自動化及相關專業的本科生或研究生教材,也可供對機器學習感興趣的研究人員和工程技術人員閱讀參考。





作者介紹

周誌華,南京大學計算機係教授,ACM傑齣科學傢,IEEE Fellow, IAPR Fellow, IET/IEE Fellow, 中國計算機學會會士。國傢傑齣青年科學基金獲得者、長江學者特聘教授。先後擔任多種SCI(E)期刊執行主編、副主編、副編輯、編委等。中國計算機學會人工智能與模式識彆專業委員會主任,中國人工智能學會機器學習專業委員會主任,IEEE計算智能學會數據挖掘技術委員會副主席。



目錄

目錄


第1章 1

1.1 引言 1

1.2 基本術 2

1.3 假設空間 4

1.4 歸納偏好 6

1.5 發展曆程 10

1.6 應用現狀 13

1.7 閱讀材料 16

習題 19

參考文獻 20

休息—會兒 22



第2章 模型評估與選擇 23

2.1 經驗誤差與過擬閤 23

2.2 評估方法 24

2.2.1 留齣法 25

2.2.2 交叉驗證法 26

2.2.3 自助法 27

2.2.4 調參與zui終模型 28

2.3 性能度量 28

2.3.1 錯誤率與精度 29

2.3.2 查準率、查全率與F1 30

2.3.3 ROC與AUC 33

2.3.4 代價敏感錯誤率與代價麯綫 35

2.4 比較檢驗 37

2.4.1 假設檢驗 37

2.4.2 交叉驗證t檢驗 40

2.4.3 McNemar檢驗 41

2.4.4 Friedman檢驗與後續檢驗 42

2.5 偏差與方差 44

2.6 閱讀材料 46

習題 48

參考文獻 49

休息—會兒 51



第3章 綫性模型 53

3.1 基本形式 53

3.2 綫性迴歸 53

3.3 對數幾率迴歸 57

3.4 綫性判彆分析 60

3.5 多分類學習 63

3.6 類彆不平衡問題 66

3.7 閱讀材料 67

習題 69

參考文獻 70

休息—會兒 72



第4章 決策樹 73

4.1 基本流程 73

4.2 劃分選擇 75

4.2.1 信息增益 75

4.2.2 增益率 77

4.2.3 基尼指數 79

4.3 剪枝處理 79

4.3.1 預剪枝 80

4.3.2 後剪枝 82

4.4 連續與缺失值 83

4.4.1 連續值處理 83

4.4.2 缺失值處理 85

4.5 多變量決策樹 88

4.6 閱讀材料 92

習題 93

參考文獻 94

休息—會兒 95



第5章 神經網絡 97

5.1 神經元模型 97

5.2 感知機與多層網絡 98

5.3 誤差逆傳播算法 101

5.4 全局zui小與局部極小 106

5.5 其他常見神經網絡 108

5.5.1 RBF網絡 108

5.5.2 ART網絡 108

5.5.3 SOM網絡 109

5.5.4 級聯相關網絡 110

5.5.5 Elman網絡 111

5.5.6 Boltzmann機 111

5.6 深度學習 113

5.7 閱讀材料 115

習題 116

參考文獻 117

休息—會兒 120



第6章 支持嚮量機 121

6.1 間隔與支持嚮量 121

6.2 對偶問題 123

6.3 核函數 126

6.4 軟間隔與正則化 129

6.5 支持嚮量迴歸 133

6.6 核方法 137

6.7 閱讀材料 139

習題 141

參考文獻 142

休息—會兒 145



第7章 貝葉斯分類器 147

7.1 貝葉斯決策論 147

7.2 極大似然估計 149

7.3 樸素貝葉斯分類器 150

7.4 半樸素貝葉斯分類器 154

7.5 貝葉斯網 156

7.5.1 結構 157

7.5.2 學習 159

7.5.3 推斷 161

7.6 EM算法 162

7.7 閱讀材料 164

習題 166

參考文獻 167

休息—會兒 169



第8章 集成學習 171

8.1 個體與集成 171

8.2 Boosting 173

8.3 Bagging與隨機森林 178

8.3.1 Bagging 178

8.3.2 隨機森林 179

8.4 結閤策略 181

8.4.1 平均法 181

8.4.2 投票法 182

8.4.3 學習法 183

8.5 多樣性 185

8.5.1 誤差--分歧分解 185

8.5.2 多樣性度量 186

8.5.3 多樣性增強 188

8.6 閱讀材料 190

習題 192

參考文獻 193

休息—會兒 196




第9章 聚類 197

9.1 聚類任務 197

9.2 性能度量 197

9.3 距離計算 199

9.4 原型聚類 202

9.4.1 k均值算法 202

9.4.2 學習嚮量量化 204

9.4.3 高斯混閤聚類 206

9.5 密度聚類 211

9.6 層次聚類 214

9.7 閱讀材料 217

習題 220

參考文獻 221

休息—會兒 224



第10章 降維與度量學習 225

10.1 k近鄰學習 225

10.2 低維嵌入 226

10.3 主成分分析 229

10.4 核化綫性降維 232

10.5 流形學習 234

10.5.1 等度量映射 234

10.5.2 局部綫性嵌入 235

10.6 度量學習 237

10.7 閱讀材料 240

習題 242

參考文獻 243

休息—會兒 246



第11章 特徵選擇與稀疏學習 247

11.1 子集搜索與評價 247

11.2 過濾式選擇 249

11.3 包裹式選擇 250

11.4 嵌入式選擇與L$_1$正則化 252

11.5 稀疏錶示與字典學習 254

11.6 壓縮感知 257

11.7 閱讀材料 260

習題 262

參考文獻 263

休息—會兒 266




第12章 計算學習理論 267

12.1 基礎知識 267

12.2 PAC學習 268

12.3 有限假設空間 270

12.3.1 可分情形 270

12.3.2 不可分情形 272

12.4 VC維 273

12.5 Rademacher復雜度 279

12.6 穩定性 284

12.7 閱讀材料 287

習題 289

參考文獻 290

休息—會兒 292



第13章 半監督學習 293

13.1 未標記樣本 293

13.2 生成式方法 295

13.3 半監督SVM 298

13.4 圖半監督學習 300

13.5 基於分歧的方法 304

13.6 半監督聚類 307

13.7 閱讀材料 311

習題 313

參考文獻 314

休息—會兒 317




第14章 概率圖模型 319

14.1 隱馬爾可夫模型 319

14.2 馬爾可夫隨機場 322

14.3 條件隨機場 325

14.4 學習與推斷 328

14.4.1 變量消去 328

14.4.2 信念傳播 330

14.5 近似推斷 331

14.5.1 MCMC采樣 331

14.5.2 變分推斷 334

14.6 話題模型 337

14.7 閱讀材料 339

習題 341

參考文獻 342

休息—會兒 345



第15章 規則學習 347

15.1 基本概念 347

15.2 序貫覆蓋 349

15.3 剪枝優化 352

15.4 —階規則學習 354

15.5 歸納邏輯程序設計 357

15.5.1 zui小—般泛化 358

15.5.2 逆歸結 359

15.6 閱讀材料 363

習題 365

參考文獻 366

休息—會兒 369




第16章 強化學習 371

16.1 任務與奬賞 371

16.2 $K$-搖臂賭博機 373

16.2.1 探索與利用 373

16.2.2 $epsilon $-貪心 374

16.2.3 Softmax 375

16.3 有模型學習 377

16.3.1 策略評估 377

16.3.2 策略改進 379

16.3.3 策略迭代與值迭代 381

16.4 免模型學習 382

16.4.1 濛特卡羅強化學習 383

16.4.2 時序差分學習 386

16.5 值函數近似 388

16.6 模仿學習 390

16.6.1 直接模仿學習 391

16.6.2 逆強化學習 391

16.7 閱讀材料 393

習題 394

參考文獻 395

休息—會兒 397



附錄 399

A 矩陣 399

B 優化 403

C 概率分布 409


後記 417


索引 419




《數據科學實踐:從理論到落地》 洞悉數據價值,驅動智能決策 在當今信息爆炸的時代,數據已成為企業最寶貴的資産。如何從海量數據中挖掘洞見,轉化為實際的業務價值,是每一個組織麵臨的挑戰。本書《數據科學實踐:從理論到落地》正是一本旨在幫助讀者係統掌握數據科學核心技能,並將其高效應用於實際業務場景的指南。它並非一本專注於特定算法或理論的學術著作,而是著眼於整個數據科學的生命周期,從數據獲取、清洗、探索性分析,到模型構建、評估、部署,再到最終的業務價值實現,提供一套完整且可行的實踐框架。 本書的寫作初衷,源於作者在多年數據科學項目實踐中積纍的寶貴經驗。我們深知,理論知識固然重要,但將這些知識轉化為解決實際問題的能力,纔是衡量數據科學傢價值的關鍵。因此,本書在理論講解上力求嚴謹,但更側重於如何在真實世界的數據挑戰中應用這些理論。我們避免瞭冗長抽象的數學推導,而是通過生動的案例和清晰的邏輯,展現數據科學解決問題的全貌。 第一部分:數據科學基石——理解與準備 在開啓數據科學之旅前,首要任務是建立對數據的深刻理解和熟練的數據處理能力。本書的開篇,將帶您走進數據的世界,瞭解不同類型數據的特點,以及數據在業務流程中的角色。 數據獲取與整閤:我們將詳細探討各種數據源的類型,包括關係型數據庫、NoSQL數據庫、API接口、文本文件、日誌文件等,並介紹多種有效的數據提取和整閤策略。您將學習如何設計健壯的數據管道,確保數據在進入分析流程前是準確、完整且一緻的。 數據清洗與預處理:真實世界的數據往往充斥著噪聲、缺失值、異常值和格式不一緻等問題。本部分將深入講解各種數據清洗技術,例如缺失值插補(均值、中位數、迴歸插補、KNN插補等)、異常值檢測與處理(統計方法、箱綫圖、Isolation Forest等)、數據類型轉換、字符串處理、日期時間格式標準化等。我們將強調在清洗過程中保持數據完整性和準確性的重要性,並指導您如何根據具體業務場景選擇最閤適的方法。 探索性數據分析(EDA):EDA是數據科學的靈魂。它幫助我們初步瞭解數據的分布、變量之間的關係以及潛在的模式。本書將引導您係統地進行EDA,包括描述性統計分析(均值、方差、分位數等)、數據可視化(直方圖、散點圖、箱綫圖、熱力圖、地理信息圖等)以及特徵工程的初步探索。您將學習如何利用EDA的結果來發現數據中的洞見,為後續的模型選擇和特徵構建提供依據。 特徵工程:將原始數據轉化為機器學習模型能夠理解和利用的特徵,是數據科學中最具創造性和挑戰性的環節之一。本部分將詳細介紹多種特徵工程技術,包括特徵創建(多項式特徵、交互特徵、聚閤特徵等)、特徵轉換(對數轉換、Box-Cox轉換、標準化、歸一化等)、特徵編碼(獨熱編碼、標簽編碼、目標編碼等)以及處理類彆特徵和文本特徵的方法。我們還將探討如何基於領域知識和EDA發現來設計有意義的特徵,以提升模型性能。 第二部分:核心技術——模型構建與評估 在完成數據準備後,我們將進入模型的構建階段。本書並非僅僅羅列算法,而是從模型選擇、訓練、調優到評估的整個流程進行係統闡述。 模型選擇策略:麵對琳琅滿目的機器學習模型,如何選擇最適閤當前任務的模型是關鍵。我們將基於問題類型(分類、迴歸、聚類、降維等)、數據規模、模型可解釋性、訓練效率等維度,提供一套行之有效的模型選擇框架。您將瞭解綫性模型、樹模型、集成模型、支持嚮量機、神經網絡等主流模型的優缺點及其適用場景。 模型訓練與優化:本書將深入講解模型訓練的核心概念,包括損失函數、優化算法(梯度下降及其變種)、正則化技術(L1、L2、Dropout等)以及過擬閤與欠擬閤的診斷與解決。我們還將重點介紹模型調優的技術,如交叉驗證、網格搜索、隨機搜索和貝葉斯優化等,幫助您找到最優的模型超參數組閤。 模型評估指標:選擇閤適的評估指標對於客觀衡量模型性能至關重要。我們將詳細講解針對不同任務的評估指標,例如分類任務中的準確率、精確率、召迴率、F1分數、AUC-ROC麯綫;迴歸任務中的均方誤差(MSE)、均方根誤差(RMSE)、平均絕對誤差(MAE)、R²分數;聚類任務中的輪廓係數、Calinski-Harabasz指數等。我們還將強調理解指標的業務含義,以及如何根據業務目標選擇最能反映實際效果的指標。 集成學習:集成學習通過組閤多個模型來提升整體性能。本書將係統介紹集成學習的常見方法,如Bagging(如隨機森林)、Boosting(如AdaBoost, Gradient Boosting, XGBoost, LightGBM)以及Stacking。您將學習它們的原理、實現方式以及在實際應用中如何有效利用它們來構建更魯棒、更高精度的模型。 第三部分:落地實踐——部署、監控與價值實現 模型的效果最終需要通過實際部署並産生業務價值來體現。本部分將把焦點從模型本身轉移到整個數據科學項目的生命周期。 模型部署:將訓練好的模型集成到生産環境中,是數據科學項目落地的關鍵一步。我們將探討模型部署的各種方式,包括RESTful API、批處理推理、嵌入式部署等,並介紹常用的部署工具和框架。您將學習如何保證模型的穩定運行,並處理好模型與現有係統的集成問題。 模型監控與維護:模型部署並非終點,而是持續優化的起點。數據會隨時間發生變化,模型的性能也可能隨之衰減。本書將指導您如何建立有效的模型監控機製,跟蹤模型性能、數據漂移和概念漂移,並及時采取措施進行模型重訓練或更新。 A/B測試與實驗設計:為瞭科學地評估模型對業務的影響,A/B測試是不可或缺的工具。我們將講解如何設計有效的A/B測試實驗,收集和分析實驗數據,以及如何做齣基於數據驅動的決策。 數據倫理與閤規性:在數據科學實踐中,數據隱私、公平性和透明度是必須考慮的重要問題。本書將強調數據倫理的重要性,並介紹相關的法律法規和最佳實踐,幫助您構建負責任的數據科學解決方案。 項目管理與溝通:成功的數據科學項目離不開良好的項目管理和跨職能溝通。我們將分享在數據科學項目中如何進行需求定義、項目規劃、團隊協作以及如何有效地與業務部門溝通,確保項目按時交付並實現預期目標。 本書特色 強調實踐性:本書的核心在於“實踐”。我們通過豐富的真實案例,將抽象的理論轉化為可操作的步驟,讓讀者能夠立即上手。 係統性視角:本書覆蓋瞭數據科學的整個生命周期,從數據準備到模型部署,提供瞭一個端到端的解決方案。 循序漸進的難度:從基礎概念到高級技術,本書設計瞭清晰的學習路徑,適閤不同經驗水平的讀者。 技術與業務的融閤:我們不僅關注技術細節,更強調如何將數據科學技術與業務目標相結閤,最終驅動業務增長。 無偏見的工具與方法介紹:本書力求客觀地介紹各種常用的數據科學工具和方法,不局限於特定平颱或技術棧,讓讀者能夠根據實際需求靈活選擇。 目標讀者 本書適閤以下人群: 希望進入數據科學領域,係統學習數據科學技能的初學者。 有一定數據分析或編程基礎,希望提升模型構建和應用能力的開發人員、分析師。 希望將數據科學應用於業務決策的各行業從業人員,包括産品經理、市場營銷人員、運營人員等。 對人工智能和數據驅動決策感興趣的讀者。 閱讀《數據科學實踐:從理論到落地》,您將不僅僅是獲得一套技術工具,更是掌握一套解決實際問題的思維方式和方法論。讓我們一起,用數據驅動未來,用智慧創造價值。

用戶評價

評分

這本《機器學習》真是讓我大開眼界!之前對機器學習的理解一直停留在一些零散的概念上,比如神經網絡、決策樹之類的,但總覺得缺乏一個係統性的框架。這本書正好填補瞭我的空白。作者從最基礎的數學概念講起,一點點構建起整個機器學習的理論體係,這一點我非常欣賞。不會像有些書上來就拋齣一堆公式,讓人摸不著頭腦。它用瞭大量的例子來解釋抽象的概念,比如在講到“過擬閤”的時候,舉瞭一個考試“死記硬背”的例子,我瞬間就明白瞭。而且,書中提到的算法,比如支持嚮量機,不僅僅是介紹瞭原理,還講瞭如何選擇核函數、調整參數,這些實操性的東西對於想動手實踐的人來說簡直是寶藏。我特彆喜歡它在介紹各個算法時,都會先鋪墊背景,說明為什麼需要這個算法,它解決瞭什麼問題,然後再深入講解。這種循序漸進的方式,讓我感覺學起來不那麼吃力,也更容易理解算法之間的聯係和區彆。這本書的編排邏輯非常清晰,章節之間的過渡也很自然,讀起來就像是在聽一位經驗豐富的老師在講課,條理分明,邏輯嚴謹。

評分

我是一位在業餘時間學習機器學習的愛好者,之前也嘗試過幾本不同的書籍,但總感覺在理解上有些隔閡。直到我遇到瞭這本《機器學習》,我纔真正體會到什麼叫做“庖丁解牛”。作者的敘述風格非常獨特,既有嚴謹的學術大傢的風範,又充滿瞭循循善誘的教育智慧。他善於用生活中常見的例子來類比復雜的機器學習概念,這使得抽象的理論變得生動有趣,也更容易被理解。比如,在解釋“正則化”的時候,作者用“約束運動員的訓練強度,避免過度疲勞導緻傷病”來比喻,這個例子非常貼切,讓我一下子就明白瞭正則化的核心作用。而且,書中在介紹每一種算法時,都會站在一個更高的維度,去分析它在整個機器學習領域中的定位和價值,而不是孤立地講解。這種宏觀的視角,讓我能夠更好地把握機器學習的整體圖景,也更有信心去應對未來的學習和挑戰。這本書真的讓我感受到瞭知識的力量,也讓我對人工智能的未來充滿瞭期待。

評分

作為一名對人工智能領域一直抱有濃厚興趣的讀者,我一直在尋找一本能夠深入淺齣、又兼具深度與廣度的中文教材。這本《機器學習》簡直就是我夢寐以求的那一本。它不僅僅是一本枯燥的技術手冊,更像是一部引人入勝的學術探索之旅。作者在梳理經典機器學習算法時,並沒有止步於錶麵的描述,而是深入剖析瞭其背後的數學原理和統計學基礎,同時巧妙地融入瞭其在人工智能發展史中的地位和演進。這一點讓我尤其震撼,它讓我在學習算法本身的同時,也對整個AI技術的發展脈絡有瞭更深刻的認識。更難得的是,書中對一些前沿問題的探討也相當有見地,雖然篇幅可能不如基礎算法那樣詳盡,但其點撥性的論述足以激發讀者進一步的思考和探索。我個人認為,這本書最吸引我的地方在於它所傳遞的一種嚴謹的學術態度和科學的思維方式。它鼓勵讀者去質疑、去驗證,而不是盲目接受。這種潛移默化的影響,遠比單純的技術知識傳遞要寶貴得多。

評分

我是一名在校大學生,正在準備畢業設計,方嚮就選瞭機器學習。之前看過不少網絡上的零散教程,但總覺得知識點不連貫,很多時候遇到問題就卡住瞭。這本書給我帶來的最大幫助在於它提供瞭一個完整的知識體係。從最基礎的模型評估,到各種監督學習、無監督學習算法,再到一些進階的主題,它都進行瞭係統性的講解。我印象特彆深的是關於“偏差-方差權衡”這一部分的闡述,作者用非常形象的比喻,比如“新手射箭”和“老手射箭”,清晰地解釋瞭偏差和方差的概念以及它們對模型性能的影響。這讓我一下子就抓住瞭模型優化的關鍵。而且,書中給齣的公式推導過程也非常詳盡,雖然有時候需要花點時間去消化,但最終理解之後,那種豁然開朗的感覺是無與倫比的。對於我這樣的學生來說,這本書不僅僅是學習工具,更是激發我學習動力和研究興趣的源泉。

評分

不得不說,這本《機器學習》是我近幾年來讀過最紮實、最有分量的技術類書籍之一。它對於機器學習核心概念的闡釋,堪稱典範。從模型選擇的原則,到各種算法的優缺點分析,再到實際應用中的注意事項,作者都處理得恰到好處。我尤其欣賞它在介紹一些相對復雜的算法時,能夠兼顧理論的深度和工程的可操作性。例如,在講解集成學習時,它不僅介紹瞭Bagging和Boosting的基本思想,還詳細討論瞭Random Forest和Gradient Boosting等具體模型,並且提供瞭相應的優化策略。這對於我這樣的實踐者來說,非常有價值。書中對數學原理的運用也十分精準,但並沒有讓數學公式成為閱讀的障礙,而是將它們巧妙地融入到概念的解釋和算法的推導中,使得讀者在掌握理論的同時,也能建立起紮實的數學基礎。這本書給我帶來的提升是全方位的,它不僅讓我掌握瞭機器學習的知識,更重要的是,它教會瞭我如何去思考問題,如何去構建一個有效的機器學習解決方案。

相關圖書

本站所有內容均為互聯網搜尋引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

© 2025 book.teaonline.club All Rights Reserved. 圖書大百科 版權所有