發表於2024-11-12
機器學習模型不能給齣準確結果的原因有很多。從設計的角度來審視這些係統,我們能夠深入理解其底層算法和可用的優化方法。本書為我們提供瞭機器學習設計過程的堅實基礎,能夠使我們為特定問題建立起定製的機器學習模型。我們可能已經瞭解或使用過一些為解決常見問題的商用機器學習模型,例如垃圾郵件檢測或電影分級,但是要著手於解決更為復雜的問題,則其重點是讓這些模型適用於我們自己特定的需求。
譯者序
前言
第1章 機器學習的思維1
1.1 人機界麵1
1.2 設計原理4
1.2.1 問題的類型6
1.2.2 問題是否正確7
1.2.3 任務8
1.2.4 統一建模語言27
1.3 總結31
第2章 工具和技術32
2.1 Python與機器學習33
2.2 IPython控製颱33
2.3 安裝SciPy棧34
2.4 NumPy35
2.4.1 構造和變換數組38
2.4.2 數學運算39
2.5 Matplotlib41
2.6 Pandas45
2.7 SciPy47
2.8 Scikit-learn50
2.9 總結57
第3章 將數據變為信息58
3.1 什麼是數據58
3.2 大數據59
3.2.1 大數據的挑戰60
3.2.2 數據模型62
3.2.3 數據分布63
3.2.4 來自數據庫的數據67
3.2.5 來自互聯網的數據68
3.2.6 來自自然語言的數據70
3.2.7 來自圖像的數據72
3.2.8 來自應用編程接口的數據72
3.3 信號74
3.4 數據清洗76
3.5 數據可視化78
3.6 總結80
第4章 模型—從信息中學習81
4.1 邏輯模型81
4.1.1 一般性排序83
4.1.2 解釋空間84
4.1.3 覆蓋空間86
4.1.4 PAC學習和計算復雜性87
4.2 樹狀模型88
4.3 規則模型92
4.3.1 有序列錶方法94
4.3.2 基於集閤的規則模型95
4.4 總結98
第5章 綫性模型100
5.1 最小二乘法101
5.1.1 梯度下降102
5.1.2 正規方程法107
5.2 logistic迴歸109
5.3 多分類113
5.4 正則化115
5.5 總結117
第6章 神經網絡119
6.1 神經網絡入門119
6.2 logistic單元121
6.3 代價函數126
6.4 神經網絡的實現128
6.5 梯度檢驗133
6.6 其他神經網絡架構134
6.7 總結135
第7章 特徵—算法眼中的世界136
7.1 特徵的類型137
7.1.1 定量特徵137
7.1.2 有序特徵138
7.1.3 分類特徵138
7.2 運算和統計139
7.3 結構化特徵141
7.4 特徵變換141
7.4.1 離散化143
7.4.2 歸一化144
7.4.3 校準145
7.5 主成分分析149
7.6 總結151
第8章 集成學習152
8.1 集成學習的類型152
8.2 Bagging方法153
8.2.1 隨機森林154
8.2.2 極端隨機樹155
8.3 Boosting方法159
8.3.1 AdaBoost161
8.3.2 梯度Boosting163
8.4 集成學習的策略165
8.5 總結168
第9章 設計策略和案例研究169
9.1 評價模型的錶現169
9.2 模型的選擇174
9.3 學習麯綫176
9.4 現實世界中的案例研究178
9.4.1 建立一個推薦係統178
9.4.2 溫室蟲害探測185
9.5 機器學習一瞥188
9.6 總結190
機器學習是計算世界所見的最大趨勢之一。機器學習係統具有意義深遠且令人興奮的能力,能夠在各種應用領域為人們提供重要的洞察力,從具有開創性的挽救生命的醫學研究到宇宙基礎物理方麵的發現,從為我們提供更健康、更清潔的食物到互聯網分析和建立經濟模型,等等。事實上,就某種意義而言,這項技術在我們的生活中已經無所不在。要想進入機器學習的領域,並且對其具有充分的認知,就必須能夠理解和設計服務於某一項目需要的機器學習係統。
本書的主要內容
第1章從機器學習的基礎知識開始,幫助你用機器學習的範式進行思考。你將學到機器學習的設計原理和相關模型。
第2章講解瞭Python中眾多針對機器學習任務的程序包。本章會讓你初步瞭解一些大型庫,包括NumPy、SciPy、Matplotlib和Scilit-learn等。
第3章講解瞭原始數據可能有多種不同格式,其數量和質量也可能各不相同。有時,我們會被數據淹沒;而有時,我們希望從數據中榨取最後一滴信息。數據要成為信息,需要有意義的結構。本章我們介紹瞭一些寬泛的主題,如大數據、數據屬性、數據源、數據處理和分析等。
第4章在邏輯模型中探索瞭邏輯語言,並創建瞭假設空間映射;在樹狀模型中,我們發現其具有廣泛作用域並易於描述和理解;在規則模型中,我們討論瞭基於有序規則列錶和無序規則集的模型。
第5章介紹瞭綫性模型,它是使用最廣泛的模型之一。綫性模型是眾多高級非綫性技術的基礎,例如,支持嚮量機(SVM)和神經網絡。本章還研究瞭機器學習最常用的技術,創建綫性迴歸和logistic迴歸的假設語句。
第6章介紹瞭機器學習最強大的人工神經網絡算法。我們將看到這些網絡如何成為大腦神經元的簡化模型。
第7章討論瞭特徵的不同類型,即定量特徵、有序特徵和分類特徵。我們還將詳細學習如何結構化和變換特徵。
第8章解釋瞭集成機器學習背後的動機和成因,其來源於清晰的直覺並具有豐富的理論曆史基礎。集成機器學習的類型在於模型本身,以及圍繞著三個主要問題(如何劃分數據、如何選擇模型、如何組閤其結果)的考量。
第9章著眼於一些設計策略,以確保你的機器學習係統最優。我們將學習模型選擇和參數調優技術,並將所學知識應用於一些案例研究之中。
閱讀前的準備工作
你需要有學習機器學習的意願,並需要下載安裝Python3。Python3的下載地址是:https://www.python.org/downloads/。
本書的讀者對象
本書的讀者包括數據學傢、科學傢,或任何好奇的人。你需要具備一些綫性代數和Python編程的基礎,對機器學習的概念有基本瞭解。
機器學習係統設計:Python語言實現 下載 mobi pdf epub txt 電子書 格式 2024
機器學習係統設計:Python語言實現 下載 mobi epub pdf 電子書書不錯就是看不懂好書好書
評分經常網購,總有大量的包裹收,感覺寫評語花掉瞭我大量的時間和精力!所以在一段時間裏,我總是我又總是覺得好像不去評價或者隨便寫寫!但是,有點對不住那些辛苦工作的賣傢客服、倉管、老闆。於是我寫下瞭一小段話,給我覺得能拿到我五星好評的賣傢的寶貝評價裏麵以示感謝和尊敬!首先,寶貝是性價比很高的,我每次都會先試用再評價的,雖然寶貝不一定是最好的,但在同等的價位裏麵絕對是錶現最棒的。京東的配送絕對是一流的,送貨速度快,配送員服務態度好,每樣東西都是送貨上門。希望京東能再接再厲,做得更大更強,提供更多更好的東西給大傢。為京東的商品和服務點贊。
評分很好,塑封包裝,完好無損
評分京東買書就是方便,快遞很好。什麼東西都在這裏買瞭
評分的賣傢客服、倉管、老闆。於是我寫下瞭一小段話,給我
評分應該是不錯的書。正版。送貨快。上圖。
評分封麵有皺痕,印刷可以。
評分便寫寫!但是,我又總是覺得好像有點對不住那些辛苦工作
評分幾年前逛京東還不是那麼的信任京東,現在信賴首選京東,
機器學習係統設計:Python語言實現 mobi epub pdf txt 電子書 格式下載 2024