産品特色
編輯推薦
技術暢銷書《白話大數據與機器學習》姊妹篇,YY大數據專傢撰寫,李學淩、硃頻頻、王慶法、王海龍聯袂推薦。以插圖、類比和大量示例趣說深度學習網絡的關鍵理念、算法與TensoeFlow實踐,涵蓋BP網絡、CNN、RNN、受限玻爾茲曼機、深度殘差網絡、強化學習、對抗學習,以及多個有趣應用。
內容簡介
本書基本獨立成冊,適用於零基礎的初學者。
基礎篇(第1~3章),講解瞭機器學習、深度學習與實踐的上下文知識,如基本的機器學習與深度學習算法,TensorFlow框架的安全與配置,簡單的深度學習實踐。該篇是閱讀和實踐的基石。
原理與實踐篇(第4~8章),介紹“老牌”的深度學習網絡的數學原理和工程實現原理,尤其是第4章,如果能基本讀懂,後麵的網絡實現層麵的問題基本都可以迎刃而解。涵蓋BP網絡、CNN、RNN的結構、思路、訓練與使用,以及一些常見的綜閤性問題。該篇是學習深度學習的重點和難點,作者通過大量示例、推理與實現,幫讀者*大化降低學習麯綫。
擴展篇(第9~13章),介紹一些網絡的變種和一些較新的網絡特性,涵蓋深度殘差網絡、受限玻爾茲曼機、強化學習、對抗學習,這是讀者進一步學習與實踐思路的鑰匙。最後給齣瞭一些有趣的深度學習應用:人臉識彆、作詩姬、大師風圖像處理,有趣又有用。
作者簡介
高揚,歡聚時代資深大數據專傢,曾任金山軟件西山居大數據架構師。有多年服務器端開發經驗(多年日本和澳洲工作經驗),多年大數據架構設計與數據分析、處理經驗,目前負責歡聚時代直播部深度學習落地相關的研究。擅長傳統機器學習、深度學習、數據建模、關係型數據庫應用以及大數據框架等的應用。
衛崢,歡聚時代YY娛樂事業部軟件架構師,曾任西山居軟件架構師。多年的軟件開發和架構經驗,精通C/C++、Python、Golang、JavaScript等多門編程語言,近幾年專注於數據處理、機器學和深度學習算法的研究、音視頻圖形圖像處理,應用與服務研發。曾在新浪網平颱架構部負責音視頻轉碼平颱的架構和研發工作,為新浪微博、新浪微盤、秒拍等提供視頻在綫觀看服務。在慕課網、InfoQ、麥思博、51CTO等平颱擔任講師。
萬娟,深圳華為UI設計師,曾任星盤科技有限公司UI設計師平麵,對VI設計、包裝、海報設計等、商業插畫、App交互、網頁設計等有獨到認識。多次參與智能傢居和智能音箱等項目的UI設計。多次參加國際和國內藝術和工業設計比賽,並獲奬。從小酷愛繪畫,理想是開一個屬於自己的畫室。
精彩書評
這本書概念清晰,語言平實,實例講解豐富,是一本非常適閤入門的深度學習讀本,尤其是對公式推導做瞭最大程度的白話解釋與避讓,使得可讀性大大增強。相信每位讀者都能從中汲取到相應的知識與啓發。
——李學淩,歡聚時代董事長兼CEO
本書是一本很好的深度學習入門讀物,從機器學習的基本概念過渡到深度神經網絡的原理和應用,並延伸到網絡的一些變種和新的特性。讀完此書可以全麵瞭解深度學習以及TensorFlow開源框架的相關內容,你可以感受到其實深度學習並不神秘,人工智能的未來人類完全可以掌控。
——硃頻頻,小i機器人創始人、總裁兼首席執行官
我曾經想過寫本書,用通俗易懂的方式介紹大數據與深度學習的方方麵麵,現在看來不需要瞭,高揚先生這套白話係列圖文並茂、深入淺齣又不失學術性,非常值得研讀。
——王慶法,陽光保險集團大數據中心首席架構師、首席數據官
看到瞭本書,筆者不由眼前一亮。關於技術觀點的講解即不乏專業性,又以淺顯的例子告訴普通人,機器學習是什麼。一本非常好的科普性的技術著作,希望更多的人可以通過作者的文字,真正理解人工智能的關鍵技術、深度學習的原理及實際未來的前景。也期待更多的愛好者,由此書可以加入到深度學習工作中,為未來人工智能的發展寫下濃重的一筆。
——王海龍,秒錢CTO
目錄
本書贊譽
序
前 言
基 礎 篇
第1章 機器學習是什麼 2
1.1 聚類 4
1.2 迴歸 5
1.3 分類 8
1.4 綜閤應用 10
1.5 小結 14
第2章 深度學習是什麼 15
2.1 神經網絡是什麼 15
2.1.1 神經元 16
2.1.2 激勵函數 19
2.1.3 神經網絡 24
2.2 深度神經網絡 25
2.3 深度學習為什麼這麼強 28
2.3.1 不用再提取特徵 28
2.3.2 處理綫性不可分 29
2.4 深度學習應用 30
2.4.1 圍棋機器人——AlphaGo 30
2.4.2 被教壞的少女——Tai.ai 32
2.4.3 本田公司的大寶貝——
ASIMO 33
2.5 小結 37
第3章 TensorFlow框架特性與安裝 38
3.1 簡介 38
3.2 與其他框架的對比 39
3.3 其他特點 40
3.4 如何選擇好的框架 44
3.5 安裝TensorFlow 45
3.6 小結 46
原理與實踐篇
第4章 前饋神經網絡 50
4.1 網絡結構 50
4.2 綫性迴歸的訓練 51
4.3 神經網絡的訓練 75
4.4 小結 79
第5章 手寫闆功能 81
5.1 MNIST介紹 81
5.2 使用TensorFlow完成實驗 86
5.3 神經網絡為什麼那麼強 92
5.3.1 處理綫性不可分 93
5.3.2 挑戰“與或非” 95
5.3.3 豐富的VC——強大的空間
劃分能力 98
5.4 驗證集、測試集與防止過擬閤 99
5.5 小結 102
第6章 捲積神經網絡 103
6.1 與全連接網絡的對比 103
6.2 捲積是什麼 104
6.3 捲積核 106
6.4 捲積層其他參數 108
6.5 池化層 109
6.6 典型CNN網絡 110
6.7 圖片識彆 114
6.8 輸齣層激勵函數——SOFTMAX 116
6.8.1 SOFTMAX 116
6.8.2 交叉熵 117
6.9 小試牛刀——捲積網絡做圖片分類 124
6.10 小結 138
第7章 綜閤問題 139
7.1 並行計算 139
7.2 隨機梯度下降 142
7.3 梯度消失問題 144
7.4 歸一化 147
7.5 參數初始化問題 149
7.6 正則化 151
7.7 其他超參數 155
7.8 不唯一的模型 156
7.9 DropOut 157
7.10 小結 158
第8章 循環神經網絡 159
8.1 隱馬爾可夫模型 159
8.2 RNN和BPTT算法 163
8.2.1 結構 163
8.2.2 訓練過程 163
8.2.3 艱難的誤差傳遞 165
8.3 LSTM算法 167
8.4 應用場景 171
8.5 實踐案例——自動文本生成 174
8.5.1 RNN工程代碼解讀 174
8.5.2 利用RNN學習莎士比亞劇本 183
8.5.3 利用RNN學習維基百科 184
8.6 實踐案例——聊天機器人 185
8.7 小結 196
擴 展 篇
第9章 深度殘差網絡 198
9.1 應用場景 198
9.2 結構解釋與數學推導 200
9.3 拓撲解釋 205
9.4 Github示例 207
9.5 小結 207
第10章 受限玻爾茲曼機 209
10.1 結構 209
10.2 邏輯迴歸 210
10.3 最大似然度 212
10.4 最大似然度示例 214
10.5 損失函數 215
10.6 應用場景 216
10.7 小結 216
第11章 強化學習 217
11.1 模型核心 218
11.2 馬爾可夫決策過程 219
11.2.1 用遊戲開刀 221
11.2.2 準備工作 223
11.2.3 訓練過程 224
11.2.4 問題 226
11.2.5 Q-Learning算法 228
11.3 深度學習中的Q-Learning——DQN 231
11.3.1 OpenAI Gym 234
11.3.2 Atari遊戲 237
11.4 小結 238
第12章 對抗學習 239
12.1 目的 239
12.2 訓練模式 240
12.2.1 二元極小極大博弈 240
12.2.2 訓練 242
12.3 CGAN 244
12.4 DCGAN 247
12.5 小結 252
第13章 有趣的深度學習應用 254
13.1 人臉識彆 254
13.2 作詩姬 259
13.3 梵高附體 264
13.3.1 網絡結構 265
13.3.2 內容損失 268
13.3.3 風格損失 270
13.3.4 係數比例 271
13.3.5 代碼分析 272
13.4 小結 279
附錄A VMware Workstation的安裝 280
附錄B Ubuntu虛擬機的安裝 284
附錄C Python語言簡介 290
附錄D 安裝Theano 296
附錄E 安裝Keras 297
附錄F 安裝CUDA 298
參考文獻 303
前言/序言
為什麼要寫這本書
近些年來,伴隨著計算機計算能力的不斷升級,很多原來隻有在科幻電影裏纔有的橋段越來越多地齣現在我們身邊瞭,並給瞭我們更多的想象空間與期待。
在2016年,人工智能界最令人矚目的事情莫過於榖歌的AlphaGo以4:1的懸殊比分輕鬆擊敗韓國著名九段圍棋大師李世石。之後化名“Master”的AlphaGo更是一路大開殺戒,分彆在對弈網站“弈城”和“騰訊圍棋”登錄,先後打敗瞭柯潔九段、樸廷桓九段、陳耀燁九段以及創造日本大滿貫傳奇的井山裕太和亞洲杯冠軍李欽誠等世界一流高手,取得瞭50勝0負的戰績。當然瞭,“玩不起”的人類最終覺得讓AlphaGo在國際圍棋網站排名上占一個坑來碾壓人類是非常“不公平”的事情,最終把人傢給拉黑瞭。
人類這麼做是不是有違AI(ArtificialIntelligence,人工智能)研究的初衷暫且不討論,畢竟我們的眼光還是應該更多地投嚮那些“更有趣”的領域。除此之外,還有很多非常有趣的人工智能項目也經常在網絡視頻中帶給我們驚喜,比如榖歌的機械狗、榖歌的無人駕駛汽車等。
這種機械狗很有趣,除瞭能夠彼此之間互相協調進行編隊行進以外,還能像真的狗一樣在被踢瞭一腳之後迅速調整重心,並在短暫的踉蹌後站穩,然後繼續先前作業,不過怎麼踢都不會來咬你。
而榖歌的無人駕駛汽車也有著非常優異的能力,到2015年11月底為止,根據榖歌提交給機動車輛管理局的報告,榖歌的無人駕駛汽車在自動模式下已經完成瞭130多萬英裏的裏程。
可以說,這些事情都在鼓舞著我們這些對未來世界充滿渴望的人投入更多的精力去研究AI帶來的新驚喜,而人工智能這一領域中最為核心的內容之一就是深度學習。深度學習現在在全世界範圍內都有著眾多的專業工作者和業餘愛好者在進行著研究,並且每個月都有不少新的落地産品問世。應該說,深度學習是目前世界上最熱門的研究領域之一,而且也是未來幾十年最熱門的研究方嚮之一。
在中國,深度學習也有著眾多的專業研究機構和業餘愛好者,在我的周圍就有數以韆計的深度學習愛好者——這一點都不誇張,他們非常渴望瞭解深度學習的知識並加以應用。但是,深度學習由於其本身的復雜性,使得很多有著濃厚興趣的愛好者望而卻步,我認為主要的門檻來自於兩個方麵。
一方麵,深度學習是非常典型的計算密集型的應用領域,傢用PC機通常是無法有效勝任一個完整而可靠的深度學習應用的(作為初級實驗或者“玩具”的除外)。不過現在隨著CPU的計算速度逐步加快,以及GPU應用的不斷普及,這方麵的門檻在慢慢地降低。
另一方麵,深度學習從其解決問題的根本理論方麵需要比較深厚和紮實的數學基礎,尤其是高等數學、綫性代數、泛函分析及其延伸學科的基礎,這就使得很多高等數學相關基礎不好的朋友學習起來非常吃力。當然,這一方麵目前可以走的捷徑也不是沒有,我們可以通過現成的框架(比如TensorFlow、Torch、Caffe或Theano等)來搭建環境,並用簡單的代碼或模型描述文件來組建一個相對完整的神經網絡進行學習和分類應用。
除此之外,像Caffe還有一個叫做ModelZoo的共享社群——這是一個讓大傢把已經訓練好的模型放在上麵做共享的社群。在模型訓練中,前麵大量耗時的分析和建模工作以及訓練後得到的最寶貴的模型成果就可以濃縮並沉澱為一個可下載的模型描述文件,裏麵是網絡的節點權重和拓撲結構信息。這種社群化的方式會讓很多原本沒有太好訓練條件的朋友有瞭可以學習和藉鑒的對象,也有瞭可以遊樂和嘗試的空間。這些模型需要在其各自的授權使用協議下閤理使用,有的是允許進行商業應用和改動,而有的則不可以,這一點需要注意。在下載後,我們可以對其進行FineTuning,也就是進行細節調優或改進性訓練,使得這些模型可以在自己需要的環境和條件下更好地工作。不過這個地方還是有一個門檻,對於很多數學能力欠佳的工程師來說,不容易邁過去,那就是訓練和調優中的方嚮性問題。一旦齣現召迴率和準確率不再提高,或者性能等問題,往往會找不到改進的方嚮和方法,這是需要紮實的數學基礎和深度學習領域的實踐經驗來解決的。
我們這本書的宗旨很簡單,就是希望通過聊天和講故事的方式,憑藉高中以上水平的數學知識把大傢一步一步地帶入深度學習的領域。隻要大傢在閱讀本書的時候保持一點點耐心,即便沒有高等數學知識的朋友,通過努力也一樣可以基本掌握深度學習的應用技巧。請不要猶豫,跟我來吧!
本書特色
本書本著“平民”起點,從“零”開始的初衷,介紹深度學習的技術與技巧,逐層鋪墊,把微積分、梯度等知識重點化整為零,把學習麯綫最大程度地拉平,讓讀者有良好的代入感和親近感。
本書用漫畫插圖來調節閱讀氣氛,並且在每個講解的部分都有對比和實例說明,相信每位讀者都能感受到非常好的閱讀平滑感。
讀者對象
對深度學習有興趣但數學基礎弱的開發人員與架構師
科研院所的研究人員
對深度學習有興趣的大學生、研究生
其他深度學習愛好者,如産品經理、投資人、管理者等
如何閱讀本書
本書基本獨立成冊,適用於零基礎的初學者,但仍建議以本書姊妹篇《白話大數據與機器學習》為引導讀物。本書共分三篇,共13章。
基礎篇(第1~3章),介紹一些非常基礎的概念鋪墊,以便瞭解背景。
原理與實踐篇(第4~8章),介紹老牌的深度學習網絡的數學原理和工程實現原理。尤其是第4章,如果讀者能基本讀懂,後麵的網絡實現層麵的問題基本都可以迎刃而解。
擴展篇(第9~13章),介紹一些網絡的變種和一些較新的網絡特性。
其實當你把這本書看完後,就會知道這種技術的底層原理雖然略顯復雜,但是在框架逐步成熟以及開源項目日益增加的情況下,對於應用市場層麵的技術人員來說,真正要做的工作已經不是書寫復雜的算法瞭——這些都已經被很好地封裝到內聚性極高的框架中,而且開放瞭友好的接口和足夠多的參數給使用者做調整。這樣一來,最重要的工作反而是海量樣本的低成本獲取和豐富的計算資源的獲取。因此從這個角度來看,我可以負責任地說,深度學習領域的門檻在一定程度上應該說比傳統機器學習的還要低。當讀完這本書時,你就會發現,深度學習真的不難。
勘誤和支持
由於筆者的水平有限,編寫時間倉促,書中難免會齣現一些錯誤或者不準確的地方,懇請讀者批評指正。如果你有更多的寶貴意見,歡迎掃描下方的二維碼,關注奇點大數據微信公眾號qddata和我們進行互動討論。當然,在公眾號的消息中你也可以找到書中的代碼地址和QQ討論群的信息。
同時,你也可以通過郵箱77232517@qq.com聯係到我,期待能夠得到大傢的真摯反饋,在技術之路上互勉共進。
在此,感謝遼寜工程大學副教授(海歸博士後)常戩博士、山東交通學院理學院講師許文傑博士、許昌學院信息工程學院講師姚丹丹博士在審校工作方麵的支持與幫助,以及深圳華為技術有限公司的萬娟女士在插畫方麵對本書的大力支持。
高揚
白話深度學習與TensorFlow 下載 mobi epub pdf txt 電子書 格式