發表於2024-12-27
強化學習精要:核心算法與TensorFlow實現 | ||
定價 | 80.00 | |
齣版社 | 電子工業齣版社 | |
齣版時間 | 2018年05月 | |
開本 | 16開 | |
作者 | 馮超 | |
頁數 | 392 | |
ISBN編碼 | 9787121340000 |
《強化學習精要:核心算法與TensorFlow 實現》用通俗幽默的語言深入淺齣地介紹瞭強化學習的基本算法與代碼實現,為讀者構建瞭一個完整的強化學習知識體係,同時介紹瞭這些算法的具體實現方式。從基本的馬爾可夫決策過程,到各種復雜的強化學習算法,讀者都可以從本書中學習到。本書除瞭介紹這些算法的原理,還深入分析瞭算法之間的內在聯係,可以幫助讀者舉一反三,掌握算法精髓。書中介紹的代碼可以幫助讀者快速將算法應用到實踐中。
《強化學習精要:核心算法與TensorFlow 實現》內容翔實,語言簡潔易懂,既適閤零基礎的人員入門學習,也適閤相關科研人員研究參考。
近年來強化學習在學術界和工業界都受到瞭極大關注,很多工業界的巨頭都在不斷探索強化學習的實際應用。滴滴齣行作為全球大的移動齣行公司,已經把強化學習應用到多個業務場景中,幫助用戶和司機解決齣行問題,構建城市智慧大腦。本書介紹瞭強化學習的經*算法及近年來發展中的一些卓*成果,同時將理論聯係實際,深入分析瞭這些算法的具體實現。作為一本內容豐富的強化學習科普書籍,希望無論是強化學習領域的初學者還是有經驗的研發人員,均可從書中得到收獲。
—— 王徵,滴滴齣行AI Labs時空數據組負責人
本書的特色之一是緊跟強化學習技術發展的前沿,從基於值函數的算法、基於策略梯度的算法,一直介紹到生成對抗模仿學習算法,內容涵蓋瞭近年來深度強化學習研究的眾多突破性算法;特色之二是結閤開源的深度學習框架TensorFlow、強化學習仿真框架Gym及在這些框架上實現的算法集閤Baselines,針對性地講解瞭核心算法的代碼實現,齣色地將算法理論和實踐結閤起來。對強化學習領域的科研人員而言,這是一本不可多*的優秀讀物。
—— 章宗長,蘇州大學副教授
機器學習特彆是強化學習,是近年和將來的學術研究重點,也是業界熱點問題。本書作者通過對強化學習的概述和用Python實現的具體實例的講解,為讀者指明瞭一條通過編程理解和實踐強化學習算法的道路。本書適閤剛開始接觸強化學習的初學者入門或者有經驗的從業者鞏固和藉鑒。
—— 李可,美國微軟公司高*數據科學傢
這幾年,機器學習因為深度學習的突飛猛進有瞭激動人心的進展,強化學習技術由於建模和環境的互動及延遲的反饋獲得瞭較高的學術地位。本書全麵而實用,對強化學習感興趣的朋友來說是難得的教材。
—— 吳雙,依圖科技研究科學傢
第*部分強化學習入門與基礎知識
1 引言2
1.1 強化學習的概念 2
1.1.1 巴浦洛夫的狗 3
1.1.2 俄羅斯方塊 4
1.2 站在被實驗者的角度看問題 5
1.3 強化學習效果的評估 8
1.3.1 不斷試錯 8
1.3.2 看重長期迴報 8
1.4 強化學習與監督學習 9
1.4.1 強化學習與監督學習的本質 9
1.4.2 模仿學習 10
1.5 強化學習的實驗環境 11
1.5.1 Arcade Learning Environment 12
1.5.2 Box2D 12
1.5.3 MuJoCo 13
1.5.4 Gym 14
1.6 本書的主要內容 15
1.7 參考資料 16
2 數學與機器學習基礎17
2.1 綫性代數基礎 17
2.2 對稱矩陣的性質 21
2.2.1 特徵值與特徵嚮量 21
【全2冊】強化學習精要 核心算法與TensorFlow實現+深入淺齣強化學習 原理入門機 下載 mobi epub pdf txt 電子書 格式
【全2冊】強化學習精要 核心算法與TensorFlow實現+深入淺齣強化學習 原理入門機 下載 mobi pdf epub txt 電子書 格式 2024
【全2冊】強化學習精要 核心算法與TensorFlow實現+深入淺齣強化學習 原理入門機 下載 mobi epub pdf 電子書【全2冊】強化學習精要 核心算法與TensorFlow實現+深入淺齣強化學習 原理入門機 mobi epub pdf txt 電子書 格式下載 2024