發表於2024-12-26
書名:揭秘深度強化學習 人工智能機器學習技術叢書
ISBN:9787517062387
定價:89.8
作者:彭偉 編著
CIP分類:TP181
中圖分類:機器學習-研究
印張:23.25
頁數:372
用紙:65全木漿
字數:357韆字
齣版日期:2018.5.1
開本:16開170*230
銷售分類:書籍/雜誌/報紙 >> 計算機/網絡 >> 計算機控製仿真與人工智能
廣告語:
AI人工智能和機器學習類圖書 深度強化學習算法入門圖書 AlphaGo核心算法揭秘 一本用C語言描述機器學習、深度學習的著作 1000行代碼 代碼源文件下載160多張學習示意圖 120多個公式 7年開發經驗
深度強化學習(Deep Reinforcement Learning,DRL)是深度學習算法和強化學習算法的巧妙結閤,它是一種新興的通用人工智能算法技術,也是機器學習的前沿技術,DRL算法潛力無限,AlphaGo是目前該算法成功的使用案例。DRL算法以馬爾科夫決策過程為基礎,是在深度學習強大的非綫性函數的擬閤能力下構成的一種增強算法。深度強化學習算法主要包括基於動態規劃(DP)的算法以及基於策略優化的算法,本書的目的就是要把這兩種主要的算法(及設計技巧)講解清楚,使算法研究人員能夠熟練地掌握。
《揭秘深度強化學習人工智能機器學習技術叢書》共10章,首先以AlphaGo在圍棋大戰的偉大事跡開始,引起對人工智能發展和現狀的介紹,進而介紹深度強化學習的基本知識。然後分彆介紹瞭強化學習(重點介紹濛特卡洛算法和時序差分算法)和深度學習的基礎知識、功能神經網絡層、捲積神經網絡(CNN)、循環神經網絡(RNN),以及深度強化學習的理論基礎和當前主流的算法框架。後介紹瞭深度強化學習在不同領域的幾個應用實例。引例、基礎知識和實例相結閤,方便讀者理解和學習。
《揭秘深度強化學習 人工智能機器學習技術叢書》內容豐富,講解全麵、語言描述通俗易懂,是深度強化學習算法入門的佳選擇。本書適閤計算機本科相關學生、人工智能領域的研究人員以及所有對機器學習和人工智能算法感興趣的人員。
《揭秘深度強化學習 人工智能機器學習技術叢書》是一本詳細介紹深度強化學習算法的入門類圖書,涉及深度學習和強化學習的相關內容,是人工智能前沿的研究方嚮。非常適閤想在下一代技術領域立足的人工智能和機器學習算法從業者學習和參考。
機器學習的一個分支是神經網絡;神經網絡模擬人的大腦,形成神經網絡模型,它可以包括很多層次,一般來講層次越深學習效果越好,很多層的神經網絡就是深度學習。
在傳統的機器學習中,主要分為非監督學習(unsupervised learning)、監督學習(supervised leaning)和強化學習。強化學習是對決策的學習,簡單來講,強化學習就是用奬勵機製,自己調節參數,讓算法越來越聰明。
深度強化學習,研究的是如何通過深度學習的方法來解決強化學習的問題。也就是深度學習和強化學習的結閤。
《揭秘深度強化學習 人工智能機器學習技術叢書》一書囊括瞭強化學習基礎知識、馬爾科夫決策過程、無模型強化學習、模仿學習、深度學習基礎知識、神經網絡基本組成、反嚮傳播算法、功能神經網絡層、循環神經網絡、捲積神經網絡(CNN)的基礎和結構、循環神經網絡(RNN)、深度強化學習基礎、濛特卡洛搜索樹、策略梯度算法、深度強化學習算法框架、深度Q學習、雙Q學習、異步優越性策略子-評價算法、深度強化學習應用實例等。
深度強化學習算法可應用於量化投資、遊戲智能、機器人決策、自動駕駛、無人機等。
目錄:
第1章 深度強化學習概覽
1.1 什麼是深度強化學習?
1.1.1 俯瞰強化學習
1.1.2 來一杯深度學習
1.1.3 Hello,深度強化學習
1.2 深度強化學習的學習策略
1.3 本書的內容概要
參考文獻
第2章 強化學習基礎
2.1 真相--經典的隱馬爾科夫模型(HMM)
2.1.1 HMM引例
2.1.2 模型理解與推導
2.1.3 隱馬爾科夫應用舉例
2.2 逢考必過—馬爾科夫決策過程(MDP)
揭秘深度強化學習 AI人工智能機器學習算法教程書籍 C語言描述機器學習 深度強化學習算法入門書籍 下載 mobi epub pdf txt 電子書 格式
揭秘深度強化學習 AI人工智能機器學習算法教程書籍 C語言描述機器學習 深度強化學習算法入門書籍 下載 mobi pdf epub txt 電子書 格式 2024
揭秘深度強化學習 AI人工智能機器學習算法教程書籍 C語言描述機器學習 深度強化學習算法入門書籍 下載 mobi epub pdf 電子書揭秘深度強化學習 AI人工智能機器學習算法教程書籍 C語言描述機器學習 深度強化學習算法入門書籍 mobi epub pdf txt 電子書 格式下載 2024