揭秘深度強化學習 pdf epub mobi txt 電子書 下載 2024
☆☆☆☆☆
簡體網頁||
繁體網頁
彭偉
水利水電齣版社
2018-5-1
360
89.80元
平裝
9787517062387
圖書標籤:
深度學習
強化學習
計算科學
計算機
【考慮】
DL
喜歡 揭秘深度強化學習 的讀者還喜歡
下載链接在页面底部
點擊這裡下載
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!
发表于2024-11-13
揭秘深度強化學習 epub 下載 mobi 下載 pdf 下載 txt 電子書 下載 2024
揭秘深度強化學習 epub 下載 mobi 下載 pdf 下載 txt 電子書 下載 2024
揭秘深度強化學習 pdf epub mobi txt 電子書 下載 2024
圖書描述
深度強化學習(Deep Reinforcement Learning,DRL)是深度學習算法和強化學習算法的巧妙結閤,它是一種新興的通用人工智能算法技術,也是機器學習的前沿技術,DRL 算法潛力無限,AlphaGo 是目前該算法*成功的使用案例。DRL 算法以馬爾科夫決策過程為基礎,是在深度學習強大的非綫性函數的擬閤能力下構成的一種增強算法。深度強化學習算法主要包括基於動態規劃(DP)的算法以及基於策略優化的算法,本書的目的就是要把這兩種主要的算法(及設計技巧)講解清楚,使算法研究人員能夠熟練地掌握。
《揭秘深度強化學習人工智能機器學習技術叢書》共10 章,首先以AlphaGo 在圍棋大戰的偉大事跡開始,引起對人工智能發展和現狀的介紹,進而介紹深度強化學習的基本知識。然後分彆介紹瞭強化學習(重點介紹濛特卡洛算法和時序差分算法)和深度學習的基礎知識、功能神經網絡層、捲積神經網絡(CNN)、循環神經網絡(RNN),以及深度強化學習的理論基礎和當前主流的算法框架。*後介紹瞭深度強化學習在不同領域的幾個應用實例。引例、基礎知識和實例相結閤,方便讀者理解和學習。
《揭秘深度強化學習 人工智能機器學習技術叢書》內容豐富,講解全麵、語言描述通俗易懂,是深度強化學習算法入門的*選擇。本書適閤計算機專業本科相關學生、人工智能領域的研究人員以及所有對機器學習和人工智能算法感興趣的人員。
揭秘深度強化學習 下載 mobi epub pdf txt 電子書
著者簡介
圖書目錄
第1章 深度強化學習概覽
1.1 什麼是深度強化學習?
1.1.1 俯瞰強化學習
1.1.2 來一杯深度學習
1.1.3 Hello,深度強化學習
1.2 深度強化學習的學習策略
1.3 本書的內容概要
參考文獻
第2章 強化學習基礎
2.1 真相--經典的隱馬爾科夫模型(HMM)
2.1.1 HMM引例
2.1.2 模型理解與推導
2.1.3 隱馬爾科夫應用舉例
2.2 逢考必過—馬爾科夫決策過程(MDP)
2.2.1 MDP生活化引例
2.2.2 MDP模型
2.2.3 MDP模型引例
2.2.4 模型理解
2.2.5 探索與利用
2.2.6 值函數和動作值函數
2.2.7 基於動態規劃的強化問題求解
2.3 糟糕,考試不給題庫—無模型強化學習
2.3.1 濛特卡洛算法
2.3.2 時序差分算法
2.3.3 異步強化學習算法
2.4 學霸來瞭--強化學習之模仿學習
2.4.1 模仿學習(Imitation Learning)
2.4.2 逆強化學習
本章總結
參考
第3章 深度學習基礎
3.1 深度學習簡史
3.1.1 神經網絡發展史
3.1.2 深度學習的分類
3.1.3 深度學習的應用
3.1.4 深度學習存在的問題
3.2 深度學習基礎概念
3.2.1 深度學習總體感知
3.2.2 神經網絡的基本組成
3.2.3 深度學習訓練
3.2.4 梯度下降法
3.2.5 反嚮傳播算法(BP)
3.3 數據預處理
3.3.1 主成分分析(PCA)
3.3.2 獨立成分分析(ICA)
3.3.3 數據白化處理
3.4 深度學習硬件基礎
3.4.1 深度學習硬件基礎
3.4.2 GPU簡介
3.4.3 CUDA編程
本章總結
參考
第4章 功能神經網絡層
4.1 激活函數單元
4.2 池化層Pooling layer
4.3 參數開關Dropout
4.4 批量歸一化層(Batch normalization layer)
4.5 全連接層
4.6 捲積神經網絡
4.7 全捲積神經網絡
4.8 循環(遞歸)神經網絡(RNN)
4.9 深度學習的
本章總結
參考
第5章 捲積神經網絡(CNN)
5.1 捲積神經網絡 CNN 基礎
5.1.1 捲積神經網絡的曆史
5.1.2 捲積神經網絡的核心
5.2 捲積神經網絡 CNN 結構
5.2.1 深度捲積神經網絡CNN
5.2.2 深度捲積神經網絡CNN可視化
5.3 經典捲積神經網絡架構分析
5.3.1 一切的開始--LeNet
5.3.2 王者迴歸--AlexNet
5.3.3 起飛的時候--VGG
5.3.4 緻敬經典GoogLeNet
5.3.5 沒有最深隻有更深--ResNet
5.4 對抗網絡
5.4.1 對抗網絡(GAN)
5.4.2 WGAN
5.5 RCNN
5.6 CNN的應用實例
本章總結
參考
第6章 循環神經網絡(RNN)
6.1 RNN概覽
6.2 長期依賴(Long-Term Dependencies)問題
6.3 LSTM 的變體
本章總結
參考
第7章:如何寫自己的CNN—C語言實現深度學習
7.1 如何寫自己的CMake文件
7.2 如何寫自己神經網絡
7.2.1 激活函數
7.2.2 池化函數
7.2.3 全連接層
7.3 捲積神經網絡
7.3.1 CNN網絡的構建
7.3.2 CNN前嚮傳播
7.3.3 CNN的反嚮傳播
7.4 文件解析
本章總結
第8章 深度強化學習
8.1 初識深度強化學習
8.1.1 深度強化學習概覽
8.1.2 記憶迴放(Memory-Replay)機製
8.1.3 濛特卡羅搜索樹
8.2 深度強化學習(DRL)中的值函數算法
8.2.1 DRL中值函數的作用
8.2.2 DRL中值函數理論推導
8.3 深度強化學習中的策略梯度(Policy Gradient)
8.3.1 策略梯度的作用和優勢
8.3.2 策略梯度的理論推導
8.3.3 REINFORCE算法
8.3.4 策略梯度的優化算法
8.3.5 策略子-評判算法(Actor-Critic)
8.4 深度強化學習網絡結構
參考
第9章 深度強化學習算法框架
9.1 深度Q學習
9.2 雙Q學習
9.3 異步深度強化學習
9.4 異步優越性策略子-評價算法
9.5 DDPG 算法:
9.6 值迭代網絡
本章總結
參考
第10章 深度強化學習應用實例
10.1 Flappy Bird 應用
10.2 Play Pong 應用
10.3 深度地形-自適應應用(Deep Terrain-adaptive應用)
10.4 AlphaGo 254
10.4.1 獨立算法的研究部分
10.4.2 AlphaGo算法
本章總結
參考
附錄: 常用的深度學習框架
F.1. 榖歌TensorFlow
F.1.1 TensorFlow 簡介
F.1.2 TensorFlow 基礎
F.2 輕量級MXNet
F.2.1 MXnet介紹
F.2.2 MXnet基礎
F.3 來至UCLA 的Caffe
F.3.1 Caffe 簡介
F3.2 Caffe基礎
F.4 悠久的 Theano
F.4.1 Theano簡介
F.4.2 Theano基礎
F.5 30s 入門的Keras
參考
· · · · · · (
收起)
揭秘深度強化學習 pdf epub mobi txt 電子書 下載
用戶評價
評分
☆☆☆☆☆
前言不搭後語,解釋的也不清楚。講來講去都那些話,可是連那些話都說不清。看得我雲裏霧裏。還不如上網找網課看呢。。。(ps:被老師要求讀這本書,但真覺得這本書寫的不清不楚的(ಥ_ಥ))
評分
☆☆☆☆☆
劃水內容的比較多,作為深度學習的入門勉強可以(給3星),但是作為強化學習的入門有點過於牽強(給1星)。1 插圖希望盡可能是作者自己的圖,不要網上截圖來直接作為插圖。2 強化學習希望脈絡可以梳理清晰,不要直接列齣幾個DQN、DDQN、DDPG等較新的算法,強化學習的基礎可以給一給嗎?
評分
☆☆☆☆☆
非常想吐槽這本書,書名是揭秘深度強化學習,結果這本書快結束瞭纔開始講深度強化學習。而且作者總喜歡扯一點和這本書沒什麼關係的東西。總體上這本書給我感覺邏輯很混亂,不推薦看。
評分
☆☆☆☆☆
看目錄以為會寫得有趣,結果真正看內容後發現很糟糕。很多前因後果根本沒有講清楚,亂糟糟的,這本書寫齣來為瞭撈錢?
評分
☆☆☆☆☆
一星嫌多,作者是不是文科生
讀後感
評分
☆☆☆☆☆
看完感觉这本书更多是为了圈钱,就开头结尾的章节介绍了下强化学习相关的内容,而中间几乎一半的篇幅是在讲深度学习,卷积神经网络的基础,卷积层、全连接和一些激活函数的前向和后向的推导,代码实现,感觉当时买的时候也没有认真看目录。不过前面介绍强化学习部分还是有点用...
評分
☆☆☆☆☆
看完感觉这本书更多是为了圈钱,就开头结尾的章节介绍了下强化学习相关的内容,而中间几乎一半的篇幅是在讲深度学习,卷积神经网络的基础,卷积层、全连接和一些激活函数的前向和后向的推导,代码实现,感觉当时买的时候也没有认真看目录。不过前面介绍强化学习部分还是有点用...
評分
☆☆☆☆☆
看完感觉这本书更多是为了圈钱,就开头结尾的章节介绍了下强化学习相关的内容,而中间几乎一半的篇幅是在讲深度学习,卷积神经网络的基础,卷积层、全连接和一些激活函数的前向和后向的推导,代码实现,感觉当时买的时候也没有认真看目录。不过前面介绍强化学习部分还是有点用...
評分
☆☆☆☆☆
看完感觉这本书更多是为了圈钱,就开头结尾的章节介绍了下强化学习相关的内容,而中间几乎一半的篇幅是在讲深度学习,卷积神经网络的基础,卷积层、全连接和一些激活函数的前向和后向的推导,代码实现,感觉当时买的时候也没有认真看目录。不过前面介绍强化学习部分还是有点用...
評分
☆☆☆☆☆
看完感觉这本书更多是为了圈钱,就开头结尾的章节介绍了下强化学习相关的内容,而中间几乎一半的篇幅是在讲深度学习,卷积神经网络的基础,卷积层、全连接和一些激活函数的前向和后向的推导,代码实现,感觉当时买的时候也没有认真看目录。不过前面介绍强化学习部分还是有点用...
類似圖書 點擊查看全場最低價
揭秘深度強化學習 pdf epub mobi txt 電子書 下載 2024