決策用強化與係統性機器學習 pdf epub mobi txt 電子書下載2025

簡體網頁||繁體網頁

☆☆☆☆☆

出版者:機械工業齣版社

作者:［印度］巴拉格·庫爾卡尼（Parag Kulkarni）

出品人:

頁數:0

译者:李寜

出版時間:2015-7

價格:79.00

裝幀:平裝

isbn號碼:9787111502418

叢書系列:國際電氣工程先進技術譯叢

圖書標籤:

機器學習
強化學習
機器學習
決策分析
係統性方法
算法
人工智能
數據科學
優化
模型
預測

下載連結在頁面底部

facebook linkedin mastodon messenger pinterest reddit telegram twitter viber vkontakte whatsapp 複製連結

想要找書就要到小美書屋

book.quotespace.org

立刻按 ctrl+D收藏本頁

你會得到大驚喜!!

具體描述

機器學習是人工智能領域中一個極其重要的研究方嚮。強化學習是機器學習中的一個重要分支。作為解決序貫優化決策的有效方法，強化學習有效地應用於計算科學、自動控製、機器人技術等各個領域。

當前，強化學習的核心任務是提高學習效率，本書就是針對此問題展開的。第1章介紹係統概念和增強機器學習，它建立瞭一個突齣的相同的機器學習係統範例；第2章將更多關注機器學習的基本原理和多視角學習；第3章關於強化學習；第4章處理機器學習係統和模型建立的問題；決策推理等重要的部分將在第5章展開；第6章討論瞭自適應機器學習；第7章討論瞭多視角和全局係統性機器學習；第8章討論瞭增量學習的需要和知識錶示；第9章處理瞭知識增長方麵的問題；第10章討論瞭學習係統的建立。

本書適閤於機器學習、自動化技術、人工智能等方麵的相關專業教師與研究生閱讀，也可供自然科學和工程領域相關研究人員參考。

著者簡介

圖書目錄

譯者序
原書前言
原書緻謝
關於作者
第1章強化與係統性機器學習1
11簡介1
12監督學習、無監督學習、半監督學習和強化學習1
13傳統機器學習方法和機器學習發展曆史3
14什麼是機器學習？6
15機器學習問題6
151學習的目標6
16學習模式7
17機器學習技術和範例9
18什麼是強化學習？11
19強化函數和環境函數12
110強化學習的需求13
111強化學習和機器智能14
112什麼是係統學習？14
113什麼是係統性機器學習？15
114係統性機器學習的重點15
115強化性機器學習和係統性機器學習16
116車輛檢測問題的案例研究16
117小結16
參考文獻17
第2章全係統原理、係統性和多視角的機器學習18
21簡介18
211什麼是係統性學習？19
212曆史20
22什麼是係統性機器學習？21
221基於事件的學習21
23廣義係統性機器學習框架23
231係統定義24
24多視角決策和多視角學習26
241基於完整信息的錶示32
242基於部分信息的錶示32
243單視角決策方案圖32
244雙重視角決策方案圖32
245多視角決策方案圖32
246定性信念網絡和影響圖33
25動態和交互式決策33
251交互決策圖33
252決策圖和影響圖中時間的角色34
253係統性視角的建立34
254信息整閤35
255建立典型決策方案圖35
256受限信息35
257多決策者係統在係統性學習中的角色35
26係統性學習框架39
261數學模型39
262係統性學習的方法39
263自適應係統性學習40
264係統性學習框架41
27係統分析41
28案例學習：在酒店行業中需要係統性學習43
29小結44
參考文獻44
第3章強化學習45
31簡介45
32學習決策者48
33迴報和奬勵的計算50
331方案和連續任務50
34強化學習和自適應控製51
35動態係統54
351離散事件動態係統54
36強化學習和控製55
37馬爾科夫性質和決策過程55
38價值函數56
381行動和價值56
39學習最優策略（有模型和無模型法）57
310動態規劃57
3101動態係統性質57
311自適應動態規則58
3111時間差分學習59
3112Q學習60
3113統一的視圖60
312範例——拳擊訓練器的強化學習61
313小結61
參考文獻61
第4章係統性機器學習和模型62
41簡介62
42係統學習的框架63
421影響空間64
422交互作用為中心的模型69
423以結果為中心的模型69
43捕捉係統視圖70
44係統交互的數學錶達73
45影響函數74
46決策影響分析74
461時空界限75
47小結80
第5章推理和信息集成82
51簡介82
52推理機製和需要83
521情景推理85
522推理確定影響85
53情景和推理的集成88
54統計推理和歸納91
541直接推理91
542間接推理91
543信息推理91
544歸納92
55純似然方法92
56貝葉斯範例推理93
561貝葉斯定理93
57基於時域推理93
58推理建立係統觀點94
581信息集成94
59小結96
參考文獻97
第6章自適應學習98
61簡介98
62自適應學習和自適應係統98
63什麼是自適應機器學習101
64基於方案的適應性和學習方法101
641動態適應性和情景感知的學習102
65係統學習和自適應學習104
651多學習器的使用105
652係統自適應機器學習108
653自適應應用的設計110
654自適應學習的需要和適應的原因111
655適應類型112
656自適應框架114
66競爭學習和自適應學習115
661適應性函數116
662決策網絡118
663自適應學習方案119
67範例120
671案例研究：基於自適應學習的文本120
672自適應學習的文檔挖掘121
68小結122
參考文獻122
第7章多視角和全局係統性的學習123
71簡介123
72多視角方案構建124
73多視角決策和多視角學習126
731視角結閤126
732影響圖和部分方案決策錶示圖127
733錶示決策方案圖（RDSD）130
734範例：部分方案決策錶示圖（PDSRD）錶示的不同視角獲取的城市信息131
74全局係統性學習和多視角途徑134
741分散信息整閤135
742多視角和全局係統知識錶示135
743什麼是多視角方案？135
744特定方案136
75基於多視角途徑的案例研究136
751交通控製器用多視角途徑137
752情感檢測用多視角途徑模型138
76多視角方法的局限性143
77小結143
參考文獻144
第8章增量學習和知識錶示145
81簡介145
82為什麼增量學習？146
83學習已經學會的147
831絕對增量學習148
832選擇增量學習149
84監督增量學習157
85增量無監督學習和增量聚類158
851增量聚類：任務160
852增量聚類：方法161
853閾值161
86半監督增量學習162
87增量與係統性學習163
88增量接近值和學習方法164
881增量學習方法1165
882增量學習方法2166
883計算C值增量166
89學習與決策模型169
810增量分類技術169
811案例分析：增量文檔分類170
812小結171
第9章知識增長：機器學習的視角173
91簡介173
92短暫的曆史和相關工作174
93知識增長和知識啓發178
931策略使用進行知識啓發178
932基於目標的知識啓發179
933基於過程的知識啓發179
94生命周期180
941知識水平181
942直接知識181
943間接知識182
944程序知識182
945問題182
946決策182
947知識生命周期183
95增量知識錶達184
96案例學習和遺忘學習186
97知識的擴充：技術和方法187
971知識增量技術187
972知識增量方法188
973提取知識的機製189
98啓發式學習190
99係統性機器學習和知識獲取190
991全方位知識獲取191
992係統知識管理和先進的機器學習192
910在復雜環境下的知識增量193
911案例研究193
9111銀行案例研究193
9112軟件開發公司194
9113雜貨集市/零售集市195
912小結195
參考文獻196
第10章構建學習係統197
101簡介197
102係統性學習係統197
1021學習單元199
1022知識庫200
1023性能單元200
1024反饋單元200
1025允許測量的係統200
103算法選擇201
1031k近鄰（kNN）201
1032支持嚮量機（SVM）202
1033質心法202
104知識錶示203
1041實用方案和案例研究203
105學習係統的設計204
106讓係統錶現得更智能204
107案例學習205
108整體知識框架和強化學習的應用205
1081智能算法的選擇207
109智能決策——部署和知識采集以及重用208
1010基於案例的學習：人體情感檢測係統209
1011復雜決策問題的整體視角211
1012知識錶示和資源查找213
1013組件215
10131範例215
1014學習係統和智能係統的未來216
1015小結217
附錄218
附錄A統計學習方法218
A1概率218
A11互斥事件218
A12獨立事件218
A2貝葉斯分類219
A21樸素貝葉斯分類220
A22貝葉斯分類器的優點和缺點221
A3迴歸221
A31綫性222
A32非綫性222
A33迴歸的其他方法222
A4粗糙集223
A41不可分辨關係223
A42集近似224
A43邊界區域224
A44粗糙集和清晰集224
A45約簡224
A46可有可無和不可缺少的屬性224
A5支持嚮量機224
參考文獻225
附錄B馬爾科夫過程225
B1馬爾科夫過程225
B11案例226
B12解決步驟226
B13長期227
B14馬爾科夫過程示例228
B2半馬爾科夫過程231
B21建議231
B22驗證232
B23推論232
· · · · · · (收起)