譯者序
原書前言
第 1章 安裝和快速啓動 1
1.1 安裝準備 1
1.1.1 安裝 R 1
1.1.2 安裝 Python 2
1.1.3 隱私保護 2
1.1.4 安裝 Java 2
1.2 利用 R(CRAN)安裝 H2O 3
1.3 利用 Python(pip)安裝 H2O 4
1.4 diyi個學習示例 5
1.4.1 利用 Python進行訓練和預測 8
1.4.2 利用 R進行訓練和預測 10
1.4.3 性能與預測 12
1.4.4 運氣不佳 13
1.5 Flow 13
1.5.1 數據 14
1.5.2 模型 16
1.5.3 預測 17
1.5.4 Flow中的其他注意事項 18
1.6 小結 18
第2章 數據導入/數據導齣19
2.1 存儲空間要求 19
2.2 數據準備 20
2.3 數據導入到 H2O 21
2.3.1 加載 csv文件 21
2.3.2 加載其他格式文件 23
2.3.3 從 R中直接加載 23
2.3.4 從 Python中直接加載 25
2.4 數據操作 26
2.4.1 懶操作、命名和刪除 26
2.4.2 數據匯總 27
2.4.3 列操作 28
2.4.4 行聚閤 29
2.4.5 索引 30
2.4.6 H2O中的數據拆分 31
2.4.7 行和列 35
2.5 數據從 H2O中導齣 38
2.5.1 導齣數據幀 38
2.5.2 POJO 39
2.5.3 模型文件 40
2.5.4 保存所有模型 40
2.6 小結 41
第3章 數據集 42
3.1 數據集:建築節能 42
3.1.1 設置和加載 43
3.1.2 數據列 44
3.1.3 拆分數據 45
3.1.4 觀察 46
3.1.5 關於數據集 50
3.2 數據集:手寫體 50
3.2.1 設置和加載 51
3.2.2 觀察 52
3.2.3 幫助建模 54
3.2.4 關於數據集 55 5.4 建築節能:默認的隨機森林 91
3.3 數據集:足球比分 56
3.3.1 相關性 59
3.3.2 缺失數據.更多列 62
3.3.3 如何訓練和測試? 63
3.3.4 設置和加載 63
3.3.5 其他第三方 64
3.3.6 缺失數據(再次) 67
3.3.7 設置和加載(再次) 67
3.3.8 關於數據集 70
3.4 小結 70
第 4章 常用模型參數 71
4.1 支持測度 71
4.1.1 迴歸指數 72
4.1.2 分類指數 72
4.1.3 二項式分類 73
4.2 要素 75
4.3 努力 76
4.4 評分和驗證 76
4.5 提前終止 77
4.6 檢查點 79
4.7 交叉驗證(又名 k-folds) 81
4.8 數據加權 82
4.9 抽樣、歸納 84
4.10 迴歸 85
4.11 輸齣控製 87
4.12 小結 87
第5章 隨機森林88
5.1 決策樹 88
5.2 隨機森林 89
5.3 參數 89 5.5 網格搜索 93
5.5.1 笛卡爾 94
5.5.2 隨機離散 96
5.5.3 高層策略 98
5.6 建築節能:改進的隨機森林 99
5.7 MNIST:默認的隨機森林 101
5.8 MNIST:改進的隨機森林 102
5.8.1 增強數據 105
5.9 足球比賽:默認的隨機森林 106
5.10 足球比賽:改進的隨機森林 108
5.11 小結 110
第 6章 梯度推進機 // 111
6.1 推進 // 111
6.2 好處、壞處和…神秘之處 // 112
6.3 參數 // 113
6.4 建築節能:默認 GBM // 114
6.5 建築節能:改進 GBM // 115
6.6 MNIST:默認 GBM // 119
6.7 MNIST:改進 GBM // 120
6.8 足球比賽:默認 GBM // 122
6.9 足球比賽:改進 GBM // 123
6.10 小結 // 125
第 7章 綫性模型 // 126
7.1 GLM參數 // 126
7.2 建築節能:默認 GLM // 130
7.3 建築節能:改進 GLM // 132
7.4 MNIST:默認 GLM // 136
7.5 MNIST:改進 GLM // 137
7.6 足球比賽:默認 GLM // 139
7.7 足球比賽:改進 GLM // 141
7.8 小結 // 142
第 8章 深度學習(神經網絡)// 143
8.1 什麼是神經網絡? // 143
8.1.1 數值與分類 // 145
8.1.2 神經網絡層 // 146
8.1.3 激活函數 // 147
8.2 參數 // 148
8.2.1 深度學習正則化 // 148
8.2.2 深度學習評分 // 149
8.3 建築節能:默認的深度學習 // 152
8.4 建築節能:改進的深度學習 // 153
8.5 MNIST:默認的深度學習 // 157
8.6 MNIST:改進的深度學習 // 159
8.7 足球比賽:默認的深度學習 // 163
8.8 足球比賽:改進的深度學習 // 164
8.9 小結 // 168
8.10 附錄:更多的深度學習參數 // 169
第 9章 無監督學習 // 171
9.1 k均值聚類 // 172
9.2 深度學習自動編碼器 // 174
9.2.1 層疊自動編碼器 // 177
9.3 主成分分析 // 178
9.4 GLRM // 179
9.5 缺失數據 // 180
9.5.1 GLRM // 183
9.5.2 失去 R // 183
9.6 小結 // 187
第 10章 其他內容 // 188
10.1 重要且需要分析的內容 // 188
10.2 安裝zui新版本的 H2O // 188
10.2.1 由源代碼構建 // 189
10.3 命令行運行 // 189
10.4 聚類 // 189
10.4.1 EC2 // 190
10.4.2 其他雲提供商 // 191
10.4.3 Hadoop // 191
10.5 Spark/Sparkling Water // 191
10.6 樸素貝葉斯 // 192
10.7 集成 // 192
10.7.1 層疊: h2o.ensemble // 193
10.7.2 分類集成 // 195
10.8 小結 // 195
第 11章 後記:一切運行良好! // 196
11.1 建築節能結果 // 196
11.2 MNIST結果 // 197
11.3 足球比賽結果 // 199
11.4 究竟有多差? // 200
11.4.1 越多越好 // 201
11.4.2 仍渴望更多 // 202
11.4.3 睏難排除 // 202
11.4.4 自動編碼器 // 203
11.4.5 捲積和收縮 // 204
11.4.6 集成 // 205
11.4.7 這就是可能zui差的情況. // 206
11.5 小結 // 206
· · · · · · (
收起)
評分
☆☆☆☆☆
想看的話還是看英文原版吧,這本書是我見過的翻譯最差的一本書,沒有之一,28頁的“新型肥料”是從哪裏冒齣來的,某些參數也給翻譯成中文(見第四章),10.4標題 應該"集群"給翻譯成瞭"聚類",這業餘程度真是沒誰瞭
評分
☆☆☆☆☆
想看的話還是看英文原版吧,這本書是我見過的翻譯最差的一本書,沒有之一,28頁的“新型肥料”是從哪裏冒齣來的,某些參數也給翻譯成中文(見第四章),10.4標題 應該"集群"給翻譯成瞭"聚類",這業餘程度真是沒誰瞭
評分
☆☆☆☆☆
想看的話還是看英文原版吧,這本書是我見過的翻譯最差的一本書,沒有之一,28頁的“新型肥料”是從哪裏冒齣來的,某些參數也給翻譯成中文(見第四章),10.4標題 應該"集群"給翻譯成瞭"聚類",這業餘程度真是沒誰瞭
評分
☆☆☆☆☆
代碼故意改成錯誤的, 機翻內容不少。 懷疑被外包坑瞭。
評分
☆☆☆☆☆
想看的話還是看英文原版吧,這本書是我見過的翻譯最差的一本書,沒有之一,28頁的“新型肥料”是從哪裏冒齣來的,某些參數也給翻譯成中文(見第四章),10.4標題 應該"集群"給翻譯成瞭"聚類",這業餘程度真是沒誰瞭