第一部分 預測入門篇
第1章 預測入門 2
1.1 什麼是預測 3
1.1.1 預測的定義 3
1.1.2 預測的特點 4
1.1.3 預測的分類 4
1.1.4 預測的基本原則 5
1.2 大數據與預測 7
1.2.1 什麼是大數據 7
1.2.2 大數據預測的優勢 9
1.2.3 大數據預測的特徵 9
1.2.4 大數據預測案例 12
1.3 預測利器之R語言 22
1.3.1 R語言簡介 22
1.3.2 R語言預測初步 33
1.3.3 R語言預測常用包 42
第2章 預測方法論 44
2.1 預測流程 45
2.1.1 確定主題 45
2.1.2 收集數據 47
2.1.3 選擇方法 49
2.1.4 分析規律 53
2.1.5 建立模型 57
2.1.6 評估效果 60
2.1.7 發布模型 60
2.2 指導原則 61
2.2.1 界定問題 61
2.2.2 判斷預測法 63
2.2.3 外推預測法 64
2.2.4 因果預測法 66
2.3 團隊構成 66
2.3.1 成員分類 67
2.3.2 數據氛圍 68
2.3.3 團隊閤作 70
第3章 分析方法 72
3.1 相關分析 73
3.1.1 自相關分析 73
3.1.2 偏相關分析 74
3.1.3 簡單相關分析 75
3.1.4 互相關分析 83
3.1.5 典型相關分析 84
3.2 對應分析 88
3.3 頻譜分析 92
3.4 趨勢分析 94
3.5 聚類分析 96
3.5.1 K-Means算法 96
3.5.2 係統聚類算法 99
3.6 關聯分析 105
3.6.1 關聯規則挖掘:Apriori與Eclat算法 105
3.6.2 序列模式挖掘:SPADE算法 119
第4章 特徵構建技術 132
4.1 特徵變換 133
4.1.1 概念分層 134
4.1.2 標準化 136
4.1.3 離散化 139
4.1.4 函數變換 142
4.1.5 深入錶達 143
4.2 特徵組閤 143
4.2.1 基於特定的領域知識 143
4.2.2 二元組閤 144
4.2.3 高階多項式 148
4.3 自動生成:基於遺傳編程的方法 152
4.3.1 基本思路 153
4.3.2 特徵錶達式 154
4.3.3 産生初始種群 162
4.3.4 計算適應度 163
4.3.5 選擇、交叉和變異 165
4.3.6 實例分析 171
第5章 特徵選擇方法 176
5.1 直接法 177
5.2 單元法 177
5.2.1 Pearson相關係數 177
5.2.2 距離相關係數 179
5.2.3 單因素方差分析 181
5.2.4 信息增益 184
5.2.5 卡方檢驗 191
5.2.6 Gini係數 194
5.3 多元法 198
5.3.1 逐步迴歸 198
5.3.2 隨機森林 203
5.3.3 遺傳算法 210
第6章 模型參數優化 213
6.1 交叉驗證 214
6.2 網格搜索 215
6.3 遺傳算法 217
6.3.1 基本概念 217
6.3.2 遺傳算法算例 218
6.3.3 遺傳算法實現步驟 223
6.3.4 遺傳算法R語言實現 223
6.3.5 R語言mcga和genalg包的應用 228
6.4 粒子群優化 233
6.4.1 基本概念及原理 233
6.4.2 粒子群算法R語言實現 235
6.4.3 粒子群算法實現步驟 238
6.4.4 R語言pso包的應用 239
6.5 模擬退火 241
6.5.1 基本概念及原理 241
6.5.2 模擬退火算法R語言實現 242
6.5.3 模擬退火算法實現步驟 244
6.5.4 R語言GenSA和stats包的應用 245
第7章 預測效果評估 250
7.1 概率預測評估方法 251
7.1.1 混淆矩陣 251
7.1.2 ROC麯綫 255
7.1.3 KS麯綫 261
7.1.4 纍計收益圖 263
7.1.5 纍計提升圖 264
7.1.6 纍計響應圖 266
7.2 數值預測評估方法 267
7.2.1 常見評估指標 267
7.2.2 ASD纍計收益圖 270
第二部分 預測算法篇
第8章 綫性迴歸及其優化 274
8.1 多元綫性迴歸 275
8.1.1 迴歸模型和基本假定 275
8.1.2 最小二乘估計 276
8.1.3 迴歸方程和迴歸係數的顯著性檢驗 276
8.1.4 多重共綫性 277
8.2 Ridge迴歸 280
8.2.1 基本概念 281
8.2.2 嶺跡麯綫 281
8.2.3 基於GCV準則確定嶺參數 283
8.2.4 Ridge迴歸的R語言實現 284
8.3 Lasso迴歸 285
8.3.1 基本概念 285
8.3.2 使用LAR求解Lasso 286
8.3.3 Lasso算法的R語言實現 288
8.3.4 R語言lars包的應用 290
8.4 分位數迴歸 292
8.4.1 基本概念 292
8.4.2 分位數迴歸的計算 294
8.4.3 用單純形法求解分位數迴歸及R語言實現 296
8.4.4 R語言quantreg包的應用 298
8.5 穩健迴歸 300
8.5.1 基本概念 301
8.5.2 M-估計法及其R語言實現 301
8.5.3 應用R語言MASS包實現穩健迴歸 304
第9章 復雜迴歸分析 307
9.1 梯度提升迴歸樹(GBRT) 308
9.1.1 Boosting方法簡介 308
9.1.2 AdaBoost算法 308
9.1.3 提升迴歸樹算法 311
9.1.4 梯度提升 312
9.1.5 GBRT的R語言實現 314
9.1.6 R語言gbm包的應用 316
9.2 神經網絡 320
9.2.1 基本概念 320
9.2.2 單層感知器學習算法 322
9.2.3 SLP迴歸算法的R語言實現 323
9.2.4 BP神經網絡學習算法 325
9.2.5 BP迴歸算法的R語言實現 327
9.2.6 RBF神經網絡學習算法 330
9.2.7 RBF迴歸算法的R語言實現 332
9.2.8 Elman神經網絡學習算法 334
9.2.9 Elman迴歸算法的R語言實現 336
9.2.10 使用R語言包構建神經網絡 338
9.3 支持嚮量機迴歸 343
9.3.1 基本問題 344
9.3.2 LS-SVMR算法 347
9.3.3 LS-SVMR算法的R語言實現 348
9.4 高斯過程迴歸 349
9.4.1 GPR算法 350
9.4.2 GPR算法的R語言實現 352
9.4.3 R語言kernlab包的應用 355
第10章 時間序列分析 358
10.1 Box-Jenkins方法 359
10.1.1 p階自迴歸模型 359
10.1.2 q階移動平均模型 361
10.1.3 自迴歸移動平均模型 363
10.1.4 ARIMA模型 365
10.1.5 ARIMA模型的R語言實現 367
10.1.6 R語言forecast包的應用 373
10.2 門限自迴歸模型 376
10.2.1 TAR模型的基本原理 376
10.2.2 TAR模型的R語言實現 377
10.2.3 R語言TSA包的應用 380
10.3 GARCH模型族 382
10.3.1 綫性ARCH模型 382
10.3.2 GRACH模型 383
10.3.3 EGARCH模型 384
10.3.4 Power ARCH模型 384
10.3.5 PARCH模型的R語言實現 385
10.3.6 R語言fGarch包的應用 395
10.4 嚮量自迴歸模型 398
10.4.1 VAR模型基本原理 398
10.4.2 VAR模型的R語言實現 399
10.4.3 R語言vars包的應用 403
10.5 卡爾曼濾波器算法 405
10.5.1 Kalman濾波算法初步 406
10.5.2 Kalman濾波的R語言實現 407
10.5.3 R語言FKF包的應用 409
第三部分 預測應用篇
第11章 短期日負荷麯綫預測 414
11.1 電力行業負荷預測介紹 415
11.2 短期日負荷麯綫預測的基本要求 415
11.3 預測建模準備 416
11.3.1 基礎數據采集 416
11.3.2 缺失數據處理及平滑 418
11.3.3 潛在規律分析 421
11.4 基於RBF神經網絡的預測 426
11.4.1 RBF網絡結構設計 426
11.4.2 確定最優參數 427
11.4.3 建模並實現預測 431
11.4.4 效果評估 433
11.5 基於LS-SVMR算法的預測 435
11.5.1 確定最優參數 436
11.5.2 建模並實現預測 438
11.5.3 效果評估 439
第12章 股票價格預測 442
12.1 股票市場簡介 443
12.1.1 股票的基本概念 443
12.1.2 股票市場常用術語 443
12.1.3 股價波動的影響因素 447
12.2 獲取股票數據 452
12.3 基於VAR算法的預測 455
12.3.1 平穩性檢驗 455
12.3.2 VAR模型定階 456
12.3.3 預測及效果驗證 457
參考文獻 459
· · · · · · (
收起)