R語言與數據挖掘最佳實踐和經典案例

R語言與數據挖掘最佳實踐和經典案例 pdf epub mobi txt 電子書 下載2025

出版者:機械工業齣版社
作者:(澳)Yanchang Zhao
出品人:
頁數:0
译者:陳健
出版時間:2014-9
價格:49.0
裝幀:
isbn號碼:9787111475415
叢書系列:計算機科學叢書
圖書標籤:
  • 數據挖掘
  • R語言
  • R
  • 數據分析
  • 數據科學
  • 計算機
  • 淩水微波
  • Statistics
  • R語言
  • 數據挖掘
  • 機器學習
  • 統計分析
  • 數據分析
  • 案例分析
  • 最佳實踐
  • 商業分析
  • 數據科學
  • 算法
想要找書就要到 小美書屋
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

具體描述

【內容簡介】

數據挖掘技術已經廣泛用於政府機關、銀行、保險、零售、電信、醫藥和研究領域。最近,越來越多的數據挖掘工作開始使用R工具來完成,R是一個用於統計計算和製圖的免費軟件。在最近的調查中,R已經被評為數據挖掘領域最流行的工具。本書介紹將R語言用於數據挖掘應用(從學術研究到工業應用),從大量數據中提取齣有用知識的各種實用方法。

本書麵嚮數據挖掘領域的研究人員、數據挖掘方嚮的研究生,以及數據挖掘工程師和分析師,對於學習數據挖掘課程的學生來說具有巨大的參考價值,對於參加數據挖掘與分析的行業培訓課程的人來說是非常有用的資料。

本書主要特色

● 介紹瞭R用於數據挖掘應用的案例,涵蓋瞭最常用的數據挖掘技術。

● 提供瞭代碼示例和數據,以便讀者可以輕鬆地學習數據挖掘技術。

● 現實應用中的特色案例研究有助於讀者將學到的技術應用到自己的工作和研究中。

著者簡介

Yanchang Zhao 從2009年起擔任澳大利亞政府部門的高級數據挖掘分析師。在加入澳大利亞政府部門之前,他是悉尼科技大學工程和信息技術學院博士後研究員。他的研究興趣包括聚類分析、關聯規則、時間序列、孤立點檢測、數據挖掘應用等,當前關注在數據挖掘應用中使用R語言。他是IEEE高級會員和澳大利亞分析專業人員協會成員。他發錶瞭50多篇數據挖掘研究和應用方麵的論文,並獨立或與他人閤作編寫瞭3本著作。

圖書目錄

第1章 簡介1
1.1 數據挖掘1
1.2 R1
1.3 數據集2
1.3.1 iris數據集2
1.3.2 bodyfat數據集3
第2章 數據的導入與導齣4
2.1 R數據的保存與加載4
2.2 .CSV文件的導入與導齣4
2.3 從SAS中導入數據5
2.4 通過ODBC導入與導齣數據6
2.4.1 從數據庫中讀取數據7
2.4.2 從Excel文件中導入與導齣數據7
第3章 數據探索8
3.1 查看數據8
3.2 探索單個變量10
3.3 探索多個變量12
3.4 更多探索15
3.5 將圖錶保存到文件中19
第4章 決策樹與隨機森林21
4.1 使用party包構建決策樹21
4.2 使用rpart包構建決策樹24
4.3 隨機森林29
第5章 迴歸分析33
5.1 綫性迴歸33
5.2 邏輯迴歸38
5.3 廣義綫性迴歸38
5.4 非綫性迴歸40
第6章 聚類41
6.1 k-means聚類41
6.2 k-medoids聚類43
6.3 層次聚類45
6.4 基於密度的聚類46
第7章 離群點檢測50
7.1 單變量的離群點檢測50
7.2 局部離群點因子檢測53
7.3 用聚類方法進行離群點檢測56
7.4 時間序列數據的離群點檢測58
7.5 討論59
第8章 時間序列分析與挖掘60
8.1 R中的時間序列數據60
8.2 時間序列分解60
8.3 時間序列預測62
8.4 時間序列聚類63
8.4.1 動態時間規整63
8.4.2 閤成控製圖的時間序列數據64
8.4.3 基於歐氏距離的層次聚類65
8.4.4 基於DTW距離的層次聚類66
8.5 時間序列分類67
8.5.1 基於原始數據的分類67
8.5.2 基於特徵提取的分類68
8.5.3 k-NN分類69
8.6 討論70
8.7 延伸閱讀70
第9章 關聯規則71
9.1 關聯規則的基本概念71
9.2 Titanic數據集71
9.3 關聯規則挖掘73
9.4 消除冗餘78
9.5 解釋規則79
9.6 關聯規則的可視化80
9.7 討論與延伸閱讀82
第10章 文本挖掘84
10.1 Twitter的文本檢索84
10.2 轉換文本85
10.3 提取詞乾86
10.4 建立詞項-文檔矩陣88
10.5 頻繁詞項與關聯90
10.6 詞雲91
10.7 詞項聚類92
10.8 推文聚類94
10.8.1 基於k-means算法的推文聚類94
10.8.2 基於k-medoids算法的推文聚類96
10.9 程序包、延伸閱讀與討論98
第11章 社交網絡分析99
11.1詞項網絡99
11.2推文網絡102
11.3雙模式網絡107
11.4討論與延伸閱讀110
第12章 案例Ⅰ:房價指數的分析與預測111
12.1HPI數據導入111
12.2HPI數據探索112
12.3HPI趨勢與季節性成分118
12.4HPI預測120
12.5房地産估價122
12.6討論122
第13章 案例Ⅱ:客戶迴復預測與效益最大化123
13.1簡介123
13.2KDD Cup 1998的數據123
13.3數據探索131
13.4訓練決策樹137
13.5模型評估140
13.6選擇最優決策樹143
13.7評分145
13.8討論與總結148
第14章 案例Ⅲ:內存受限的大數據預測模型150
14.1簡介150
14.2研究方法150
14.3數據與變量151
14.4隨機森林152
14.5內存問題153
14.6樣本數據的訓練模型154
14.7使用已選變量建立模型156
14.8評分162
14.9輸齣規則168
14.9.1以文本格式輸齣規則168
14.9.2輸齣SAS規則的得分172
14.10總結與討論177
第15章 在綫資源178
15.1R參考文檔178
15.2R178
15.3數據挖掘179
15.4R的數據挖掘180
15.5R的分類與預測181
15.6R的時間序列分析181
15.7R的關聯規則挖掘181
15.8R的空間數據分析181
15.9R的文本挖掘182
15.10R的社交網絡分析182
15.11R的數據清洗與轉換182
15.12R的大數據與並行計算182
R語言數據挖掘參考文檔184
參考資料197
通用索引201
包索引203
函數索引204
· · · · · · (收起)

讀後感

評分

2015最新数据挖掘入门到精通—R语言视频教程 课程观看地址:http://www.xuetuwuyou.com/course/59 课程出自学途无忧网:http://www.xuetuwuyou.com/ 课程介绍 一、课程所用软件:R 3.2.2(64位) RStudio 二、课程涉及到的技术点: 1)R语言的基本语法、函数 2)R中实用性很...

評分

2015最新数据挖掘入门到精通—R语言视频教程 课程观看地址:http://www.xuetuwuyou.com/course/59 课程出自学途无忧网:http://www.xuetuwuyou.com/ 课程介绍 一、课程所用软件:R 3.2.2(64位) RStudio 二、课程涉及到的技术点: 1)R语言的基本语法、函数 2)R中实用性很...

評分

2015最新数据挖掘入门到精通—R语言视频教程 课程观看地址:http://www.xuetuwuyou.com/course/59 课程出自学途无忧网:http://www.xuetuwuyou.com/ 课程介绍 一、课程所用软件:R 3.2.2(64位) RStudio 二、课程涉及到的技术点: 1)R语言的基本语法、函数 2)R中实用性很...

評分

2015最新数据挖掘入门到精通—R语言视频教程 课程观看地址:http://www.xuetuwuyou.com/course/59 课程出自学途无忧网:http://www.xuetuwuyou.com/ 课程介绍 一、课程所用软件:R 3.2.2(64位) RStudio 二、课程涉及到的技术点: 1)R语言的基本语法、函数 2)R中实用性很...

評分

2015最新数据挖掘入门到精通—R语言视频教程 课程观看地址:http://www.xuetuwuyou.com/course/59 课程出自学途无忧网:http://www.xuetuwuyou.com/ 课程介绍 一、课程所用软件:R 3.2.2(64位) RStudio 二、课程涉及到的技术点: 1)R语言的基本语法、函数 2)R中实用性很...

用戶評價

评分

極簡……

评分

挺好的一本書

评分

挺好的一本書

评分

挺好懂的一本書,也比較容易上手。

评分

極簡……

本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

© 2025 book.quotespace.org All Rights Reserved. 小美書屋 版权所有