小白學數據挖掘與機器學習

小白學數據挖掘與機器學習 pdf epub mobi txt 電子書 下載2025

出版者:電子工業齣版社
作者:張浩彬
出品人:
頁數:240
译者:
出版時間:2018-7
價格:79
裝幀:平裝
isbn號碼:9787121338434
叢書系列:
圖書標籤:
  • 通俗易懂
  • 數據挖掘
  • 很棒的書,推薦!
  • 內容豐富
  • 實踐者解答
  • 大數據
  • 統計
  • 數據科學
  • 數據挖掘
  • 機器學習
  • 數據分析
  • 人工智能
  • Python
  • 深度學習
  • 算法
  • 編程
  • 實戰
  • 入門
想要找書就要到 小美書屋
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

具體描述

《小白學數據挖掘與機器學習——SPSS Modeler案例篇》用生活中常見的例子、有趣的插圖和通俗的語言,把看上去晦澀難懂的數據挖掘與機器學習知識以通俗易懂的方式分享給讀者,讓讀者從入門學習階段就發現,原來數據挖掘與機器學習不但有用,還很有趣。

《小白學數據挖掘與機器學習——SPSS Modeler案例篇》以IBM SPSS Modeler 作為案例實踐工具,首先介紹瞭數據挖掘的基本概念及數據挖掘方法,然後介紹瞭IBM SPSS Modeler 工具的基本使用、數據探索、統計檢驗、迴歸分析、分類算法、聚類算法、關聯規則、神經網絡以及集成學習。每一章都會以漫畫形式介紹一些日常小例子並作為切入點,用通俗的語言介紹具體的算法理論,同時在每章最後都附上應用案例,讓讀者更輕鬆地閱讀《小白學數據挖掘與機器學習——SPSS Modeler案例篇》並掌握對應的算法和實踐操作。

《小白學數據挖掘與機器學習——SPSS Modeler案例篇》內容循序漸進,完整覆蓋瞭數據挖掘與機器學習的主要知識點,適閤數據挖掘與機器學習入門讀者閱讀。

著者簡介

張浩彬,數據分析/數據挖掘專傢,目前任職於國際商業機器(中國)有限公司認知計算部門,曾張浩彬,人稱浩彬老撕,曾任IBM大中華區商業智能事業部SPSS分析工程師,認知解決方案事業部數據分析專傢,現任廣東柯內特環境科技有限公司首席數據科學傢,緻力機器學習及SPSS技術分享,專注於人工智能技術與應用。

微信公眾號:探數尋理(wetalkdata)

圖書目錄

第 1 章 數據挖掘那些事兒 1
1.1 當我們在談數據挖掘時,其實在討論什麼 2
1.2 從 CRISP-DM 開啓數據挖掘實踐 7
第 2 章 數據挖掘之利器:SPSS Modeler 17
2.1 SPSS Modeler 簡介 18
2.2 SPSS Modeler 的下載與安裝 21
2.3 SPSS Modeler 的主界麵及基本操作 23
2.3.1 SPSS Modeler 主界麵介紹 23
2.3.2 鼠標基本操作 31
2.4 將 SPSS Modeler 連接到服務器端 31
第 3 章 巧婦難為無米之炊:數據,數據! 34
3.1 數據的身份 35
3.1.1 變量的測量級彆 35
3.1.2 變量的角色 36
3.2 數據的讀取 37
3.2.1 讀取 Excel 文件數據 37
3.2.2 讀取變量文件數據 38
3.2.3 讀取 SPSS Statistics(.sav)文件數據 40
3.2.4 讀取數據庫數據 42
3.3 數據的基本設定 45
3.3.1 變量角色的設定 45
3.3.2 字段的篩選及命名 46
3.4 數據的集成 47
3.4.1 數據的變量集成:閤並節點 47
3.4.2 數據的記錄集成:追加節點 50
第 4 章 一點都不簡單的描述性統計分析 53
4.1 分類變量的基本分析: “矩陣”節點 54
4.2 連續變量的基本分析:數據審核節點 57
4.2.1 連續變量基本分析指標介紹 57
4.2.2 “數據審核”節點 63
第 5 章 何為足夠大的差異:常用的統計檢驗 67
5.1 假設檢驗 68
5.1.1 假設檢驗的基本原理 68
5.1.2 假設檢驗的一般步驟 69
5.2 連續變量與分類變量之間的關係: t 檢驗 70
5.2.1 兩組獨立樣本均值比較 71
5.2.2 兩組配對樣本均值比較 72
5.2.3 使用 t 檢驗的前提條件 73
5.2.4 案例:使用均值比較分析電信客戶的流失情況 73
5.3 兩個連續變量之間的關係:相關分析 75
5.3.1 相關分析理論 76
5.3.2 案例:使用相關分析研究居民消費水平與國內生産總值的相關關係 77
5.4 兩個分類變量之間的關係:卡方檢驗 80
5.4.1 卡方檢驗的原理 80
5.4.2 卡方檢驗的前提條件 82
5.4.3 案例:使用卡方檢驗研究兩個分類字段之間的關係 82
第 6 章 從身高和體重的關係談起:迴歸分析 84
6.1 一元綫性迴歸分析 85
6.1.1 分析因變量與自變量的關係,構建迴歸模型 85
6.1.2 估計模型係數,求解迴歸模型 87
6.1.3 對模型係數進行檢驗,確認模型有效性 88
6.1.4 擬閤優度檢驗,判斷模型解釋能力 89
6.1.5 藉助迴歸模型進行預測 90
6.2 多元綫性迴歸分析 90
6.2.1 估計模型係數,求解迴歸模型 91
6.2.2 對模型參數進行檢驗,確認模型有效性 92
6.2.3 擬閤優度檢驗,判斷模型解釋能力 94
6.2.4 模型的變量選擇 95
6.3 使用綫性迴歸分析的注意事項 97
6.4 案例:使用迴歸分析研究影響房屋價格的重要因素 98
第 7 章 迴歸豈止這麼簡單:迴歸模型的進一步擴展 102
7.1 麯綫迴歸 103
7.2 Logistic 迴歸 110
7.2.1 Logistic 迴歸理論 110
7.2.2 案例:使用 Logistic 迴歸模型分析個人收入水平影響因素 112
第 8 章 模型評估那些事兒:過擬閤與欠擬閤 117
8.1 過擬閤與欠擬閤 118
8.2 留齣法與交叉驗證 122
8.2.1 留齣法與分層抽樣 122
8.2.2 交叉驗證 124
第 9 章 從看電影的思考到決策樹的生成 126
9.1 決策樹概述 127
9.2 決策樹生成 129
9.2.1 從 ID3 算法到 C5.0 算法 131
9.2.2 CART 算法 134
9.3 決策樹的剪枝 136
9.3.1 預剪枝策略 137
9.3.2 後剪枝策略 137
9.3.3 代價敏感學習 138
9.4 案例:用決策樹分析客戶違約情況 140
9.5 關於信息熵的擴展 147
第 10 章 人工神經網絡:從人腦神經元開始 151
10.1 從人腦神經元到人工神經網絡 152
10.2 感知機 154
10.3 人工神經網絡 159
10.3.1 隱藏層的作用 159
10.3.2 人工神經網絡算法 160
10.4 案例:利用人工神經網絡分析某電信運營商的客戶流失情況 164
第 11 章 物以類聚,人以群分:聚類分析 172
11.1 聚類思想的概述 173
11.2 聚類方法的關鍵:距離 175
11.3 K-Means 算法 176
11.3.1 K-Means 算法原理 176
11.3.2 輪廓係數(Silhouette coefficient) 177
11.4 案例:利用 K-Means 算法對不同型號汽車的屬性進行聚類分群研究 179
第 12 章 啤酒+尿布=關聯分析? 186
12.1 一個關於關聯分析的傳說 187
12.2 關聯分析的基本概念 188
12.3 關聯規則的有效性指標 190
12.4 Apriori 算法 192
12.4.1 生成頻繁項集 193
12.4.2 生成關聯規則 195
12.5 案例:利用 Apriori 算法對顧客的個人信息及購買記錄進行關聯分析 195
第 13 章 三個臭皮匠,賽過諸葛亮:集成學習算法 199
13.1 集成學習算法概述 200
13.2 3 種不同的集成學習算法 201
13.2.1 Bagging 算法 201
13.2.2 Boosting 算法 203
13.2.3 隨機森林 204
13.3 集成學習算法實踐 205
13.3.1 Bagging 算法和 Boosting 算法 205
13.3.2 隨機森林 211
13.3.3 集成學習算法結果比較 214
· · · · · · (收起)

讀後感

評分

本书对基于SPSS Modeler对数据分析的过程以及主流的数据挖掘算法进行了深入浅出的介绍。数据分析是不是只能很晦涩难懂? 是不是只有数不尽的公式? 不是! 我是个数据小白,怎么办? 一步步上手呀! 从一个新人的角度对数据分析中遇到的要点、难点进行了清晰的讲述,而图文并茂...

評分

作者在IBM工作过,专业水平很高,在业内非常出名,一直在阅读作者的公众号,非常喜欢,终于出书了,书非常赞,甚至超出期待!!!!内容深入浅出,是基于SPSS Modeler的案例分析,书中通过大量图片解释,另菜鸟读也毫无压力(配套的视频一定要看)。统计学是当今并且在将来是非...  

評分

作者在IBM工作过,专业水平很高,在业内非常出名,一直在阅读作者的公众号,非常喜欢,终于出书了,书非常赞,甚至超出期待!!!!内容深入浅出,是基于SPSS Modeler的案例分析,书中通过大量图片解释,另菜鸟读也毫无压力(配套的视频一定要看)。统计学是当今并且在将来是非...  

評分

作者在IBM工作过,专业水平很高,在业内非常出名,一直在阅读作者的公众号,非常喜欢,终于出书了,书非常赞,甚至超出期待!!!!内容深入浅出,是基于SPSS Modeler的案例分析,书中通过大量图片解释,另菜鸟读也毫无压力(配套的视频一定要看)。统计学是当今并且在将来是非...  

評分

本书对基于SPSS Modeler对数据分析的过程以及主流的数据挖掘算法进行了深入浅出的介绍。数据分析是不是只能很晦涩难懂? 是不是只有数不尽的公式? 不是! 我是个数据小白,怎么办? 一步步上手呀! 从一个新人的角度对数据分析中遇到的要点、难点进行了清晰的讲述,而图文并茂...

用戶評價

评分

從關注微信公眾號開始嚮作者學習數據挖掘,特彆通俗易懂,適閤新手。

评分

從微信公眾號到天善智能的課程、再到這本小白學數據挖掘與機器學習圖書,一直都是浩彬老撕的粉絲,給本書點贊,很適閤對數據挖掘感興趣的小夥伴們學習嗷~~

评分

小白錶示,真的能看懂~

评分

浩彬老撕的這本小白都能看懂的數據挖掘書,從基本統計的描述分析到高大上的建模算法,由淺入深,抽絲剝繭,讓我這個小白竟然也能看懂啦。能把數據挖掘用這種幽默易懂的語言,講齣來的,非浩彬老撕莫屬啦,很棒很棒,感謝老師。希望以後多齣這種係列叢書,期待期待。

评分

通俗易懂,深入淺齣!還有37個視頻講解!!!實用的工具書!數據分析、數據挖掘必備~

本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

© 2025 book.quotespace.org All Rights Reserved. 小美書屋 版权所有