特徵工程入門與實踐

特徵工程入門與實踐 pdf epub mobi txt 電子書 下載2025

出版者:人民郵電齣版社
作者:Sinan Ozdemir
出品人:
頁數:210
译者:[中]莊嘉盛
出版時間:2019-5-27
價格:59.00元
裝幀:平裝
isbn號碼:9787115511645
叢書系列:
圖書標籤:
  • 機器學習
  • 特徵工程
  • 數據處理
  • 數據科學
  • 數據挖掘
  • 編程
  • 數據分析與機器學習
  • 數據分析
  • 特徵工程
  • 機器學習
  • 數據挖掘
  • 數據分析
  • Python
  • Scikit-learn
  • 數據預處理
  • 特徵選擇
  • 模型優化
  • 算法實踐
想要找書就要到 小美書屋
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

具體描述

特徵工程是數據科學和機器學習流水綫上的重要一環,包括識彆、清洗、構建和發掘數據的特徵,為進一步解釋數據並進行預測性分析做準備。

本書囊括瞭特徵工程的全流程,從數據檢查到可視化,再到轉換和進一步處理等,並給齣瞭大量數學工具,幫助讀者掌握如何將數據處理、轉換成適當的形式,以便送入計算機和機器學習流水綫中進行處理。後半部分的特徵工程實踐用Python作為示例語言,循序漸進,通俗易懂。

- 識彆和利用不同類型的特徵

- 清洗數據中的特徵,提升預測能力

- 為何、如何進行特徵選擇和模型誤差分析

- 利用領域知識構建新特徵

- 基於數學知識交付特徵

- 使用機器學習算法構建特徵

- 掌握特徵工程與特徵優化

- 在現實應用中利用特徵工程

著者簡介

锡南·厄茲代米爾(Sinan Ozdemir)

數據科學傢、數學傢、約翰·霍普金斯大學講師,Kylie.ai公司聯閤創始人、CTO,在應用數據挖掘、功能分析和算法開發做齣基於數據和知識的決策方麵擁有豐富的經驗。

迪夫婭·蘇薩拉(Divya Susarla)

在利用數據方麵經驗豐富,在包括投資管理、社會企業谘詢和紅酒營銷的各個産業和領域裏實現並應用過相應的策略。Kylie.ai公司産品經理,目前專注於自然語言處理和生成技術。

圖書目錄

第 1章 特徵工程簡介  1
1.1 激動人心的例子:AI驅動的聊天 1
1.2 特徵工程的重要性 2
1.3 特徵工程是什麼 5
1.4 機器學習算法和特徵工程的評估 9
1.4.1 特徵工程的例子:真的有人能預測天氣嗎 10
1.4.2 特徵工程的評估步驟 10
1.4.3 評估監督學習算法 11
1.4.4 評估無監督學習算法 11
1.5 特徵理解:我的數據集裏有什麼 12
1.6 特徵增強:清洗數據 13
1.7 特徵選擇:對壞屬性說不 14
1.8 特徵構建:能生成新特徵嗎 14
1.9 特徵轉換:數學顯神通 15
1.10 特徵學習:以AI促AI 16
1.11 小結 17
第 2章 特徵理解:我的數據集裏有什麼 19
2.1 數據結構的有無 19
2.2 定量數據和定性數據 20
2.3 數據的4個等級 25
2.3.1 定類等級 26
2.3.2 定序等級 27
2.3.3 定距等級 30
2.3.4 定比等級 36
2.4 數據等級總結 38
2.5 小結 40
第3章 特徵增強:清洗數據 41
3.1 識彆數據中的缺失值 41
3.1.1 皮馬印第安人糖尿病預測數據集 42
3.1.2 探索性數據分析 42
3.2 處理數據集中的缺失值 48
3.2.1 刪除有害的行 50
3.2.2 填充缺失值 54
3.2.3 在機器學習流水綫中填充值 57
3.3 標準化和歸一化 61
3.3.1 z分數標準化 63
3.3.2 min-max標準化 67
3.3.3 行歸一化 68
3.3.4 整閤起來 69
3.4 小結 70
第4章 特徵構建:我能生成新特徵嗎 71
4.2 填充分類特徵 72
4.2.1 自定義填充器 74
4.2.2 自定義分類填充器 74
4.2.3 自定義定量填充器 76
4.3 編碼分類變量 77
4.3.1 定類等級的編碼 77
4.3.2 定序等級的編碼 79
4.3.3 將連續特徵分箱 80
4.3.4 創建流水綫 82
4.4 擴展數值特徵 83
4.4.1 根據胸部加速度計識彆動作的數據集 83
4.4.2 多項式特徵 86
4.5 針對文本的特徵構建 89
4.5.1 詞袋法 89
4.5.2 CountVectorizer 90
4.5.3 TF-IDF嚮量化器 94
4.5.4 在機器學習流水綫中使用文本 95
4.6 小結 97
第5章 特徵選擇:對壞屬性說不 98
5.1 在特徵工程中實現更好的性能 99
5.2 創建基準機器學習流水綫 103
5.3 特徵選擇的類型 106
5.3.1 基於統計的特徵選擇 106
5.3.2 基於模型的特徵選擇 117
5.4 選用正確的特徵選擇方法 125
5.5 小結 125
第6章 特徵轉換:數學顯神通 127
6.1 維度縮減:特徵轉換、特徵選擇與特徵構建 129
6.2 主成分分析 130
6.2.1 PCA的工作原理 131
6.2.2 鳶尾花數據集的PCA——手動處理 131
6.2.3 scikit-learn的PCA 137
6.2.4 中心化和縮放對PCA的影響 144
6.3 綫性判彆分析 148
6.3.1 LDA的工作原理 149
6.3.2 在scikit-learn中使用LDA 152
6.4 LDA與PCA:使用鳶尾花數據集 157
6.5 小結 160
第7章 特徵學習:以AI促AI 161
7.1 數據的參數假設 161
7.1.1 非參數謬誤 163
7.1.2 本章的算法 163
7.2 受限玻爾茲曼機 163
7.2.1 不一定降維 164
7.2.2 受限玻爾茲曼機的圖 164
7.2.3 玻爾茲曼機的限製 166
7.2.4 數據重建 166
7.2.5 MNIST數據集 167
7.3 伯努利受限玻爾茲曼機 169
7.3.1 從MNIST中提取PCA主成分 170
7.3.2 從MNIST中提取RBM特徵 177
7.4.1 對原始像素值應用綫性模型 178
7.4.3 對提取的RBM特徵應用綫性模型 179
7.5 學習文本特徵:詞嚮量 180
7.5.1 詞嵌入 180
7.5.2 兩種詞嵌入方法:Word2vec和GloVe 182
7.5.3 Word2vec:另一個淺層神經網絡 182
7.5.4 創建Word2vec詞嵌入的gensim包 183
7.5.5 詞嵌入的應用:信息檢索 186
7.6 小結 190
第8章 案例分析 191
8.1 案例1:麵部識彆 191
8.1.1 麵部識彆的應用 191
8.1.2 數據 192
8.1.3 數據探索 193
8.1.4 應用麵部識彆 195
8.2 案例2:預測酒店評論數據的主題 200
8.2.1 文本聚類的應用 200
8.2.2 酒店評論數據 200
8.2.3 數據探索 201
8.2.4 聚類模型 203
8.2.5 SVD與PCA主成分 204
8.2.6 潛在語義分析 206
8.3 小結 210
· · · · · · (收起)

讀後感

評分

特征工程入门与实践 瑕不掩瑜,讲述特征工程的少有的入门好书,从最基本的特征选择到特征转换都有通俗易懂的讲解与例子展示。对流水线加深了一些理解,更好的规范整个特征工程流程。 配合github上的相应项目食用效果更佳。 这个Packt组织的项目真多呀,机器学习,深度学习,强...

評分

特征工程入门与实践 瑕不掩瑜,讲述特征工程的少有的入门好书,从最基本的特征选择到特征转换都有通俗易懂的讲解与例子展示。对流水线加深了一些理解,更好的规范整个特征工程流程。 配合github上的相应项目食用效果更佳。 这个Packt组织的项目真多呀,机器学习,深度学习,强...

評分

特征工程入门与实践 瑕不掩瑜,讲述特征工程的少有的入门好书,从最基本的特征选择到特征转换都有通俗易懂的讲解与例子展示。对流水线加深了一些理解,更好的规范整个特征工程流程。 配合github上的相应项目食用效果更佳。 这个Packt组织的项目真多呀,机器学习,深度学习,强...

評分

特征工程入门与实践 瑕不掩瑜,讲述特征工程的少有的入门好书,从最基本的特征选择到特征转换都有通俗易懂的讲解与例子展示。对流水线加深了一些理解,更好的规范整个特征工程流程。 配合github上的相应项目食用效果更佳。 这个Packt组织的项目真多呀,机器学习,深度学习,强...

評分

特征工程入门与实践 瑕不掩瑜,讲述特征工程的少有的入门好书,从最基本的特征选择到特征转换都有通俗易懂的讲解与例子展示。对流水线加深了一些理解,更好的规范整个特征工程流程。 配合github上的相应项目食用效果更佳。 这个Packt组织的项目真多呀,机器学习,深度学习,强...

用戶評價

评分

不錯的入門書與相應的資料.

评分

填補此類書籍空白,深入淺齣,佳作

评分

這書,不適閤買,沒太大東西,但是還行

评分

智商稅

评分

不錯的入門書與相應的資料.

本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

© 2025 book.quotespace.org All Rights Reserved. 小美書屋 版权所有