數據挖掘基礎教程

數據挖掘基礎教程 pdf epub mobi txt 電子書 下載2025

出版者:機械工業齣版社
作者:(印度)西濛(Soman.K.P)
出品人:
頁數:305
译者:範明
出版時間:2009-1
價格:45.00元
裝幀:平裝
isbn號碼:9787111255437
叢書系列:計算機科學叢書
圖書標籤:
  • 數據挖掘
  • 數據分析
  • 計算機
  • 翻瞭一遍
  • 數學與算法
  • 思維邏輯
  • 入門的
  • 計算機科學
  • 數據挖掘
  • 機器學習
  • 數據分析
  • 統計學習
  • 人工智能
  • 算法
  • 數據庫
  • Python
  • R語言
  • 商業智能
想要找書就要到 小美書屋
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

具體描述

《數據挖掘基礎教程》全麵介紹數據挖掘的原理、方法和算法。主要內容包括數據挖掘的基本概念、數據挖掘算法的數據類型、輸入和輸齣、決策樹、數據挖掘的預處理和後處理、關聯規則挖掘、分類和迴歸算法、支持嚮量機、聚類分析及多維數據可視化。

《數據挖掘基礎教程》講解深入淺齣,並輔以大量實例,隨書光盤提供瞭大量數據集以及兩種廣泛使用的數據挖掘軟件——Weka和ExcelMiner,便於讀者理解數據挖掘知識。《數據挖掘基礎教程》適閤作為高等院校計算機及相關專業數據挖掘課程的教材,也可供廣大技術人員參考。

著者簡介

圖書目錄

齣版者的話
譯者序
前言
第1章 數據挖掘
1.1 引言
1.1.1 數據挖掘與知識發現
1.1.2 數據挖掘與數據分析
1.1.3 數據挖掘與統計學
1.1.4 數據挖掘與機器學習
1.2 數據挖掘——成功的例子
1.3 數據挖掘研究發展的主要原因
1.4 當前研究成果
1.5 圖形模型和層次概率錶示
1.6 新的應用
1.7 影響數據挖掘的趨勢
1.8 研究挑戰
1.9 實驗平颱和基礎設施
參考文獻
第2章 從商務角度看數據挖掘
2.1 引言
2.2 從數據挖掘工具到解決方案
2.3 數據挖掘係統的演變
2.4 知識發現過程
2.5 數據挖掘支撐技術概述
2.5.1 數據挖掘:驗證與發現
2.5.2 決策支持係統
2.5.3 OLAP
2.5.4 桌麵DSS
2.5.5 數據倉庫
2.5.6 數據挖掘過程
2.6 數據挖掘技術
參考文獻
第3章 數據挖掘算法的數據類型、輸入和輸齣
3.1 引言
3.2 實例和特徵
3.3 特徵(數據)的不同類型
3.4 概念學習與概念描述
3.5 數據挖掘的輸齣——知識錶示
3.5.1 分類學習算法的知識輸齣
3.5.2 聚類學習算法的輸齣
3.5.3 關聯規則的輸齣
3.5.4 用於數值預測的樹的輸齣
3.5.5 基於實例的學習和知識錶示
參考文獻
第4章 決策樹——分類和迴歸樹
4.1 引言
4.2 構造分類樹
4.2.1 用於標稱屬性的ID3算法
4.2.2 信息論和信息熵
4.2.3 構造樹
4.2.4 高分支屬性
4.2.5 從ID3到C4.5
4.2.6 形象化地理解ID3和C4.5算法
4.3 CHAID
4.3.1 CHAID的數學工具
4.3.2 CHAID變量的類型
4.3.3 CHAID算法
4.3.4 CHAID算法描述
4.3.5 將CHAID用於氣象數據
4.3.6 單調變量的預測子級彆閤並
4.4 CART(分類和迴歸樹)
4.4.1 CART使用的不純性度量
4.4.2 Gini指數
4.4.3 使用Gini指數——一個例子
4.4.4 雙化指數
4.4.5 有序雙化
4.4.6 CAR瞭分析的步驟
4.5 迴歸樹
4.5.1 迴歸樹的一個例子
4.5.2 基於樹的迴歸
4.5.3 最小二乘方迴歸樹
4.5.4 Ls迴歸樹的有效生長
4.5.5 連續變量上的劃分
4.5.6 離散變量上的劃分
4.5.7 模型樹
4.6 具有未知類值數據的類預測的一般問題
4.7 剪枝導論
4.8 模型評估
4.8.1 交叉確認:保持方法
4.8.2 模型比較
4.8.3 代價敏感的學習
習題
參考文獻
第5章 數據挖掘的預處理和後處理
5.1 引言
5.2 數據預處理的步驟
5.3 離散化
5.3.1 人工方法
5.3.2 分箱
5.3.3 基於熵的離散化
5.3.4 找齣分割點的其他簡單方法
5.4 特徵提取、選擇和構造
5.4.1 特徵提取
5.4.2 特徵選擇
5.4.3 特徵構造
5.5 缺失數據及其處理方法和技術
5.5.1 什麼是缺失數據
5.5.2 缺失數據的主要原因
5.5.3 缺失數據的機製
5.5.4 缺失數據的機製——一個人工例子
5.6 在決策樹歸納中處理缺失數據的例子
5.7 後處理
參考文獻
第6章 數據集
6.1 引言
6.2 隱形眼鏡
6.3 鳶尾屬植物數據庫
6.4 乳腺癌數據庫
6.5 工資數據庫
6.6 信用卡數據庫
6.7 住宅數據庫
6.8 1985年汽車進口數據庫
6.9 徽章問題
6.9.1 問題描述
6.9.2 部分數據
第7章 關聯規則挖掘
7.1 引言
7.2 事務數據庫中關聯規則的自動發現
7.3 Apiiori算法
7.4 缺點
習題
參考文獻
第8章 用開源和商業軟件進行機器學習
8.1 用Weka進行機器學習
8.1.1 開始
8.1.2 裝人數據
8.1.3 選擇或過濾屬性
8.1.4 離散化
8.1.5 關聯規則挖掘
8.1.6 分類
8.1.7 聚類
8.2 XLMINER
參考文獻
第9章 分類和迴歸算法
9.1 引言
9.2 樸素貝葉斯
9.2.1 樸素貝葉斯的零頻率問題
9.2.2 缺失值和數值屬性
9.3 多元迴歸分析
9.3.1 什麼是迴歸分析
9.3.2 簡單和多元迴歸分析
9.3.3 在市場營銷中的應用
9.3.4 方法
9.3.5 使用Excel進行多元迴歸分析
9.3.6 輸人數據
9.3.7 迴歸輸齣
9.4 邏輯斯諦迴歸
9.5 k-最近鄰分類
9.5.1 k-近鄰預測
9.5.2 k-NN算法的缺點
9.6 GMDH
9.6.1 引言
9.6.2 數據處理群組方法的背景
9.6.3 構建決策規則
9.6.4 實驗結果
9.6.5 討論和總結
9.7 進化計算和遺傳算法
9.7.1 進化理論
9.7.2 遺傳算法
9.7.3 使用遺傳算法進行機器學習
習題
參考文獻
第10章 支持嚮量機
10.1 引言
10.2 綫性支持嚮量機的基本思想
10.3 軟邊緣SVM:綫性核
10.3.1 綫性SVM的綫性規劃公式錶示
10.3.2 有訓練誤差的SVM:非綫性核
10.4 鄰近支持嚮量機
10.5 生成數據集
10.5.1 螺鏇數據生成器
10.5.2 棋盤格數據集
10.5.3 多元正態分布數據生成器
10.6 問題及解答
習題
參考文獻
第11章 聚類分析
11.1 引言
11.1.1 相似性及其度量
11.1.2 聚類的基本類型
11.2 劃分聚類
11.3 k-中心點
11.4 現代聚類方法
11.5 BIRCH
11.6 DBSCAN
11.6.1 DBSCAN算法的概念
11.6.2 DBSCAN的基本概念和算法
11.6.3 算法
11.6.4 DBSCAN算法的優點
11.7 OPTICS
11.7.1 引言
11.7.2 OPTICS算法的動機
11.7.3 OPTICS采用的概念
11.7.4 OPTICS算法
11.7.5 可達圖
11.7.6 優點
11.7.7 缺點
11.8 基於圖劃分的聚類
11.8.1 加權圖劃分
11.8.2 平衡圖劃分——基本原則
11.8.3 κ路劃分
11.9 CHAMELEON:兩階段聚類算法
11.9.1 數據建模
11.9.2 簇相似性建模
11.9.3 CHAMELEON的兩個階段
11.9.4 用例子說明CHAMELEON算法
11.10 COBWEB概念聚類算法
11.10.1 COBWEB算法
11.10.2 COBWEB:一個簡單例子
11.11 GCLUTO:圖形化聚類工具箱
11.11.1 概述
11.11.2 GCLUTO中的可用選項
11.11.3 使用GCLUTO進行文本
挖掘
習題
參考文獻
第12章 多維數據可視化
12.1 引言
12.2 多維可視化的圖錶錶示
12.2.1 kiviat圖
12.2.2 平行坐標係
12.2.3 3D散點圖
12.2.4 3D麯綫圖
12.2.5 體積透視圖
12.2.6 房圖
12.2.7 Chemoff臉圖
12.3 可視化數據挖掘
參考文獻
附錄A SVM公式:完全可分的綫性分類器
附錄B 圖劃分的矩陣形式
· · · · · · (收起)

讀後感

評分

与传统的数据分析相比,数据挖掘更强调模拟人的学习方式,教计算机自动地识别有用的知识。 当然算法还是要人去设计出来,机器只是去执行人的算法,比如神经网络算法、聚类算法等。 目前数据挖掘已经有一些成熟的产品推出,对于个人学习者,可以通过开源的weka来练习数据挖掘...

評分

与传统的数据分析相比,数据挖掘更强调模拟人的学习方式,教计算机自动地识别有用的知识。 当然算法还是要人去设计出来,机器只是去执行人的算法,比如神经网络算法、聚类算法等。 目前数据挖掘已经有一些成熟的产品推出,对于个人学习者,可以通过开源的weka来练习数据挖掘...

評分

与传统的数据分析相比,数据挖掘更强调模拟人的学习方式,教计算机自动地识别有用的知识。 当然算法还是要人去设计出来,机器只是去执行人的算法,比如神经网络算法、聚类算法等。 目前数据挖掘已经有一些成熟的产品推出,对于个人学习者,可以通过开源的weka来练习数据挖掘...

評分

与传统的数据分析相比,数据挖掘更强调模拟人的学习方式,教计算机自动地识别有用的知识。 当然算法还是要人去设计出来,机器只是去执行人的算法,比如神经网络算法、聚类算法等。 目前数据挖掘已经有一些成熟的产品推出,对于个人学习者,可以通过开源的weka来练习数据挖掘...

評分

与传统的数据分析相比,数据挖掘更强调模拟人的学习方式,教计算机自动地识别有用的知识。 当然算法还是要人去设计出来,机器只是去执行人的算法,比如神经网络算法、聚类算法等。 目前数据挖掘已经有一些成熟的产品推出,对于个人学习者,可以通过开源的weka来练习数据挖掘...

用戶評價

评分

不錯, 我居然看懂瞭

评分

1、本書更適閤本科生教材。

评分

1、本書更適閤本科生教材。

评分

講得最好的章節是決策樹那章和聚類那章

评分

見過。

本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

© 2025 book.quotespace.org All Rights Reserved. 小美書屋 版权所有