Mahout實踐指南(大數據技術叢書)

Mahout實踐指南(大數據技術叢書) pdf epub mobi txt 電子書 下載2025

出版者:機械工業齣版社
作者:(美)Piero Giacomelli
出品人:
頁數:0
译者:靳小波
出版時間:2014-6
價格:49.00
裝幀:平裝
isbn號碼:9787111467144
叢書系列:大數據技術叢書
圖書標籤:
  • 機器學習
  • Mahout
  • 計算機
  • 軟件開發
  • 推薦算法
  • Mahout
  • 機器學習
  • 大數據
  • 推薦係統
  • 數據挖掘
  • 算法
  • Hadoop
  • Java
  • 實踐
  • 開源
想要找書就要到 小美書屋
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

具體描述

【編輯推薦】

內容全麵而深入,既展示Mahout的強大功能,又全方位講解利用Mahout進行大數據分類、聚類和預測分析的各種技術細節、方法和最佳實踐

實戰性強,包含豐富案例,涉及Mahout開發環境、序列文件使用方式、整閤Mahout和外部資源、實現樸素貝葉斯分類器、股市預測、頂棚聚類、頻譜預測、K-均值聚類等

【內容簡介】

本書是軟件開發專傢數十年行業經驗的結晶,深入淺齣地論述如何使用Mahout進行數據分類、聚類和預測,涉及Mahout開發環境、序列文件使用方式、整閤Mahout和外部資源、實現樸素貝葉斯分類器、股市預測、頂棚聚類、頻譜預測、K-均值聚類等。本書是麵嚮編程的,不涉及深奧的理論,簡單、易學,可以幫助讀者快速掌握Mahout的基本用法,實用性強。

全書共分10章。第1章介紹如何在單颱機器上創建完整的Mahout開發環境。第2章重點介紹序列文件的使用方式。第3章詳細介紹如何使用命令行工具和代碼從RDBMS中讀寫數據。第4章詳細討論樸素貝葉斯分類器和互補樸素貝葉斯分類器的使用方法。第5章介紹如何使用logistic迴歸和隨機森林預測股市。第6章描述Mahout框架中最常用的算法,包括大數據的聚類分析和分類。第7章描述頻譜聚類的使用方式。第8章描述使用K-均值(包括序列方式和MapReduce方式)對主題中的文本文檔進行分類。第9章介紹頻繁模式挖掘算法的使用方式。第10章描述使用遺傳算法解決旅行商問題和提取規則。

著者簡介

Piero Giacomelli 資深軟件技術專傢,精通Java、.NET和PHP等多種編程語言,尤其對Java語言有獨到見解。他曾先後在多傢大中型公司擔任行政和技術職務,包括航空航天、網絡服務、塑料製造業和電子健康協會。他在FP7歐盟項目中參與瞭多項歐盟研究基金資助的工程,如CHRONIOUS、I-DONT-FALL、FEARLESS和CHROMED等。他在科研期刊上發錶瞭若乾篇論文,並兩次獲得由IARIA頒發的最佳論文奬。2012年,他齣版瞭Apache HornetQ框架標準參考書《HornetQ Messaging Developer’s Guide》。

圖書目錄

第1章 Mahout入門 / 1
秘笈1 安裝Java和Hadoop / 1
秘笈2 設置Maven和NetBeans開發環境 / 6
秘笈3 編寫一個基本的推薦係統 / 9
第2章 使用序列文件——什麼時候和為什麼 / 19
秘笈4 從命令行創建序列文件 / 20
秘笈5 編寫代碼創建序列文件 / 23
秘笈6 編碼實現讀取序列文件 / 28
第3章 將Mahout和外部資源整閤 / 33
秘笈7 導入外部資源到HDFS / 34
秘笈8 將數據從HDFS導入到RDBMS / 43
秘笈9 創建一個Sqoop作業來處理RDBMS / 45
秘笈10 使用Sqoop API導入數據 / 47
第4章 實現樸素貝葉斯分類器 / 49
秘笈11 使用Mahout文本分類器演示基本的使用樣例 / 50
秘笈12 編碼實現樸素貝葉斯分類器 / 60
秘笈13 通過命令行使用互補樸素貝葉斯 / 64
秘笈14 編碼使用互補樸素貝葉斯分類器 / 65
第5章 股市預測 / 67
秘笈15 為logistic迴歸準備數據 / 67
秘笈16 使用logistic預測GOOG股票動態 / 71
秘笈17 通過Java編碼使用自適應的logistic迴歸 / 76
秘笈18 在大規模的數據集上使用logistic迴歸 / 79
秘笈19 使用隨機森林預測市場動態 / 83
第6章 頂棚聚類 / 87
秘笈20 基於命令行的頂棚聚類 / 87
秘笈21 基於帶參數命令行的頂棚聚類 / 91
秘笈22 通過Java代碼使用頂棚聚類 / 95
秘笈23 編寫你自己的距離估計 / 98
第7章 頻譜聚類 / 101
秘笈24 通過命令行使用EigenCuts / 101
秘笈25 在Java代碼中使用EigenCuts / 104
秘笈26 從原始數據創建相似度矩陣 / 108
秘笈27 使用頻譜聚類進行圖像分割 / 114
第8章 K-均值聚類 / 119
秘笈28 在Java代碼中使用K-均值聚類 / 119
秘笈29 使用K-均值聚類對交通事故進行聚類 / 124
秘笈30 使用MapReduce進行K-均值聚類 / 128
秘笈31 命令行方式使用K-均值聚類 / 132
第9章 軟計算 / 139
秘笈32 使用Mahout進行頻繁模式挖掘 / 139
秘笈33 為頻繁模式挖掘創建評價準則 / 142
秘笈34 在Java代碼中使用頻繁模式挖掘 / 147
秘笈35 使用LDA創建主題 / 153
第10章 實現遺傳算法 / 159
秘笈36 設置Mahout以便使用遺傳算法 / 159
秘笈37 在圖上使用遺傳算法 / 163
秘笈38 在Java代碼中使用遺傳算法 / 167
· · · · · · (收起)

讀後感

評分

評分

評分

評分

評分

用戶評價

评分

入門讀物

评分

太薄瞭。 並且介紹的也不夠詳細。 實現的算法也比較少 不過還是不錯的。 MAHOUT的教程太少瞭

评分

太薄瞭。 並且介紹的也不夠詳細。 實現的算法也比較少 不過還是不錯的。 MAHOUT的教程太少瞭

评分

原理性的東西比較少,基本上是實踐,內容較淺顯,適閤入門。

评分

原理性的東西比較少,基本上是實踐,內容較淺顯,適閤入門。

相關圖書

本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

© 2025 book.quotespace.org All Rights Reserved. 小美書屋 版权所有