Scala機器學習 pdf epub mobi txt 電子書下載2025

簡體網頁||繁體網頁

☆☆☆☆☆

出版者:機械工業齣版社

作者:Alexander Kozlov

出品人:

頁數:0

译者:羅棻

出版時間:2017-7

價格:0

裝幀:平裝

isbn號碼:9787111572152

叢書系列:大數據技術叢書

圖書標籤:

統計學與機器學習
Scala
而知也無涯-2019
Scala
機器學習
數據科學
算法
編程
技術
計算機科學
人工智能
大數據
模型

下載連結在頁面底部

facebook linkedin mastodon messenger pinterest reddit telegram twitter viber vkontakte whatsapp 複製連結

想要找書就要到小美書屋

book.quotespace.org

立刻按 ctrl+D收藏本頁

你會得到大驚喜!!

具體描述

《Scala機器學習》全麵而係統地講解怎麼使用Scala在Spark平颱上實現機器學習算法，其中Scala的版本Jj為2.11.7，Spark采用基於Hadoop 2.6的版本，都是比較新的版本，並且書中還提供大量有針對性的編程實例，可以幫助你快速提高自己的工程實戰能力。全書共10章，第1章介紹數據分析師如何開始數據分析；第2章介紹數據驅動過程；第3章介紹Spark體係結構以及MLlib所支持幾個算法；第4章介紹機器學習的基本原理，討論兩種不同的機器學習方法——監督學習和無監督學習；第5章通過具體的算法實例介紹迴歸和分類；第6章詳細介紹顯示、存儲以及改進非結構化數據的方法；第7章深入介紹Scala的圖（graph）庫以及算法的實現；第8章探討Scala與R和Python的集成；第9章介紹自然語言處理（NLP）的一些常用算法，同時介紹一些特彆適閤Scala編程的算法；第10章介紹現有Scala監控解決方案。

著者簡介

亞曆剋斯·科茲洛夫（Alex Kozlov），是一名多學科的大數據科學傢。自1991年來到矽榖起就創辦瞭幾傢計算機和數據管理公司。期間，他師從Daphne Koller和John Hennessy兩位教授，於1998年獲得斯坦福大學博士學位。他目前是企業安全初創公司E8 Security的首席解決方案架構師，曾在Cloudera、HP公司的HPLabs工作。

羅棻，重慶工商大學計算機科學與信息工程學院教師，主要從事計算機視覺、計算機算法的研究。同時對Scala編程感興趣。

劉波，重慶工商大學計算機科學與信息工程學院教師，主要從事機器學習理論、計算機視覺和最優化技術研究，同時愛好Hadoop和Spark平颱上的大數據分析，也對Linux平颱的編程和Oracle數據庫感興趣。

圖書目錄

譯者序
前言
第1章探索數據分析1
1.1Scala入門2
1.2去除分類字段的重復值2
1.3數值字段概述4
1.4基本抽樣、分層抽樣和一緻抽樣5
1.5使用Scala和Spark的Note—book工作8
1.6相關性的基礎12
1.7總結14
第2章數據管道和建模15
2.1影響圖16
2.2序貫試驗和風險處理17
2.3探索與利用問題21
2.4不知之不知23
2.5數據驅動係統的基本組件23
2.5.1數據收集24
2.5.2數據轉換層25
2.5.3數據分析與機器學習26
2.5.4UI組件26
2.5.5動作引擎28
2.5.6關聯引擎28
2.5.7監控28
2.6優化和交互28
2.7總結29
第3章使用Spark和MLlib30
3.1安裝Spark31
3.2理解Spark的架構32
3.2.1任務調度32
3.2.2Spark的組件35
3.2.3MQTT、ZeroMQ、Flume和Kafka36
3.2.4HDFS、Cassandra、S3和Tachyon37
3.2.5Mesos、YARN和Standa—lone38
3.3應用38
3.3.1單詞計數38
3.3.2基於流的單詞計數41
3.3.3SparkSQL和數據框45
3.4機器學習庫46
3.4.1SparkR47
3.4.2圖算法：Graphx和Graph—Frames48
3.5Spark的性能調整48
3.6運行Hadoop的HDFS49
3.7總結54
第4章監督學習和無監督學習55
4.1記錄和監督學習55
4.1.1Iirs數據集56
4.1.2類標簽點57
4.1.3SVMWithSGD58
4.1.4logistic迴歸60
4.1.5決策樹62
4.1.6bagging和boosting：集成學習方法66
4.2無監督學習66
4.3數據維度71
4.4總結73
第5章迴歸和分類74
5.1迴歸是什麼74
5.2連續空間和度量75
5.3綫性迴歸77
5.4logistic迴歸81
5.5正則化83
5.6多元迴歸84
5.7異方差84
5.8迴歸樹85
5.9分類的度量87
5.10多分類問題87
5.11感知機87
5.12泛化誤差和過擬閤90
5.13總結90
第6章使用非結構化數據91
6.1嵌套數據92
6.2其他序列化格式100
6.3Hive和Impala102
6.4會話化104
6.5使用特質109
6.6使用模式匹配110
6.7非結構化數據的其他用途113
6.8概率結構113
6.9投影113
6.10總結113
第7章使用圖算法115
7.1圖簡介115
7.2SBT116
7.3Scala的圖項目119
7.3.1增加節點和邊121
7.3.2圖約束123
7.3.3JSON124
7.4GraphX126
7.4.1誰收到電子郵件130
7.4.2連通分量131
7.4.3三角形計數132
7.4.4強連通分量132
7.4.5PageRank133
7.4.6SVD++134
7.5總結138
第8章Scala與R和Python的集成139
8.1R的集成140
8.1.1R和SparkR的相關配置140
8.1.2數據框144
8.1.3綫性模型150
8.1.4廣義綫性模型152
8.1.5在SparkR中讀取JSON文件156
8.1.6在SparkR中寫入Parquet文件157
8.1.7從R調用Scala158
8.2Python的集成161
8.2.1安裝Python161
8.2.2PySpark162
8.2.3從Java／Scala調用Python163
8.3總結167
第9章Scala中的NLP169
9.1文本分析流程170
9.2Spark的MLlib庫177
9.2.1TF—IDF177
9.2.2LDA178
9.3分詞、標注和分塊185
9.4POS標記186
9.5使用word2vec尋找詞關係189
9.6總結192
第10章高級模型監控193
10.1係統監控194
10.2進程監控195
10.3模型監控201
10.3.1隨時間變化的性能202
10.3.2模型停用標準202
10.3.3A／B測試202
10.4總結202
· · · · · · (收起)