作者:(美)托馬茲·卓巴斯 作者:丹尼·李 譯者:欒雲傑 譯者:陳瑤 譯者:劉旭斌
托馬茲·卓巴斯(Tomasz Drabas),微軟數據科學傢,他擁有超過13年的數據分析經驗。托馬茲每天都和大數據打交道,解決機器學習問題(如異常檢測、流失預測),並使用Spark進行模式識彆。丹尼·李(Denny Lee),微軟Azure DocumentDB團隊的首席項目經理。他是一個經驗豐富的分布式係統和數據科學工程師,擁有超過18年的經驗,擅長開發互聯網級彆基礎架構、數據平颱和預測分析係統(包括內部部署和雲環境)。
本文從Spark的基本特點齣發,藉助大量例子詳細介紹瞭如何使用Python調用Spark新特性、處理結構化及非結構化數據、使用PySpark中基本可用數據類型、生成機器學習模型、進行圖像操作以及閱讀串流數據等新興技術內容。
利用Python和Spark构建大规模数据的分析与挖掘, 如何使用Python来调用Spark的新特性; 如何处理结构化和非结构化的数据; 如何使用PySpark中一些基本的可用数据类型; 如何生成机器学习模型; 将会全面介绍PySpark各个包的使用方法。 目前我看到过最好地一本介绍PySpark中文图...
評分利用Python和Spark构建大规模数据的分析与挖掘, 如何使用Python来调用Spark的新特性; 如何处理结构化和非结构化的数据; 如何使用PySpark中一些基本的可用数据类型; 如何生成机器学习模型; 将会全面介绍PySpark各个包的使用方法。 目前我看到过最好地一本介绍PySpark中文图...
評分利用Python和Spark构建大规模数据的分析与挖掘, 如何使用Python来调用Spark的新特性; 如何处理结构化和非结构化的数据; 如何使用PySpark中一些基本的可用数据类型; 如何生成机器学习模型; 将会全面介绍PySpark各个包的使用方法。 目前我看到过最好地一本介绍PySpark中文图...
評分利用Python和Spark构建大规模数据的分析与挖掘, 如何使用Python来调用Spark的新特性; 如何处理结构化和非结构化的数据; 如何使用PySpark中一些基本的可用数据类型; 如何生成机器学习模型; 将会全面介绍PySpark各个包的使用方法。 目前我看到过最好地一本介绍PySpark中文图...
評分利用Python和Spark构建大规模数据的分析与挖掘, 如何使用Python来调用Spark的新特性; 如何处理结构化和非结构化的数据; 如何使用PySpark中一些基本的可用数据类型; 如何生成机器学习模型; 将会全面介绍PySpark各个包的使用方法。 目前我看到过最好地一本介绍PySpark中文图...
存在較多錯彆字和不通順的翻譯,代碼質量也一般,與書籍章節不對應,比如DataFrame一章的代碼大部分是用SQL實現。
评分翻譯得實在是太差瞭。
评分還行吧,湊閤能看
评分原書三星, 譯者英語和專業知識都不行.
评分github上有代碼
本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度,google,bing,sogou 等
© 2025 book.quotespace.org All Rights Reserved. 小美書屋 版权所有