Spark高级数据分析

Spark高级数据分析 pdf epub mobi txt 电子书 下载 2025

Sandy Ryza

是Cloudera公司资深数据科学家,Apache Spark项目的活跃代码贡献者。最近领导了Cloudera公司的Spark开发工作。他还是Hadoop项目管理委员会委员。

Uri Laserson

是Cloudera公司资深数据科学家,专注于Hadoop生态系统中的Python部分。

Sean Owen

是Cloudera公司EMEA地区的数据科学总监,也是Apache Spark项目的代码提交者。他创立了基于Spark、Spark Streaming和Kafka的Hadoop实时大规模学习项目Oryx(之前称为Myrrix)。

Josh Wills

是Cloudera公司的高级数据科学总监,Apache Crunch项目的发起者和副总裁。

出版者:人民邮电出版社
作者:[美] Sandy Ryza
出品人:
页数:244
译者:龚少成
出版时间:2015-11
价格:59.00元
装帧:平装
isbn号码:9787115404749
丛书系列:图灵程序设计丛书
图书标签:
  • 大数据 
  • spark 
  • 数据分析 
  • Spark 
  • 机器学习 
  • 计算机 
  • bigdata 
  • 数据平台 
  •  
想要找书就要到 小美书屋
立刻按 ctrl+D收藏本页
你会得到大惊喜!!

本书是使用Spark进行大规模数据分析的实战宝典,由著名大数据公司Cloudera的数据科学家撰写。四位作者首先结合数据科学和大数据分析的广阔背景讲解了Spark,然后介绍了用Spark和Scala进行数据处理的基础知识,接着讨论了如何将Spark用于机器学习,同时介绍了常见应用中几个最常用的算法。此外还收集了一些更加新颖的应用,比如通过文本隐含语义关系来查询Wikipedia或分析基因数据。

具体描述

读后感

评分

评分

评分

评分

评分

用户评价

评分

不喜欢scala

评分

基于spark做数据挖掘的很多样例,但是spark在大多数场景真的不好用

评分

写的还兼顾的基础知识不太好, 应该假设看过那本基础的. 感觉这种应用类的看书总觉太啰嗦太慢, 还是直接 源码+注释好些.

评分

基于spark做数据挖掘的很多样例,但是spark在大多数场景真的不好用

评分

版本有点老了

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 book.quotespace.org All Rights Reserved. 小美书屋 版权所有