利用Python进行数据分析

利用Python进行数据分析 pdf epub mobi txt 电子书 下载 2025

出版者:机械工业出版社
作者:Wes McKinney
出品人:
页数:464
译者:唐学韬
出版时间:2013-11-18
价格:89.00
装帧:平装
isbn号码:9787111436737
丛书系列:
图书标签:
  • 数据分析
  • python
  • Python
  • 数据分析/挖掘
  • 数据挖掘
  • 编程
  • 计算机
  • 机器学习
  • Python
  • 数据分析
  • 编程
  • 机器学习
  • 可视化
  • 统计学
  • 数据清洗
  • 科学计算
  • 大数据
  • 人工智能
想要找书就要到 小美书屋
立刻按 ctrl+D收藏本页
你会得到大惊喜!!

具体描述

【名人推荐】

“科学计算和数据分析社区已经等待这本书很多年了:大量具体的实践建议,以及大量综合应用方法。本书在未来几年里肯定会成为Python领域中技术计算的权威指南。”

——Fernando Pérez 加州大学伯克利分校 研究科学家, IPython的创始人之一

【内容简介】

还在苦苦寻觅用Python控制、处理、整理、分析结构化数据的完整课程?本书含有大量的实践案例,你将学会如何利用各种Python库(包括NumPy、pandas、matplotlib以及IPython等)高效地解决各式各样的数据分析问题。

由于作者Wes McKinney是pandas库的主要作者,所以本书也可以作为利用Python实现数据密集型应用的科学计算实践指南。本书适合刚刚接触Python的分析人员以及刚刚接触科学计算的Python程序员。

•将IPython这个交互式Shell作为你的首要开发环境。

•学习NumPy(Numerical Python)的基础和高级知识。

•从pandas库的数据分析工具开始。

•利用高性能工具对数据进行加载、清理、转换、合并以及重塑。

•利用matplotlib创建散点图以及静态或交互式的可视化结果。

•利用pandas的groupby功能对数据集进行切片、切块和汇总操作。

•处理各种各样的时间序列数据。

•通过详细的案例学习如何解决Web分析、社会科学、金融学以及经•济学等领域的问题。

作者简介

Wes McKinney 资深数据分析专家,对各种Python库(包括NumPy、pandas、matplotlib以及IPython等)等都有深入研究,并在大量的实践中积累了丰富的经验。撰写了大量与Python数据分析相关的经典文章,被各大技术社区争相转载,是Python和开源技术社区公认的权威人物之一。开发了用于数据分析的著名开源Python库——pandas,广获用户好评。在创建Lambda Foundry(一家致力于企业数据分析的公司)之前,他曾是AQR Capital Management的定量分析师。

目录信息

目录
前言 1
第1章 准备工作 5
本书主要内容 5
为什么要使用Python进行数据分析 6
重要的Python库 7
安装和设置 10
社区和研讨会 16
使用本书 16
致谢 18
第2章 引言 20
来自bit.ly的1.usa.gov数据 21
MovieLens 1M数据集 29
1880—2010年间全美婴儿姓名 35
小结及展望 47
第3章 IPython:一种交互式计算和开发环境 48
IPython基础 49
内省 51
使用命令历史 60
与操作系统交互 63
软件开发工具 66
IPython HTML Notebook 75
利用IPython提高代码开发效率的几点提示 77
高级IPython功能 79
致谢 81
第4章 NumPy基础:数组和矢量计算 82
NumPy的ndarray:一种多维数组对象 83
通用函数:快速的元素级数组函数 98
利用数组进行数据处理 100
用于数组的文件输入输出 107
线性代数 109
随机数生成 111
范例:随机漫步 112
第5章 pandas入门 115
pandas的数据结构介绍 116
基本功能 126
汇总和计算描述统计 142
处理缺失数据 148
层次化索引 153
其他有关pandas的话题 158
第6章 数据加载、存储与文件格式 162
读写文本格式的数据 162
二进制数据格式 179
使用HTML和Web API 181
使用数据库 182
第7章 数据规整化:清理、转换、合并、重塑 186
合并数据集 186
重塑和轴向旋转 200
数据转换 204
字符串操作 217
示例:USDA食品数据库 224
第8章 绘图和可视化 231
matplotlib API入门 231
pandas中的绘图函数 244
绘制地图:图形化显示海地地震危机数据 254
Python图形化工具生态系统 260
第9章 数据聚合与分组运算 263
GroupBy技术 264
数据聚合 271
分组级运算和转换 276
透视表和交叉表 288
示例:2012联邦选举委员会数据库 291
第10章 时间序列 302
日期和时间数据类型及工具 303
时间序列基础 307
日期的范围、频率以及移动 311
时区处理 317
时期及其算术运算 322
重采样及频率转换 327
时间序列绘图 334
移动窗口函数 337
性能和内存使用方面的注意事项 342
第11章 金融和经济数据应用 344
数据规整化方面的话题 344
分组变换和分析 355
更多示例应用 361
第12章 NumPy高级应用 368
ndarray对象的内部机理 368
高级数组操作 370
广播 378
ufunc高级应用 383
结构化和记录式数组 386
更多有关排序的话题 388
NumPy的matrix类 393
高级数组输入输出 395
性能建议 397
附录A Python语言精要 401
· · · · · · (收起)

读后感

评分

pandas主要基于numpy.ndarray构造了更高级的Series和DataFrame数据结构。这本书主要就是说明基于这两种数据结构的API用法。这些API主要是对原本numpy操作的补充。行列Index在DataFrame的加强对于各种数据逻辑操作帮助比较大。对pyplot的绘图函数也和两种数据结构绑定的很好。越...  

评分

一年前看过这本书,当时我还是一个Python小白,因为没有编程基础,连基本的语法都不会。所以最开始看这本书,就在第二章Ipython编译器这里卡了很久。在网上搜索各种信息后,安装了Anaconda3和jupyter notebook后,算是可以实现书的程序了。 然而,在第一章里就有部分语法是不...  

评分

书的内容不错,很适合做量化建模工具书,但是这个翻译真是不敢恭维,有些地方翻译的语句不通,有些地方直接译错了,比如刚才看到第220页写的“通常,我们不会使用DataFrame中一个或多个列作为行索引”,感觉这话说反了,看了一下英文原版电子版,原文是“It‘s not unusual to ...  

评分

评分

对第二版的翻译已无力吐槽,错误太明显。比如下图句子的in-place意思明明是原地修改,译者非要翻译成原对象,感觉译者计算机的基本素养有待提高,如果知道排序算法中的原地排序就不会这样翻译了,阅读时最好准备好英文版,遇到不通的地方翻阅一下英文版结合代码就可以了。或者...  

用户评价

评分

pandas!!!!!

评分

读完一个月以后才来标,把自己关在星巴克大概2.5周时间一点点啃下来的。一边读一边认真笔记、敲代码试例子、上网查各种函数里的参数的用法。作者就是Pandas的主要作者,对于我这种一点代码背景都没有的人来说,好像也没有更好的学习方法。到实战能用还得2周。但能看懂别人写的算法例子了。

评分

作者是pandas作者,之前在AQR工作的

评分

pandas

评分

向译者致敬,如果所有人在译书时都能亲自敲一遍代码再多点探索精神,中国的计算机启蒙书市场就不会一片灾难了。其实每个python第三方库的原始开发者都能出来现身说法一下,应该比随便什么人出本说明书就讲讲用法好得多,更何况能基于python标准库开发第三方库,功底也定然深厚,这本身也是书质量过关的保证,这点从numpy高级用法一章和附录A很容易感受到(我这种自学草民表示认识被刷新),有的时候why比how重要。现在看来pandas的初衷是做金融数据分析吧,时间数据的处理相当厉害。

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 book.quotespace.org All Rights Reserved. 小美书屋 版权所有