【名人推荐】
“科学计算和数据分析社区已经等待这本书很多年了:大量具体的实践建议,以及大量综合应用方法。本书在未来几年里肯定会成为Python领域中技术计算的权威指南。”
——Fernando Pérez 加州大学伯克利分校 研究科学家, IPython的创始人之一
【内容简介】
还在苦苦寻觅用Python控制、处理、整理、分析结构化数据的完整课程?本书含有大量的实践案例,你将学会如何利用各种Python库(包括NumPy、pandas、matplotlib以及IPython等)高效地解决各式各样的数据分析问题。
由于作者Wes McKinney是pandas库的主要作者,所以本书也可以作为利用Python实现数据密集型应用的科学计算实践指南。本书适合刚刚接触Python的分析人员以及刚刚接触科学计算的Python程序员。
•将IPython这个交互式Shell作为你的首要开发环境。
•学习NumPy(Numerical Python)的基础和高级知识。
•从pandas库的数据分析工具开始。
•利用高性能工具对数据进行加载、清理、转换、合并以及重塑。
•利用matplotlib创建散点图以及静态或交互式的可视化结果。
•利用pandas的groupby功能对数据集进行切片、切块和汇总操作。
•处理各种各样的时间序列数据。
•通过详细的案例学习如何解决Web分析、社会科学、金融学以及经•济学等领域的问题。
Wes McKinney 资深数据分析专家,对各种Python库(包括NumPy、pandas、matplotlib以及IPython等)等都有深入研究,并在大量的实践中积累了丰富的经验。撰写了大量与Python数据分析相关的经典文章,被各大技术社区争相转载,是Python和开源技术社区公认的权威人物之一。开发了用于数据分析的著名开源Python库——pandas,广获用户好评。在创建Lambda Foundry(一家致力于企业数据分析的公司)之前,他曾是AQR Capital Management的定量分析师。
pandas主要基于numpy.ndarray构造了更高级的Series和DataFrame数据结构。这本书主要就是说明基于这两种数据结构的API用法。这些API主要是对原本numpy操作的补充。行列Index在DataFrame的加强对于各种数据逻辑操作帮助比较大。对pyplot的绘图函数也和两种数据结构绑定的很好。越...
评分 评分看了小部分,翻译文笔还比较顺畅,具体有没错误暂没注意到。原作者写的还到位。Python在网络与科学计算等领域的发展风生水起,得益于开源,无论是Numpy, Pandas, Scipy, Matplotlib, Scikit-learn, NLTK, 还是Django.
评分书的内容不错,很适合做量化建模工具书,但是这个翻译真是不敢恭维,有些地方翻译的语句不通,有些地方直接译错了,比如刚才看到第220页写的“通常,我们不会使用DataFrame中一个或多个列作为行索引”,感觉这话说反了,看了一下英文原版电子版,原文是“It‘s not unusual to ...
评分这本很好,比较全,也很好入门。
评分没介绍SciPy
评分2个月前第一次看 觉得进度很慢 ,复习了下python,又复习了statistics和数学,看了《集体智慧编程》和《统计思维》,再翻看这本书,一周就看完了,所有代码都敲了一遍。完完全全工具书。
评分http://gitbub.com/pydata/pydata-book里的参考数据已经不可用了
评分读完一个月以后才来标,把自己关在星巴克大概2.5周时间一点点啃下来的。一边读一边认真笔记、敲代码试例子、上网查各种函数里的参数的用法。作者就是Pandas的主要作者,对于我这种一点代码背景都没有的人来说,好像也没有更好的学习方法。到实战能用还得2周。但能看懂别人写的算法例子了。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 book.quotespace.org All Rights Reserved. 小美书屋 版权所有