利用Python進行數據分析

利用Python進行數據分析 pdf epub mobi txt 電子書 下載2025

出版者:機械工業齣版社
作者:Wes McKinney
出品人:
頁數:464
译者:唐學韜
出版時間:2013-11-18
價格:89.00
裝幀:平裝
isbn號碼:9787111436737
叢書系列:
圖書標籤:
  • 數據分析
  • python
  • Python
  • 數據分析/挖掘
  • 數據挖掘
  • 編程
  • 計算機
  • 機器學習
  • Python
  • 數據分析
  • 編程
  • 機器學習
  • 可視化
  • 統計學
  • 數據清洗
  • 科學計算
  • 大數據
  • 人工智能
想要找書就要到 小美書屋
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

具體描述

【名人推薦】

“科學計算和數據分析社區已經等待這本書很多年瞭:大量具體的實踐建議,以及大量綜閤應用方法。本書在未來幾年裏肯定會成為Python領域中技術計算的權威指南。”

——Fernando Pérez 加州大學伯剋利分校 研究科學傢, IPython的創始人之一

【內容簡介】

還在苦苦尋覓用Python控製、處理、整理、分析結構化數據的完整課程?本書含有大量的實踐案例,你將學會如何利用各種Python庫(包括NumPy、pandas、matplotlib以及IPython等)高效地解決各式各樣的數據分析問題。

由於作者Wes McKinney是pandas庫的主要作者,所以本書也可以作為利用Python實現數據密集型應用的科學計算實踐指南。本書適閤剛剛接觸Python的分析人員以及剛剛接觸科學計算的Python程序員。

•將IPython這個交互式Shell作為你的首要開發環境。

•學習NumPy(Numerical Python)的基礎和高級知識。

•從pandas庫的數據分析工具開始。

•利用高性能工具對數據進行加載、清理、轉換、閤並以及重塑。

•利用matplotlib創建散點圖以及靜態或交互式的可視化結果。

•利用pandas的groupby功能對數據集進行切片、切塊和匯總操作。

•處理各種各樣的時間序列數據。

•通過詳細的案例學習如何解決Web分析、社會科學、金融學以及經•濟學等領域的問題。

著者簡介

Wes McKinney 資深數據分析專傢,對各種Python庫(包括NumPy、pandas、matplotlib以及IPython等)等都有深入研究,並在大量的實踐中積纍瞭豐富的經驗。撰寫瞭大量與Python數據分析相關的經典文章,被各大技術社區爭相轉載,是Python和開源技術社區公認的權威人物之一。開發瞭用於數據分析的著名開源Python庫——pandas,廣獲用戶好評。在創建Lambda Foundry(一傢緻力於企業數據分析的公司)之前,他曾是AQR Capital Management的定量分析師。

圖書目錄

目錄
前言 1
第1章 準備工作 5
本書主要內容 5
為什麼要使用Python進行數據分析 6
重要的Python庫 7
安裝和設置 10
社區和研討會 16
使用本書 16
緻謝 18
第2章 引言 20
來自bit.ly的1.usa.gov數據 21
MovieLens 1M數據集 29
1880—2010年間全美嬰兒姓名 35
小結及展望 47
第3章 IPython:一種交互式計算和開發環境 48
IPython基礎 49
內省 51
使用命令曆史 60
與操作係統交互 63
軟件開發工具 66
IPython HTML Notebook 75
利用IPython提高代碼開發效率的幾點提示 77
高級IPython功能 79
緻謝 81
第4章 NumPy基礎:數組和矢量計算 82
NumPy的ndarray:一種多維數組對象 83
通用函數:快速的元素級數組函數 98
利用數組進行數據處理 100
用於數組的文件輸入輸齣 107
綫性代數 109
隨機數生成 111
範例:隨機漫步 112
第5章 pandas入門 115
pandas的數據結構介紹 116
基本功能 126
匯總和計算描述統計 142
處理缺失數據 148
層次化索引 153
其他有關pandas的話題 158
第6章 數據加載、存儲與文件格式 162
讀寫文本格式的數據 162
二進製數據格式 179
使用HTML和Web API 181
使用數據庫 182
第7章 數據規整化:清理、轉換、閤並、重塑 186
閤並數據集 186
重塑和軸嚮鏇轉 200
數據轉換 204
字符串操作 217
示例:USDA食品數據庫 224
第8章 繪圖和可視化 231
matplotlib API入門 231
pandas中的繪圖函數 244
繪製地圖:圖形化顯示海地地震危機數據 254
Python圖形化工具生態係統 260
第9章 數據聚閤與分組運算 263
GroupBy技術 264
數據聚閤 271
分組級運算和轉換 276
透視錶和交叉錶 288
示例:2012聯邦選舉委員會數據庫 291
第10章 時間序列 302
日期和時間數據類型及工具 303
時間序列基礎 307
日期的範圍、頻率以及移動 311
時區處理 317
時期及其算術運算 322
重采樣及頻率轉換 327
時間序列繪圖 334
移動窗口函數 337
性能和內存使用方麵的注意事項 342
第11章 金融和經濟數據應用 344
數據規整化方麵的話題 344
分組變換和分析 355
更多示例應用 361
第12章 NumPy高級應用 368
ndarray對象的內部機理 368
高級數組操作 370
廣播 378
ufunc高級應用 383
結構化和記錄式數組 386
更多有關排序的話題 388
NumPy的matrix類 393
高級數組輸入輸齣 395
性能建議 397
附錄A Python語言精要 401
· · · · · · (收起)

讀後感

評分

評分

每一个数据分析师或是数据科学家都使用各自不同的技术栈。即使同样使用Python做为主力数据分析语言,每个人会用到的工具组合也不尽相同。 但不管怎么说,对于希望使用python来进行数据分析工作的人来说,学习iPython,NumPy,pandas,matpotlib这个组合是一个目前看来怎么都不...  

評分

不明觉厉,也许是水平不够,可是这书看起来太不友好了。买来啃不动,上网搜到了Python数据手册那本书,评分比这本高不少,来不及买,先在网上看作者的原版。对小白来说,数据手册那本书友好地多的多。看着手头这本,简直怀疑盗版!不推荐!这个出版社的印刷质量也不好!也许是...

評分

对第二版的翻译已无力吐槽,错误太明显。比如下图句子的in-place意思明明是原地修改,译者非要翻译成原对象,感觉译者计算机的基本素养有待提高,如果知道排序算法中的原地排序就不会这样翻译了,阅读时最好准备好英文版,遇到不通的地方翻阅一下英文版结合代码就可以了。或者...  

評分

用戶評價

评分

仔細去看第二章引言裏的例子是個錯誤。剩下的部分看起來挺舒服的,就是偶爾有些小錯。不知道過瞭3年,pandas庫變瞭多少orz

评分

入門書,零基礎看瞭這本書也能用python的pandas和matplotlib進行一些簡單的數據分析,數據分析不在乎用什麼工具,而是有目的地去找一y些insight,下一步我需要達到的效果是:如果産生一個想法,能用工具快速驗證(如數據預處理,繪齣圖標等)。

评分

工具書,所以不好用 實際場景下都是直接去查榖歌 來得更快,因為書裏隻涉及到瞭基礎的一些東西,工作場景下問題多瞭去瞭

评分

Pandas的最佳工具書.

评分

匆匆掃瞭一遍,看的不是很仔細,以後有需要再細看。

本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

© 2025 book.quotespace.org All Rights Reserved. 小美書屋 版权所有