蟲術——Python絕技

蟲術——Python絕技 pdf epub mobi txt 電子書 下載2025

出版者:電子工業齣版社
作者:梁睿坤
出品人:
頁數:428
译者:
出版時間:2018-7
價格:99
裝幀:平裝
isbn號碼:9787121344565
叢書系列:
圖書標籤:
  • Python
  • 計算機
  • 爬蟲
  • 機器學習
  • akb
  • CS
  • Python
  • 編程技巧
  • 代碼優化
  • 性能提升
  • 實戰
  • 進階
  • 高效
  • 實用
  • 技巧
  • 代碼藝術
想要找書就要到 小美書屋
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

具體描述

《蟲術——Python絕技》以大數據應用方麵常用的語言 Python 為基礎,從網絡爬蟲的實現原理入手,逐步引領讀者進入網絡爬蟲的世界。在各類爬蟲框架中,將 Scrapy 作為軸心,從多個維度揭開爬蟲技術的麵紗。例如,爬取規則的製定技巧,設計高速爬蟲,如何讓爬蟲更“聰明”地獲取數據,將海量數據進行分布式存儲的技術,設計具有高隱匿性的爬蟲,大規模、高並發的分布式爬蟲技術。

《蟲術——Python絕技》基於 Python 這門靈活且簡潔的語言,結閤作者在網絡數據爬取和大數據方麵的實際工程經驗,使得本書更具實用性。《蟲術——Python絕技》旨在讓更多數據工作者或編程愛好者在大數據時代從海量的信息中通過掌握“蟲術”來獲取對自已或企業有價值的信息。

著者簡介

近二十年軟件開發、項目管理、團隊建設和管理經驗。緻力於互聯網技術應用與大數據應用方麵的研究與開發工作。曾任多傢軟件公司的高級軟件工程師、項目經理、首席架構師和技術總監等職務。

現任廣州市增增智能科技有限公司CEO,從事視覺智能、語音智能及IoT等技術的産品研發與企業經營方麵的工作。

圖書目錄

第1章 爬蟲初步
1.1 爬蟲與大數據
1.1.1 大數據架構
1.1.2 爬蟲的作用與地位
1.1.3 Python與爬蟲
1.1.4 Python的網絡爬蟲框架
1.1.5 蟲術技術路綫圖
1.2 實例:簡單的爬蟲
1.3 內容分析進階
1.3.1 選擇器
1.3.2 深入BeautifulSoup
1.3.3 元素的搜尋
1.3.4 亂碼與中文編碼
1.4 新聞供稿的爬取實例
1.5 小結
第2章 Scrapy基礎知識
2.1 Scrapy架構
2.2 Scrapy快速入手
2.3 數據模型Item
2.4 蜘蛛—Spiders
2.5 管道—Item Pipeline
2.6 Scrapy的運行與配置
2.7 新聞供稿爬蟲的Scrapy實現
2.8 小結
第3章 Scrapy的工程管理
3.1 Scrapyd
3.2 scrapyd-client及部署
3.3 搭建爬蟲服務器
第4章 中階蟲術
4.1 蜘蛛的演化
4.1.1 蜘蛛的本質—深入Spider
4.1.2 通用蜘蛛
4.1.3 蜘蛛中間件
4.2 爬蟲係統的測試與調試
4.2.1 開發期調試
4.2.2 蜘蛛的測試
4.2.3 蜘蛛的運行期調試
4.2.4 調試內存溢齣
4.3 處理HTTP請求
4.3.1 HTTP請求
4.3.2 Scrapy的Request對象
4.3.3 錶單處理
4.3.4 下載器中間件
4.4 處理HTTP響應
4.4.1 HTTP響應
4.4.2 Scrapy的響應對象
4.4.3 深入選擇器
4.4.4 非結構化數據的提取
4.4.5 黑夜中的眼睛
4.5 處理JavaScript
4.5.1 示例:電商産品爬蟲
4.5.2 Selenium和PhantomJS
4.5.3 Scrapy與Splash
4.6 數據存儲與後處理
4.6.1 圖片的下載與存儲
4.6.2 示例:産品圖片采集
4.6.3 導齣到數據文件
4.6.4 導齣到數據庫
4.6.5 示例:基於阿裏雲的存儲後端
第5章 高階蟲術
5.1 增量式爬網
5.1.1 推演路由
5.1.2 時機的重要性
5.1.3 去重處理
5.1.4 布隆過濾器
5.1.5 基於Redis的布隆過濾器
5.2 突破封印
5.2.1 封禁淺析
5.2.2 客戶端仿真
5.2.3 化身萬韆—蜘蛛世界的易容術
5.2.4 反跟蹤
5.2.5 繞開蜜罐
5.3 蟲海
5.3.1 分布式爬蟲架構
5.3.2 認識scrapy-redis
5.3.3 示例:分布式電商爬蟲
5.4 可視化爬蟲
5.4.1 示例:某點評網爬蟲
5.4.2 解讀Portia爬蟲代碼
5.4.3 數據項加載器—Item Loaders
5.4.4 最後的工作
· · · · · · (收起)

讀後感

評分

評分

評分

評分

評分

用戶評價

评分

首先,我是個小白,其次,該書不適閤新手,應該適閤小白提升,接著,由於我是個小白,隻讀懂書中60%的內容,其中Scrapy工程管理,處理JavaScript(Splash),增量式爬蟲等高深的內容,希望能齣幾個實例或是視頻,讓我等小白好明白一點

评分

讓我說什麼好,18年的書,還在用著python2,scrapy也是基於1.0的,哎,結構也亂

评分

首先,我是個小白,其次,該書不適閤新手,應該適閤小白提升,接著,由於我是個小白,隻讀懂書中60%的內容,其中Scrapy工程管理,處理JavaScript(Splash),增量式爬蟲等高深的內容,希望能齣幾個實例或是視頻,讓我等小白好明白一點

评分

首先,我是個小白,其次,該書不適閤新手,應該適閤小白提升,接著,由於我是個小白,隻讀懂書中60%的內容,其中Scrapy工程管理,處理JavaScript(Splash),增量式爬蟲等高深的內容,希望能齣幾個實例或是視頻,讓我等小白好明白一點

评分

首先,我是個小白,其次,該書不適閤新手,應該適閤小白提升,接著,由於我是個小白,隻讀懂書中60%的內容,其中Scrapy工程管理,處理JavaScript(Splash),增量式爬蟲等高深的內容,希望能齣幾個實例或是視頻,讓我等小白好明白一點

本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

© 2025 book.quotespace.org All Rights Reserved. 小美書屋 版权所有