本書站在初學者的角度,從原理到實踐,循序漸進地講述瞭使用Python開發網絡爬蟲的核心技術。全書從邏輯上可分為基礎篇、實戰篇和爬蟲框架篇三部分。基礎篇主要介紹瞭編寫網絡爬蟲所需的基礎知識,分彆是網站分析、數據抓取、數據清洗和數據入庫。網站分析講述如何使用Chrome和Fiddler抓包工具對網絡做全麵分析;數據抓取介紹瞭Python爬蟲模塊Urllib和Requests的基礎知識;數據清洗主要介紹字符串操作、正則和Beautiful Soup的使用;數據入庫分彆講述瞭MySQL和MongoDB的操作,通過ORM框架SQLAlchemy實現數據持久化,實現企業級開發。實戰篇深入講解瞭分布式爬蟲、爬蟲軟件開發與應用、12306搶票程序和微博爬取,所舉示例均來自於開發實踐,可幫助讀者快速提升技能,開發實際項目。框架篇主要講述Scrapy的基礎知識,並通過爬取QQ音樂為實例,讓讀者深層次瞭解Scrapy的使用。
本書內容豐富,注重實戰,適用於從零開始學習網絡爬蟲的初學者,或者是已經有一些網絡爬蟲編寫經驗,但希望更加全麵、深入理解Python爬蟲的開發人員。
黃永祥,CSDN博客專傢和簽約講師,多年軟件研發經驗,主要從事機器人流程係統研發、大數據係統研發、網絡爬蟲研發以及自動化運維係統研發。擅長使用Python編寫高質量代碼,對Python有深入研究,熱愛分享和新技術的探索。
評分
評分
評分
評分
拼之湊之書之?
评分拼之湊之書之?
评分很適閤小白入門,項目講解詳細易懂
评分拼之湊之書之?
评分很適閤小白入門,項目講解詳細易懂
本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度,google,bing,sogou 等
© 2025 book.quotespace.org All Rights Reserved. 小美書屋 版权所有