本书将介绍如何使用Python编写网络爬虫程序获取互联网上的大数据。本书包括三部分内容:基础部分、进阶部分和项目实践。基础部分(第1~6章)主要介绍爬虫的三个步骤(获取网页、解析网页和存储数据),并通过诸多示例的讲解,让读者从基础内容开始系统性地学习爬虫技术,并在实践中提升Python爬虫水平。进阶部分(第7~12章)包括多线程的并发和并行爬虫、分布式爬虫、更换IP等,帮助读者进一步提升爬虫水平。项目实践部分(第13~16章)使用本书介绍的爬虫技术对几个真实的网站进行抓取,让读者能在读完本书后根据自己的需求写出爬虫程序。无论是否有编程基础,只要是对爬虫技术感兴趣的读者,本书就能带领读者从入门到进阶,再到实战,一步步了解爬虫,终写出自己的爬虫程序。
评分
评分
评分
评分
新手很友好,赞!
评分作为新手入门书相当适合,整体讲的都很浅,也对实际中可能遇到的很多问题作了相应的解答。不过问题就是,这本书让人怀疑作者完成之后到底有没有进行校对,漏洞百出都不足以形容它了。
评分对于我这种带着明确目的学爬虫的小白来说,这本书能让我短时间在作者的套路内修改出自己想要的代码并得到想要的数据。不过还是有很多细节知道这么做但不知道为什么,这也限制了进一步的提升,所以后续还是要认真补学python本身。
评分对于初入门的还是有一定的难度,很多地方没有说明为什么要用这个代码,只是自然而然的就用了新的代码,还没有任何解释,死记硬背是不可能学会的。。。而且,微信读书的代码部分很多缺失的,需要配合作者github学习。
评分跟着过了一遍,不得不说,这个作者的代码水平真的是………………一言难尽
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 book.quotespace.org All Rights Reserved. 小美书屋 版权所有