本书介绍了网络爬虫开发中的关键问题与Java实现。主要包括从互联网获取信息与提取信息和对Web信息挖掘等内容。本书在介绍基本原理的同时注重辅以具体代码实现来帮助读者加深理解,书中部分代码甚至可以直接使用。 本书适用于有Java程序设计基础的开发人员。同时也可以作为计算机相关专业本科生或研究生的参考教材。
虽然是最近才出的一本书,里面涉及到知识大部分可以在网络上找到,如第一章后面列举的爬虫,就有同样的英文文档,而且是很早以前的,作者根本没有自己去做些分析。第二章的bigtable,consistent hash都是现有论文或文章。 书中大段的代码其实也是没必要的,光盘里都有,书的内容...
评分《自己动手写网络爬虫》 作者亲自主讲。每年培训不超过3期。 随着智能软件的不断普及,搜索引擎开发成为一项极富含金量的工作,市场对搜索软件开发工程师的需求极其旺盛。大型搜索门户需要大量专门的搜索软件开发人才,而众多中小型网站及企业也需要垂直搜索,...
评分 评分想了解一下nutch,然后买了这本书,但是作者大量的copy网络资料,而且例子举得也很烂,然后东一点,西一点拼凑了这本书,看了几章,实在看不下去了。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。...
评分感觉只是整理一下网络上的资源,很少有作者自己的思考。
评分只看了一点
评分翻完了, Java实现, 不是俺的菜,大概了解爬虫
评分因为要写这方面的毕业设计所以买了这本书,我觉得入门看挺好的,如果要深入研究就找个开源爬虫实现好好研究一下
评分跑题了不少。大量代码堆砌,甚至有的章节上来什么都没说,先印刷了十来页代码。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 book.quotespace.org All Rights Reserved. 小美书屋 版权所有