开发自己的搜索引擎--Lucene 2.0+Heriterx pdf epub mobi txt 电子书下载 2026

简体网页||繁体网页

☆☆☆☆☆

出版者:人民邮电出版社

作者:邱哲

出品人:

页数:521 页

译者:

出版时间:2007年6月1日

价格:65.00元

装帧:平装

isbn号码:9787115160003

丛书系列:

图书标签:

搜索引擎
Lucene
Heritrix
开发自己的搜索引擎——Lucene
SearchEngine
搜索
search
收索引擎
Lucene
搜索引擎
开发
中文
分布式
全文检索
Heriterx
索引
查询
高性能

下载链接在页面底部

facebook linkedin mastodon messenger pinterest reddit telegram twitter viber vkontakte whatsapp 复制链接

想要找书就要到小美书屋

book.quotespace.org

立刻按 ctrl+D收藏本页

你会得到大惊喜!!

具体描述

《开发自己的搜索引擎:Lucene 2.0+Heritrix》参加人邮社买书送礼活动,数量有限赶快抢购!详情请点击

　　第一本讲解如何使用Lucene和Heritrix来构建搜索引擎的书

　　一步一步带领您亲手构建企业级搜索引擎网站

　　国内资深搜索引擎开发专家车东推荐

　　配有一个完整的搜索引擎案例。这个案例有很强的实用价值，只需稍加修改，就能应用于实际项目，市场价值在30000元以上！

　　Google技术经理车东推荐

　　国内第一本详细介绍搜索引擎开发过程的图书

　　采用最新的Lucene 2.0

　　互联网搜索的使用水平可以反映全民的信息处理能力，几年前有研究发现美国用户比欧洲用户的互联网使用水平领先半年左右，主要是根据谁搜索时平均使用的关键词的个数多。中文用户的搜索使用水平相对于西文用户目前仍然处于比较初级的阶段，而中文网站搜索功能的缺失也是一个重要的因素。

网站拥有了较多内容后，最先会考虑基于目录的内容分类，以解决信息快速定位的问题，随着内容量的进一步增加，很多内容在发表之后就很快被湮没，成为“信息孤岛”，而不断加深的目录结构也会让用户逐渐失去耐心，这时，关键词检索的优势就体现出来了：

关键词检索可以让处于“信息孤岛”状态的内容以一种更直接的方法提供给用户；

和基于目录/分类的树形结构不同，基于关键词检索还可以让内容之间实现网状的关联结构，从而大大提高信息的引用密度。

基于传统数据库的关键词检索由于性能问题让很多网站放弃了搜索功能，问题的解决归根结底还是需要一个全文引擎。而Lucene开源引擎的出现让这种原来被少数公司掌握的技术得到了迅速的普及，这里应该再次感谢引擎的核心贡献者Doug Cutting先生，同时也希望有更多的中文开发人员能积极投入到Lucene的相关项目开发中去，尤其在中文和其他亚洲双字节语言处理方面的问题。

Lucene也是我学习的第一个Java程序，当初是通过jdb一行行dubug了解其中的原理和机制的，非常高兴有这样一本专门的参考书出现，它无疑会为开发人员了解并更快掌握全文检索技术节省大量的时间。

国内资深搜索引擎开发专家车东

　　《开发自己的搜索引擎:Lucene 2.0+Heritrix》详细介绍了如何应用Lucene进行搜索引擎开发，通过学习《开发自己的搜索引擎:Lucene 2.0+Heritrix》，读者可以完成构建一个企业级的搜索引擎网站。

　　《开发自己的搜索引擎:Lucene 2.0+Heritrix》是国内第一本使用Lucene和Heritrix来讲解搜索引擎构建的书，通过详细的对API和源代码的分析，力求使读者在应用的基础上，能够深入其核心，自行扩展和开发相应组件，发挥想象力，开发出更具有创意的搜索引擎产品。《开发自己的搜索引擎:Lucene 2.0+Heritrix》适合Java程序员和从事计算机软件开发的其他编程人员阅读，同时也可以作为搜索引擎爱好者的入门书籍。

　　由于目前市面上从技术层面介绍搜索引擎的书并不多，即使有，也大多停留在理论阶段，而非搜索引擎的开发过程。因此，可以说《开发自己的搜索引擎:Lucene 2.0+Heritrix》是国内第一本详细介绍搜索引擎开发过程的图书。

　　（1）采用最新的Lucene 2.0。以前大家用的1.4.3版本，而最新的Lucene 2.0重写了很多API，内部的实现方法也有了很大优化。《开发自己的搜索引擎:Lucene 2.0+Heritrix》的代码都是在2.0版本下调试通过的，这样可以帮助读者了解Lucene的更多新功能。

　　（2）配有一个完整的搜索引擎案例。这个案例有很强的实用价值，只需稍加修改，就能应用于实际项目，市场价值在30000元以上！

　　（3）着重解决开发人员头痛的问题。《开发自己的搜索引擎:Lucene 2.0+Heritrix》的目的是指导项目实践，因此没有罗列各个API的用法，而是对常见的开发问题进行深入探讨，比如《开发自己的搜索引擎:Lucene 2.0+Heritrix》的第7章，是专门为解决“Word，Excel和PDF文件如何解析”这个问题而设置的。

　　（4）内容新颖，前卫实用。《开发自己的搜索引擎:Lucene 2.0+Heritrix》介绍了Compass、Heritrix、DWR和HTMLParser等内容。在搜索引擎开发的过程中，这些均为相当重要且实用的技术，笔者经过自身实践将它们展现给读者，希望能让读者在学习Lucene的同时开拓视野。

作者简介

目录信息

第一篇　搜索引擎入门
第1章　搜索引擎与信息检索基础
1.1　搜索引擎的历史
1.1.1　萌芽：Archie、Gopher
1.1.2　起步：Robot(网络机器人)的出现与Spider(网络爬虫)
1.1.3　发展：Excite、Galaxy、Yahoo等
1.1.4　繁荣：Infoseek、AltaVista、Google和Baidu
1.2　信息检索系统的基本知识
1.2.1　什么是信息检索系统
1.2.2　信息检索的过程
1.2.3　传统查找的优点和不足
1.2.4　使用索引提高检索速度
1.2.5　倒排索引
1.2.6　评价信息检索系统的标准
1.3　Lucene简介
1.4　小结
第二篇　Lucene开发详解
第2章　Lucene入门实例
2.1　实例介绍
2.1.1　实例说明
2.1.2　开发过程
2.2　准备工作
2.2.1　将文档的全角标点转换成半角标点
2.2.2　将大文档切分成多个小文档
2.2.3　预处理源文件的统一接口
2.3　创建Eclipse工程
2.3.1　准备工作
2.3.2　创建工程并引入Lucene的JAR包
2.3.3　运行文档预处理类
2.3.4　创建处理文档的索引类：IndexProcessor
2.3.5　创建检索索引的搜索类
2.4　运行效果
2.5　小结
第3章　Lucene索引的建立
3.1　Document逻辑文件
3.1.1　Lucene的Document
3.1.2　为Document添加多种Field
3.1.3　Document的内部实现
3.2　Field的内部实现
3.2.1　Field包含的类
3.2.2　Field类的构造方法
3.3　Lucene的索引工具IndexWriter
3.3.1　IndexWriter的初始化
3.3.2　向索引添加文档
3.3.3　限制每个Field中的词条的数量
3.4　Lucene索引过程详解
3.4.1　Lucene索引建立过程概述
3.4.2　使用addDocument方法向索引添加文档
3.4.3　DocumentWriter的addDocument方法
3.4.4　文档的倒排
3.4.5　对postingTable进行排序
3.4.6　将Posting信息写入索引
3.5　索引文件格式
3.5.1　索引的segment
3.5.2　.fnm格式
3.5.3　.fdx与.fdt格式
3.5.4　.tii与.tis格式
3.5.5　deletable格式
3.5.6　复合索引格式.cfs
3.6　索引过程的优化
3.6.1　合并因子mergeFactor
3.6.2　maxMergeDocs
3.6.3　minMergeDocs
3.7　索引的合并与索引的优化
3.7.1　FSDirectory与RAMDirectory
3.7.2　使用IndexWriter来合并索引
3.7.3　索引的优化
3.8　从索引中删除文档　 3.8.1　索引的读取工具IndexReader
3.8.2　使用文档ID号来删除特定文档
3.8.3　使用Field信息来删除批量文档
3.9　Lucene的同步问题
3.9.1　为什么要进行同步以及Lucene的同步法则
3.9.2　commit.lock与write.lock
3.10　Lucene 2.0的新类：IndexModifier类
3.11　小结
第4章　Lucene的搜索
4.1　使用IndexSearcher进行搜索
4.1.1　初始化IndexSearcher
4.1.2　IndexSearcher最简单的使用
4.1.3　IndexSearcher的多种search方法
4.2　Hits类详解
4.2.1　Hits类的公有接口
4.2.2　效率分析
4.2.3　Hits内部的缓存
4.2.4　Hits类的工作原理
4.3　对搜索结果的评分
4.3.1　文档与词条的向量空间
4.3.2　Lucene的文档得分算法
4.4　构建各种Lucene内建的Query对象
4.4.1　toString查看原子查询
4.4.2　查询重写与权重
4.4.3　TermQuery词条搜索
4.4.4　BooleanQuery布尔搜索
4.4.5　RangeQuery范围搜索
4.4.6　PrefixQuery前缀搜索
4.4.7　PhraseQuery短语搜索
4.4.8　MultiPhraseQuery多短语搜索
4.4.9　FuzzyQuery模糊搜索
4.4.10　WildcardQuery通配符搜索
4.4.11　SpanQuery跨度搜索
4.5　第三方提供的Query对象：RegexQuery
4.6　通过QueryParser转换用户关键字　 4.6.1　词条的定义
4.6.2　QueryParser初始化
4.6.3　改变QueryParser默认的布尔逻辑
4.6.4　短语和QueryParser
4.6.5　FuzzyQuery和QueryParser
4.6.6　通配符与QueryParser
4.6.7　查找指定的Field
4.6.8　RangeQuery与QueryParser
4.6.9　QueryParser和SpanQuery
4.7　多Field搜索与多索引搜索
4.7.1　多域搜索MultiFieldQueryParser
4.7.2　MultiSearcher在多个索引上搜索
4.7.3　ParalellMultiSearcher：多线程搜索
4.7.4　Searchable和RMI
4.8　小结
第5章　排序、过滤和分页
5.1　相关度排序
5.1.1　使用Score进行自然排序
5.1.2　Searcher的explain方法
5.1.3　通过改变boost值来改变文档的得分
5.2　使用Sort来排序
5.2.1　Sort简介
5.2.2　SortField
5.2.3　按文档得分进行排序
5.2.4　按文档的内部ID号来排序
5.2.5　按一个或多个Field来排序
5.2.6　改变SortField中的Locale信息
5.3　搜索的过滤器
5.3.1　过滤器的基本结构
5.3.2　一个简单的Filter：建立索引
5.3.3　一个简单的Filter：打印索引文档信息
5.3.4　一个简单的Filter：安全级别与过滤器代码
5.3.5　一个简单的Filter：在搜索时应用过滤器
5.3.6　一个简单的Filter：总结
5.3.7　按范围过滤RangeFilter
5.3.8　在结果中查询QueryFilter
5.3.9　缓存结果：CachingWrapperFilter
5.4　翻页问题
5.4.1　依赖于session的翻页
5.4.2　多次查询
5.4.3　缓存+多次查询
5.4.4　缓存+多次查询+数据库
5.5　小结
第6章　Lucene的分析器
6.1　分析
6.1.1　分词
6.1.2　Lucene的分析器的结构
6.1.3　Lucene的分析器的实现
6.2　Lucene与JavaCC
6.2.1　JavaCC简介
6.2.2　JavaCC为Lucene提供的分析器脚本
6.2.3　Lucene的标准分析器
6.2.4　标准过滤器：StandardFilter
6.2.5　大小写转换器：LowerCaseFilter
6.2.6　忽略词过滤器：StopFilter
6.3　分析器的进阶
6.3.1　再看StandardAnalyzer中的管道过滤器结构
6.3.2　长度过滤器：LengthFilter
6.3.3　PerFieldAnalyzerWrapper
6.3.4　其他
6.4　对中文的分析
6.4.1　现有的中文分词方式简介
6.4.2　中科院的分词软件和JE分词
6.5　小结
第三篇　Lucene相关话题
第7章　对Word、Excel 和PDF的处理
7.1　使用PDFBox处理PDF文档
7.1.1　PDFBox的下载
7.1.2　在Eclipse中配置
7.1.3　使用PDFBox解析PDF内容
7.1.4　运行效果
7.1.5　与Lucene的集成
7.2　使用xpdf来处理中文PDF文档
7.2.1　xpdf的下载
7.2.2　配置
7.2.3　提取中文
7.2.4　运行效果
7.3　使用POI来处理Excel和Word文件格式
7.3.1　对Excel的处理类
7.3.2　ExcelReader的运行效果
7.3.3　POI中Excel文件Cell的类型
7.3.4　对Word的处理类
7.4　使用Jacob来处理Word文档
7.4.1　Jacob的下载
7.4.2　在Eclipse中配置
7.5　小结
第8章　Compass：封装了Lucene的框架
8.1　Compass简介
8.1.1　Compass的下载
8.1.2　Compass的代码片断
8.2　Compass的初始配置
8.2.1　Compass的配置文件
8.2.2　将索引存放于内存中
8.2.3　使用JDBC来存储索引
8.2.4　使用连接池来存储索引
8.2.5　加载compass.cfg.xml文件
8.3　域模型的配置
8.3.1　实体代码
8.3.2　实体关系
8.3.3　实体Book的配置文件
8.3.4　通用元数据定义文件(.cmd.xml)
8.3.5　Author和Article的配置文件
8.4　使用Compass来建立索引
8.4.1　索引代码
8.4.2　对象关系图和运行结果
8.5　使用Compass来搜索
8.5.1　使用find()方法搜索
8.5.2　CompassHits类型
8.5.3　CompassHit类型
8.5.4　使用Lucene语法来查找
8.6　配置Analyzer和Optimizer
8.7　小结
第9章　Lucene分布式和Google Search API
9.1　Lucene与分布式
9.1.1　什么是GFS
9.1.2　为Lucene提供分布式的几点设想
9.2　Google的Search API
9.2.1　搭建环境
9.2.2　构建搜索类
9.2.3　设置查询时的参数和查询语法
9.2.4　运行测试
9.3　小结
第四篇　网络爬虫Heritrix
第10章　无比强大的网络爬虫Heritrix
10.1　Heritrix使用入门
10.1.1　下载和运行Heritrix
10.1.2　在Eclipse里配置Heritrix的开发环境
10.1.3　创建一个新的抓取任务
10.1.4　设置抓取时的处理链
10.1.5　设置运行时的参数
10.1.6　运行抓取任务
10.1.7　Heritrix的镜像存储结构
10.1.8　终止抓取或终止Heritrix的运行
10.2　Heritrix的架构
10.2.1　抓取任务CrawlOrder
10.2.2　中央控制器CrawlController
10.2.3　Frontier链接制造工厂
10.2.4　用Berkeley DB实现的BdbFrontier
10.2.5　Heritrix的多线程ToeThread和ToePool
10.2.6　处理链和Processor
10.3　扩展和定制Heritrix
10.3.1　向Heritrix中添加自己的Extractor
10.3.2　定制Queue-assignment-policy的两个问题
10.3.3　定制Queue-assignment-policy继承QueueAssignmentPolicy类
10.3.4　扩展FrontierScheduler来抓取特定的内容
10.3.5　在Prefetcher中取消robots.txt的限制
10.4　小结
第五篇　构建垂直搜索引擎
第11章　搜索引擎综合实例：准备篇
11.1　实例简介以及实现途径
11.1.1　选择网站
11.1.2　太平洋电脑网和网易手机频道
11.1.3　分析网站内容并准备抓取清单
11.1.4　从下拉列表获得手机品牌首页
11.1.5　解析手机品牌页面
11.2　在Heritrix中为pconline开发抓取所需的定制类
11.2.1　保存所有产品的页面和图片
11.2.2　不保存其他无关页面
11.2.3　开始抓取
11.3　在Heritrix中为网易手机频道开发抓取所需的定制类
11.3.1　分析网易手机频道
11.3.2　设计抓取代码
11.4　在Eclipse中创建工程结构
11.4.1　下载插件
11.4.2　在Eclipse中配置插件
11.4.3　创建工程
11.4.4　设置工程的Context
11.4.5　设定源代码存放和输出路径
11.4.6　添加Java代码
11.4.7　添加Jar包
11.4.8　创建JSP文件
11.4.9　工程整体结构一览
11.5　设定配置文件及其相关类
11.5.1　系统属性配置文件
11.5.2　封装配置文件
11.6　产品详细信息文件格式
11.7　解析网页信息的基类Extractor
11.8　太平洋电脑网手机产品页面Extractor
11.9　pconline产品信息运行效果测试
11.9.1　编写测试函数
11.9.2　执行测试
11.10　网易手机频道的产品信息运行效果
11.11　构建产品信息词库
11.12　数据库与索引结构
11.12.1　定义Product类
11.12.2　确定数据库与索引的结构
11.13　数据库处理和索引处理
11.13.1　对数据库进行操作
11.13.2　对索引进行操作
11.14　调用数据库处理类和索引处理类
11.15　运行
11.16　小结
第12章　使用正则表达式与HTMLParser提取网页内容
12.1　HTML的基本知识
12.2　JDK中的正则表达式提取网页内容
12.2.1　java.util.regex包
12.2.2　正则表达式提取网页内容实例
12.3　HTMLParser提取网页内容
12.3.1　HTMLParser的下载
12.3.2　HTMLParser概述
12.3.3　Lexer的功能及实现
12.3.4　HTMLParser的功能及实现
12.3.5　HTMLParser实例
12.4　小结
第13章　搜索引擎综合实例：DWR
13.1　DWR的下载
13.2　DWR入门与实例演示
13.2.1　创建工程结构
13.2.2　在web.xml中配置DWR
13.2.3　配置dwr.xml
13.2.4　页面代码
13.2.5　运行效果
13.2.6　DWR与直接使用XMLHttpRequest对象的比较
13.2.7　在DWR中操纵自定义的对象
13.2.8　查看DWR的输出日志
13.3　dwr.xml的配置
13.3.1　dwr.xml的标准结构
13.3.2　标签与DWR自带的converter和creator
13.3.3　标签
13.3.4　标签
13.3.5　另一个例子
13.4　util.js
13.4.1　调用util.js
13.4.2　使用useLoadingMessage方法显示提示图标
13.4.3　DWRUtil.setValue和DWRUtil.getValue
13.4.4　DWRUtil.getValues和DWRUtil.setValues
13.4.5　DWRUtil.addOptions和DWRUtil.removeAllOptions
13.4.6　DWRUtil.addRows和DWRUtil.removeAllRows
13.4.7　DWRUtil.toDescriptiveString方法
13.5　小结
第14章　搜索引擎综合实例：Web篇
14.1　配置文件
14.1.1　Spring配置文件
14.1.2　DWR配置文件
14.1.3　web.xml
14.2　各种Bean类
14.2.1　SearchResult
14.2.2　SearchResults
14.2.3　SearchRequest
14.3　SearchService的实现
14.4　SearchResultDao
14.5　前台部分
14.5.1　搜索主页面main.jsp
14.5.2　图片的显示
14.5.3　详细信息页面detail.jsp
14.6　问题
14.7　小结
· · · · · · (收起)

读后感

评分☆☆☆☆☆

在进大学前就看到过这本书，当时虽然不懂多少代码，但是它坚定了我进计算机系的选择。大三的时候要用Lucene而真正开始用这本书，感觉就像是老朋友一样，十分迅速的学会了Lucene。它不但教怎么用Lucene，还会教其原理，例如一个细节：Lecene的TF是要开根号的。这个细节使得我的...

评分☆☆☆☆☆

我基本上看过了这本书，其中代码部分讲解比较详细，但是第八章不太详细！另:我买这本书的时候，缺了几页现在无法更换，如有读者也在读这本书，真心请求给予帮助，我少的页码是400，401，404，405，412，413！如能给给予提供，万分感谢。 email： feiniao0401@yahoo.com.cn QQ:...

评分☆☆☆☆☆

或者是因为期望比较高，所以失望比较大。这本书对Lucene和Heritrix，HTMLParser等等开源工具做了一些介绍，并不怎么深入。而且实际没有完整地给出一个搜索引擎的框架。虽然有一个可以进行搜索的例子，但是离一个可用的搜索引擎还是比较远的。例如我想一个搜索引擎最少内部...

评分☆☆☆☆☆

这本书还是不错的，通过一个丰富的例子，把Lucene，Heritrix,HTMLParser几种技术结合起来。让人可以通过这本书举一反三，做出类似的项目。

用户评价

评分☆☆☆☆☆

从语言风格来看，作者的文字功底非常扎实，行文流畅，逻辑严密，既有学术的严谨，又不失工程师的务实幽默。我发现自己读起来并不枯燥，常常会被一些精妙的比喻逗笑，这在阅读技术书籍时是极其难得的体验。书中大量引用的行业案例也很有说服力，让抽象的概念具体化了。但美中不足的是，部分段落的句子结构似乎过于复杂和冗长，偶尔需要反复阅读才能完全捕捉到作者想要表达的完整意思，尤其是在涉及多层嵌套从句时，使得阅读节奏偶尔会被打断。如果能适当增加一些短句，使得信息的切割更清晰，阅读体验会更加“丝滑”，更符合现代快节奏的技术信息摄入习惯。

评分☆☆☆☆☆

我尝试着按照书中的示例代码进行实战演练，发现作者在代码块的设计上非常用心，几乎每一个核心概念都配有可直接运行的、注释详尽的片段。这种手把手的教学方式，极大地降低了学习曲线。然而，在我尝试集成某个特定版本依赖库时，遇到了一个小小的冲突，书中的依赖版本略显陈旧，导致我不得不花额外的时间去查阅官方文档进行版本适配和依赖降级/升级。这在速变的软件开发领域是难以避免的，但如果能在勘误表或者在线资源库中及时同步最新的版本兼容性指南，对于读者来说将是莫大的便利。那种“书本内容与现实环境完美契合”的顺畅感，是衡量一本优秀技术书的关键标准之一，期待未来能看到这种与时俱进的更新机制。

评分☆☆☆☆☆

这本书的结构组织体现了极高的匠心，它仿佛是为一位有一定基础但渴望系统化进阶的学习者量身定制的蓝图。从基础概念的铺陈到复杂系统的架构拆解，每一步都像是经过精心计算的算法，步步为营，没有丝毫的冗余。我喜欢它在每个章节末尾设置的“思考题”或者“延伸阅读推荐”，这极大地激发了我的主动探索欲，让我不止步于书本本身。然而，关于实际项目部署和运维方面的实践经验分享，略显不足。例如，在面对大规模集群故障排查时的实战经验、高并发读写压力下的监控指标选取建议，这些“战场上学到的经验”如果能有更多的篇幅来阐述，这本书的实用价值和指导性会更加强大，真正成为从理论到实战的完美桥梁。

评分☆☆☆☆☆

这本书的理论深度相当可观，它并没有停留在 API 的简单罗列，而是深入剖析了底层的数据结构原理和设计哲学。我尤其欣赏作者对于“为什么”的解释，比如为何选择倒排索引而非其他结构，以及在分布式环境下如何权衡一致性与可用性。这种深度思考，让我对整个信息检索领域的理解得到了质的飞跃，不再只是一个工具的使用者，更像是一个原理的探索者。唯一的遗憾是，在讨论到某些高级的性能调优策略时，篇幅略显仓促，像是匆匆带过。比如，关于内存映射文件（mmap）在不同操作系统上的具体差异化表现，如果能再多一两个对比案例，或者提供一些针对特定瓶颈场景的诊断思路，那这本书的价值就可以从“优秀”迈向“殿堂级”了。

评分☆☆☆☆☆

这本书的装帧和排版简直是一场视觉享受，那种厚重感和沉甸甸的知识分量，光是捧在手里就能感受到作者倾注的心血。我特别喜欢它在章节过渡时那种巧妙的留白和字体选择，让人在长时间的技术阅读后，眼睛也能得到片刻的喘息。不过，我发现其中一些图表的清晰度，尤其是一些涉及到复杂数据结构流程图的地方，如果能再精细一些，或许能让初学者理解起来更加得心应手。比如在阐述索引构建的细节时，如果能用更现代的矢量图而非低分辨率的位图，那体验绝对会提升一个档次。整体来说，作为一本技术书籍，它的纸张质量和印刷工艺绝对是上乘的，阅读体验一流，这对于经常需要对照翻阅的开发者来说，无疑是个巨大的加分项。我希望作者在后续的版本中，能对这部分视觉体验做进一步的优化，让内容的呈现更具现代感和专业度。

评分☆☆☆☆☆

入门级的书籍。

评分☆☆☆☆☆

我昨天反复看了很多遍，我认为这是一本十分优秀的书，作者的能力与讲解的功力都很深。这里面重要的并不是例子实现的好坏，而是教会你一些思考的通用方法。也就是给你思想。这是最重要的。

评分☆☆☆☆☆

比较基本，很好的Lucene入门书籍！

评分☆☆☆☆☆

入门尚可，对小白很有用

评分☆☆☆☆☆