图书标签: 搜索引擎 解密搜索引擎技术实战 互联网 web 计算机网络 计算机 电子工业 同学!
发表于2024-11-25
解密搜索引擎技术实战 pdf epub mobi txt 电子书 下载 2024
本书是猎兔搜索开发团队的软件研发和教学实践的经验汇总。
本书总结搜索引擎相关理论与实际解决方案,并给出了Java实现,其中利用了流行的开源项目Lucene和Solr,而且还包括原创的实现。
主要包括总体介绍部分、爬虫部分、自然语言处理部分、全文检索部分以及相关案例分析。
爬虫部分介绍了网页遍历方法和如何实现增量抓取。并介绍了从网页等各种格式的文档中提取主要内容的方法。
自然语言处理部分从统计机器学习的原理出发,包括了中文分词与词性标注的理论与实现以及在搜索引擎中的实用等细节。
同时对文档排重、文本分类、自动聚类、句法分析树、拼写检查等自然语言处理领域的经典问题做出了深入浅出的介绍并总结了实现方法。
在全文检索部分,结合Lucene3.0介绍了搜索引擎的原理与进展。用简单的例子介绍了Lucene的最新应用方法。包括完整的搜索实现过程:从完成索引到搜索用户界面的实现。本书还进一步介绍了实现准实时搜索的方法。
展示了Solr1.4版本的用法以及实现分布式搜索服务集群的方法。
最后介绍了在地理信息系统领域和户外活动搜索领域的应用。
猎兔搜索(http://www.lietu.com)创始人,当前猎兔搜索在北京和上海均设有研发部。带领猎兔搜索技术开发团队先后开发出猎兔中文分词系统、猎兔信息提取系统、猎兔智能垂直搜索系统以及网络信息监测系统等,实现互联网信息的采集、过滤、搜索和实时监测。
做搜索引擎可以看看,反正毕设跟他也差不多。
评分做搜索引擎可以看看,反正毕设跟他也差不多。
评分做搜索引擎可以看看,反正毕设跟他也差不多。
评分做搜索引擎可以看看,反正毕设跟他也差不多。
评分做搜索引擎可以看看,反正毕设跟他也差不多。
对搜索引擎技术讲解的比较全面,读了之后对搜索引擎技术能了解得比较全面。同时对于Lucene的介绍也是传承了本书的特点:细致、全面。看了之后对Lucene,还有起相关的组件Solar啊等等也有了初步的认识。对于初学者还是值得读一下的。对于搜索引擎技术和Lucene能够建立起立体全面...
评分一本太装的书,看着目录还行,看看里面的内容,就受不了了。。。 大部分内容没有深度,这个倒不算什么大问题 毕竟是实战嘛 很多地方 标题和内容根本对不上 不少地方语句之间衔接不起来 粗制滥造啊 拜托以后不要再写这种书了 首先要端正态度啊
评分搞一堆术语,本来很装逼的书... 结果,Struts2什么ajax都扯进来... 掉价... 个人认为是堆砌的书... 不值得购买... 当然....初学者嘛..还是值得看看入门的... 邮件列表更加有参考价值... 这书不专....求太广了.....就不太可能变的精...
评分正如大多数中国技术作家一样,这本厚厚的书对搜索的每部分都涉及了一点,而每部分的深度都比较浅,并且基本所有东西都可以轻易找到相关资料,作者自己对于这些技术的看法,适用范围之类的经验甚少。。总之我觉得读者看了目录就可以用搜索引擎来达到相关的学习效果了
评分搞一堆术语,本来很装逼的书... 结果,Struts2什么ajax都扯进来... 掉价... 个人认为是堆砌的书... 不值得购买... 当然....初学者嘛..还是值得看看入门的... 邮件列表更加有参考价值... 这书不专....求太广了.....就不太可能变的精...
解密搜索引擎技术实战 pdf epub mobi txt 电子书 下载 2024