图书标签: 搜索引擎 计算机 编程 信息检索 自己动手写搜索引擎 Lucene 互联网 中文分词
发表于2024-11-21
自己动手写搜索引擎 pdf epub mobi txt 电子书 下载 2024
《自己动手写搜索引擎》是猎兔企业搜索开发团队的软件产品研发和项目实践的经验汇总。《自己动手写搜索引擎》全方位展现出一个商用级别的Lucene搜索解决方案,主要包括爬虫、自然语言处理和搜索实现部分。爬虫部分介绍了网页遍历方法和从网页提取主要内容的方法。
自然语言处理部分包括了中文分词从理论到实现以及在搜索引擎中的实用等细节。
其他自然语言处理的经典问题与实现包括:文档排重、文本分类、自动聚类、语法解析树、拼写检查、拼音转换等理论与实现方法。
在实现搜索方面,《自己动手写搜索引擎》用简单的例子介绍了完整的搜索实现过程,覆盖了从索引库的设计和索引库与数据库的同步到搜索用户界面设计与实现。搜索用户界面包括实现布尔逻辑查询、按区间范围查询、搜索结果按日期排序等。《自己动手写搜索引擎》还进一步介绍了搜索排序的优化方法。
最后以基于Lucene的搜索服务器Solr为例,展示了Lucene的最新应用方法。
全是代码太不给力了
评分代码贴太多了。
评分因为是java开发的,没怎么读懂,就了解了算法.
评分刚哥写的书我这辈子是都不看了.....
评分没怎么仔细看,了解了一下大致内容,以后可能会搞这方面的项目。
稻盛和夫曾经听到新员工抱怨:"我把公司想得太好了没想到其实福利制度并不健全,待遇也不怎么样"。结果稻盛和夫把抱怨的人骂了一顿:“没错,现在公司是不大,设备不足,制度也不健全。可是,让公司成为一家名声响亮,福利制度完善的企业不正是你们的工作吗?别妄想捡现成的,...
评分包括使用Java开发网络爬虫与Web数据挖掘等内容 http://www.lietu.com/images/WebCrawler.jpg
评分包括使用Java开发网络爬虫与Web数据挖掘等内容 http://www.lietu.com/images/WebCrawler.jpg
评分包括使用Java开发网络爬虫与Web数据挖掘等内容 http://www.lietu.com/images/WebCrawler.jpg
评分稻盛和夫曾经听到新员工抱怨:"我把公司想得太好了没想到其实福利制度并不健全,待遇也不怎么样"。结果稻盛和夫把抱怨的人骂了一顿:“没错,现在公司是不大,设备不足,制度也不健全。可是,让公司成为一家名声响亮,福利制度完善的企业不正是你们的工作吗?别妄想捡现成的,...
自己动手写搜索引擎 pdf epub mobi txt 电子书 下载 2024