深入理解ElasticSearch

深入理解ElasticSearch pdf epub mobi txt 電子書 下載2025

出版者:機械工業齣版社
作者:拉斐爾·酷奇(Rafal Kuc)
出品人:
頁數:250
译者:張世武
出版時間:2016-1
價格:69.00元
裝幀:平裝
isbn號碼:9787111524168
叢書系列:雲計算與虛擬化技術叢書
圖書標籤:
  • 搜索引擎
  • Elasticsearch
  • elasticsearch
  • 計算機
  • 編程
  • ES
  • 技術
  • Java
  • ElasticSearch
  • 搜索引擎
  • 分布式
  • 全文檢索
  • 高性能
  • 索引
  • 查詢
  • 分布式係統
  • 數據存儲
  • 實時搜索
想要找書就要到 小美書屋
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

具體描述

資深軟件開發專傢、架構師撰寫,係統且深入闡釋ElasticSearch涉及的工具、方法、原則和實踐,深入剖析ElasticSearch應用過程中遇到的各個層麵的問題,涉及分布式索引機製、係統監控及性能優化、用戶體驗改善、Java API應用,以及自定義插件開發等,能為工程師與架構師快速提高ElasticSearch水平提供有效指導。

本書共9章,第1章介紹Apache Lucene的工作方式、ElasticSearch的基本概念以及ElasticSearch的工作機製;第2章描述Lucene評分機製、如何進行查詢重寫,以及ElasticSearch的批處理API和如何使用過濾器來優化查詢;第3章描述如何修改Lucene評分,如何使用不同的倒排索引格式來改變索引字段的結構;第4章闡述如何選擇恰當的索引分片、路由工作機製、索引分片機製;第5章介紹如何為具體應用選擇正確的目錄實現,同時闡述發現、網關、恢復模塊及其配置方式,以及調優ElasticSearch的緩存機製;第6章介紹JVM垃圾收集的工作原理、重要性以及如何調優;第7章介紹幫助修正查詢中的拼寫錯誤以及構建高效的自動完成機製——查詢建議,還展示如何通過使用不同查詢類型和ElasticSearch的其他功能來提高查詢相關性;第8章重點闡釋ElasticSearch的JAVA API;第9章通過演示如何開發你自己的河流和語言處理插件來介紹ElasticSearch的插件開發。

著者簡介

ElasticSearch是一個優秀的開源分布式搜索引擎,同時有良好的社區和商業支持。對於中小型的垂直搜索引擎,ElasticSearch是一個不錯的選擇。本書是一本ElasticSearch的進階教材,深入剖析DSL、索引控製、分布式實現、係統運維等高級內容,特彆適閤深入研究ElasticSearch。

—— 徐川 明星衣櫥CTO,前雅虎高級工程師

ElasticSearch的齣現,讓開源搜索産品真正進入分布式時代。本書是一本不可多得的關於ElasticSearch的著作,既對ElasticSearch的全文索引、IR模型、分布式機製有深入剖析,又有生動翔實的示例,能幫助讀者快速提升在該領域的技術水平。

—— 高劍林 騰訊(架構平颱部)資深技術專傢

除瞭用於搜索,ElasticSearch也是日誌存儲、離綫數據分析挖掘的利器。本書深入淺齣,案例豐富,在信息檢索模型、準實時搜索、分布式架構、係統優化等諸多方麵都有精彩的論述。

—— 李偉博士 微軟(bing)數據挖掘組高級工程師

很高興看到《Mastering ElasticSearch》中文版麵市,本書對ElasticSearch的分布式係統架構、係統調優有較深入的探討,是一本進階的好讀物,其中一些係統設計思維對於文件係統研發人員也是有所裨益的。

—— 許加強 前IBM(GPFS)資深工程師

盡管ElasticSearch是一個開源搜索産品,它在百度也被廣泛應用。目前已經覆蓋到20多個業務綫。這本書針對性較強,既不乏典型實例,也有一定的理論深度。非常適閤進階用戶閱讀。

—— 陳鐵兵 百度網頁搜索部高級工程師

圖書目錄

譯者序
前言
緻謝
作者簡介
評審者簡介
第1章 ElasticSearch簡介1
1.1 Apache Lucene簡介1
1.1.1 熟悉Lucene2
1.1.2 Lucene的總體架構2
1.1.3 分析你的數據3
1.1.4 Lucene查詢語言4
1.2 ElasticSearch簡介6
1.2.1 ElasticSearch的基本概念7
1.2.2 ElasticSearch架構背後的關鍵概念8
1.2.3 ElasticSearch的工作流程9
1.3 小結13
第2章 查詢DSL進階14
2.1 Apache Lucene默認評分公式解釋14
2.1.1 何時文檔被匹配上15
2.1.2 TF/IDF評分公式15
2.1.3 ElasticSearch如何看評分16
2.2 查詢改寫17
2.2.1 前綴查詢範例17
2.2.2 迴顧Apache Lucene19
2.2.3 查詢改寫的屬性20
2.3 二次評分21
2.3.1 理解二次評分21
2.3.2 範例數據21
2.3.3 查詢22
2.3.4 二次評分查詢的結構22
2.3.5 二次評分參數配置23
2.3.6 小結24
2.4 批量操作24
2.4.1 批量取24
2.4.2 批量查詢26
2.5 排序27
2.5.1 基於多值字段的排序28
2.5.2 基於多值geo字段的排序28
2.5.3 基於嵌套對象的排序30
2.6 數據更新API31
2.6.1 簡單字段更新31
2.6.2 使用腳本按條件更新32
2.6.3 使用更新 API創建或刪除文檔33
2.7 使用過濾器優化查詢33
2.7.1 過濾器與緩存34
2.7.2 詞項查找過濾器36
2.8 ElasticSearch切麵機製中的過濾器與作用域40
2.8.1 範例數據40
2.8.2 切麵計算和過濾41
2.8.3 過濾器作為查詢的一部分42
2.8.4 切麵過濾器44
2.8.5 全局作用域45
2.9 小結47
第3章 底層索引控製48
3.1 改變Apache Lucene的評分方式48
3.1.1 可用的相似度模型49
3.1.2 為每字段配置相似度模型49
3.2 相似度模型配置50
3.2.1 選擇默認的相似度模型51
3.2.2 配置被選用的相似度模型52
3.3 使用編解碼器53
3.3.1 簡單使用範例53
3.3.2 工作原理解釋54
3.3.3 可用的倒排錶格式55
3.3.4 配置編解碼器56
3.4 準實時、提交、更新及事務日誌58
3.4.1 索引更新及更新提交59
3.4.2 事務日誌60
3.4.3 準實時讀取62
3.5 深入理解數據處理62
3.5.1 輸入並不總是進行文本分析62
3.5.2 範例的使用65
3.5.3 索引期更換分詞器67
3.5.4 搜索時更換分析器68
3.5.5 陷阱與默認分析68
3.6 控製索引閤並68
3.6.1 選擇正確的閤並策略69
3.6.2 閤並策略配置70
3.6.3 調度72
3.7 小結73
第4章 分布式索引架構74
4.1 選擇閤適的分片和副本數74
4.1.1 分片和過度分配75
4.1.2 一個過度分配的正麵例子75
4.1.3 多分片與多索引76
4.1.4 副本76
4.2 路由76
4.2.1 分片和數據77
4.2.2 測試路由功能77
4.2.3 索引時使用路由80
4.2.4 彆名83
4.2.5 多個路由值83
4.3 調整默認的分片分配行為84
4.3.1 分片分配器簡介84
4.3.2 even_shard 分片分配器84
4.3.3 balanced分片分配器85
4.3.4 自定義分片分配器85
4.3.5 裁決者86
4.4 調整分片分配88
4.4.1 部署意識89
4.4.2 過濾91
4.4.3 運行時更新分配策略92
4.4.4 確定每個節點允許的總分片數93
4.4.5 更多的分片分配屬性96
4.5 查詢執行偏好97
4.6 應用我們的知識99
4.6.1 基本假定99
4.6.2 配置100
4.6.3 變化來瞭104
4.7 小結105
第5章 管理ElasticSearch106
5.1 選擇正確的目錄實現-存儲模塊106
5.2 發現模塊的配置109
5.2.1 Zen發現109
5.2.2 亞馬遜EC2發現111
5.2.3 本地網關114
5.2.4 恢復配置115
5.3 索引段統計116
5.3.1 segments API簡介116
5.3.2 索引段信息的可視化118
5.4 理解ElasticSearch緩存119
5.4.1 過濾器緩存119
5.4.2 字段數據緩存121
5.4.3 清除緩存126
5.5 小結127
第6章 故障處理129
6.1 瞭解垃圾迴收器129
6.1.1 Java內存130
6.1.2 處理垃圾迴收問題131
6.1.3 在類UNIX係統中避免內存交換135
6.2 關於I/O調節136
6.2.1 控製IO節流136
6.2.2 配置136
6.3 用預熱器提升查詢速度138
6.3.1 為什麼使用預熱器138
6.3.2 操作預熱器138
6.3.3 測試預熱器141
6.4 熱點綫程144
6.4.1 澄清熱點綫程API的用法誤區145
6.4.2 熱點綫程API的響應信息145
6.5 現實場景146
6.5.1 越來越差的性能146
6.5.2 混雜的環境和負載不平衡148
6.5.3 我的服務器齣故障瞭149
6.6 小結150
第7章 改善用戶搜索體驗151
7.1 改正用戶拼寫錯誤151
7.1.1 測試數據152
7.1.2 深入技術細節152
7.1.3 completion suggester168
7.2 改善查詢相關性172
7.2.1 數據172
7.2.2 改善相關性的探索之旅174
7.3 小結188
第8章 ElasticSearch Java API189
8.1 ElasticSearch Java API簡介189
8.2 代碼190
8.3 連接到集群191
8.3.1 成為ElasticSearch節點191
8.3.2 使用傳輸機連接方式192
8.3.3 選擇閤適的連接方式193
8.4 API剖析194
8.5 CRUD操作195
8.5.1 讀取文檔195
8.5.2 索引文檔197
8.5.3 更新文檔199
8.5.4 刪除文檔201
8.6 ElasticSearch查詢203
8.6.1 準備查詢請求203
8.6.2 構造查詢203
8.6.3 分頁206
8.6.4 排序207
8.6.5 過濾207
8.6.6 切麵計算208
8.6.7 高亮209
8.6.8 查詢建議209
8.6.9 計數210
8.6.10 滾動211
8.7 批量執行多個操作211
8.7.1 批量操作211
8.7.2 根據查詢刪除文檔212
8.7.3 Multi GET212
8.7.4 Multi Search212
8.8 Percolator213
8.9 explain API214
8.10 構造JSON格式的查詢和文檔214
8.11 管理API216
8.11.1 集群管理API216
8.11.2 索引管理API219
8.12 小結226
第9章 開發ElasticSearch插件227
9.1 建立Apache Maven項目結構227
9.1.1 瞭解基本知識228
9.1.2 Maven Java項目的結構228
9.1.3 POM的理念228
9.1.4 運行構建過程229
9.1.5 引入Maven裝配插件230
9.2 創建一個自定義river插件232
9.2.1 實現細節232
9.2.2 測試river238
9.3 創建自定義分析插件240
9.3.1 實現細節240
9.3.2 測試自定義分析插件247
9.4 小結249
· · · · · · (收起)

讀後感

評分

现在的ES版本是6.5,这本书里面提到的ES版本是1.4。另外这本书叫 深入理解……,其实有点不太符合深入二字。书中很多内容其实都是官方文档中提到的东西,只是官方文档是英文,如果英文不太好,理解起来不到位,结合一下中文书看看,理解起来效率会高一点。比如说:书中第二章对L...  

評分

内容是基于ElasticSearch 0.9版本的 19页的例子好像是没有和前面完全对应上 (抱歉,你的评论太短了抱歉,你的评论太短了抱歉,你的评论太短了抱歉,你的评论太短了抱歉,你的评论太短了抱歉,你的评论太短了抱歉,你的评论太短了抱歉,你的评论太短了抱歉,你的评论太短了抱...

評分

感觉大部分内容是直接用百度翻译而来,很多地方的语言比较晦涩难懂。。。比如:上面提到的过滤器中,最后三个本身并不使用字段缓存,但由于它们操作其他过滤器,因而它们不缓存。翻译地太生硬。。。还有一些地方,说明数据明显与案例对应的数据不符。。。希望作者下次翻译书籍...  

評分

内容是基于ElasticSearch 0.9版本的 19页的例子好像是没有和前面完全对应上 (抱歉,你的评论太短了抱歉,你的评论太短了抱歉,你的评论太短了抱歉,你的评论太短了抱歉,你的评论太短了抱歉,你的评论太短了抱歉,你的评论太短了抱歉,你的评论太短了抱歉,你的评论太短了抱...

評分

1. 这本书应该是比较早的中文Elasticsearch书籍,现在的ES已经到了5.1版本,而书中讲解的版本则是0.9,所以阅读时经常会检查下这个特性是否废弃过改进过。 2. 除此之外,本书应该来说是一本比较优秀的书籍,书中介绍的内容适合我这种对ES有一定了解又想深入理解其中机制的读者...  

用戶評價

评分

這本書應該是比較早的中文Elasticsearch書籍,現在的ES已經到瞭5.1版本,而書中講解的版本則是0.9,所以閱讀時經常會檢查下這個特性是否廢棄過改進過。除此之外,本書應該來說是一本比較優秀的書籍,書中介紹的內容適閤我這種對ES有一定瞭解又想深入理解其中機製的讀者。

评分

個人覺得比 In Action 好,讀罷對 ES 整體架構有瞭個大體的瞭解 ... 右麵關於性能(高並發場景下)的架構,可以抽時間再翻一番 ... 留一個問題, ES 這種基於對等模式的架構,沒有獨立的路由、聚閤層,可能不適閤大規模索引係統(百度就有 BC + BS) 還有一個 TODO:lucene 的 doc value

评分

略微淺顯,對原理講的不多

评分

講得比較淺,宏觀介紹瞭設計和架構,比較多篇幅在介紹ES的API怎麼用,各節點分工之類,適閤入門瞭解。翻譯實在是太挫瞭,錯誤很多,建議對照著elastic官網手冊看。kindle版真貴……

评分

這本書應該是比較早的中文Elasticsearch書籍,現在的ES已經到瞭5.1版本,而書中講解的版本則是0.9,所以閱讀時經常會檢查下這個特性是否廢棄過改進過。除此之外,本書應該來說是一本比較優秀的書籍,書中介紹的內容適閤我這種對ES有一定瞭解又想深入理解其中機製的讀者。

本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

© 2025 book.quotespace.org All Rights Reserved. 小美書屋 版权所有