Elasticsearch實戰

Elasticsearch實戰 pdf epub mobi txt 電子書 下載2025

出版者:人民郵電齣版社
作者:Radu Gheorghe
出品人:異步圖書
頁數:337
译者:黃申
出版時間:2018-10
價格:79.00
裝幀:平裝
isbn號碼:9787115449153
叢書系列:
圖書標籤:
  • elastcsearch
  • 搜索
  • 計算機
  • 軟件開發
  • 計算機科學
  • 編程
  • 技術
  • es
  • Elasticsearch
  • 實戰
  • 數據庫
  • 搜索引擎
  • 分布式
  • 高性能
  • 索引
  • 查詢
  • 運維
  • 實戰
想要找書就要到 小美書屋
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

具體描述

本書主要展示如何使用Elasticsearch構建可擴展的搜索應用程序。書中覆蓋瞭Elasticsearch的主要特性,從使用不同的分析器和查詢類型進行相關性調優,到使用聚集功能進行實時性分析,還有地理空間搜索和文檔過濾等更多吸引人的特性。

全書共分兩個部分,第一部分解釋瞭核心特性,內容主要涉及Elasticsearch的介紹,數據的索引、更新和刪除,數據的搜索,數據的分析,使用相關性進行搜索,使用聚集來探索數據,文檔間的關係等;第二部分介紹每個特性工作的更多細節及其對性能和可擴展性的影響,以便對核心功能進行産品化,內容主要涉及水平擴展和性能提升等。

此外,本書還有6個附錄(網上下載),提供瞭讀者應該知道的特性,展示瞭關於地理空間搜索和聚集,如何管理Elasticsearch插件,學習在搜索結果中如何高亮查詢單詞,在生産環境中用來協助管理Elasticsearch的第三方的監控工具有哪些,如何使用Percolator過濾為多個查詢匹配少量文檔,如何使用不同的建議器來實現自動完成的功能。

著者簡介

作者簡介

拉杜·喬戈(Radu Gheorghe)是搜索技術顧問和軟件工程師。

馬修·李·欣曼(Matthew Lee Hinman)開發過基於雲的高可用係統。

羅伊·羅素(Roy Russo)是預測分析方麵的專傢。

譯者簡介

黃申博士,現任LinkedIn(領英)資深數據科學傢,畢業於上海交通大學計算機科學與工程專業,師從俞勇教授。微軟學者、IBM ExtremeBlue天纔計劃成員。長期專注於大數據相關的搜索、推薦、廣告以及用戶精準化領域。曾在微軟亞洲研究院、eBay中國、沃爾瑪1號店(現京東1號店)和大潤發飛牛網擔任要職,帶團隊完成瞭若乾公司級的戰略項目。同時在國際上發錶20多篇論文,並擁有10多項國際專利。《計算機工程》特邀審稿專傢,2016年齣版瞭《大數據架構商業之路》一書,廣受好評。因對業界做齣卓越貢獻,獲得美國政府頒發的“美國傑齣人纔”稱號。

圖書目錄

第一部分
第1章 Elasticsearch介紹 2
1.1 用Elasticsearch解決搜索問題 3
1.1.1 提供快速查詢 3
1.1.2 確保結果的相關性 4
1.1.3 超越精確匹配 5
1.2 探索典型的Elasticsearch使用案例 6
1.2.1 將Elasticsearch作為主要的後端係統 7
1.2.2 將Elasticsearch添加到現有的係統 7
1.2.3 將Elasticsearch和現有工具一同使用 8
1.2.4 Elasticsearch的主要特性 10
1.2.5 擴展Lucene的功能 10
1.2.6 在Elasticsearch中組織數據 12
1.2.7 安裝Java語言 12
1.2.8 下載並啓動Elasticsearch 13
1.2.9 驗證是否工作 14
1.3 小結 16
第2章 深入功能 17
2.1 理解邏輯設計:文檔、類型和索引 18
2.1.1 文檔 19
2.1.2 類型 20
2.1.3 索引 21
2.2 理解物理設計:節點和分片 21
2.2.1 創建擁有一個或多個節點的集群 22
2.2.2 理解主分片和副本分片 23
2.2.3 在集群中分發分片 25
2.2.4 分布式索引和搜索 26
2.3 索引新數據 27
2.3.1 通過cURL索引一篇文檔 28
2.3.2 創建索引和映射類型 30
2.3.3 通過代碼樣例索引文檔 31
2.4 搜索並獲取數據 32
2.4.1 在哪裏搜索 33
2.4.2 迴復的內容 33
2.4.3 如何搜索 36
2.4.4 通過ID獲取文檔 39
2.5 配置Elasticsearch 40
2.5.1 在elasticsearch.yml中指定集群的名稱 40
2.5.2 通過logging.yml指定詳細日誌記錄 41
2.5.3 調整JVM設置 41
2.6 在集群中加入節點 42
2.6.1 啓動第二個節點 43
2.6.2 增加額外的節點 44
2.7 小結 45
第3章 索引、更新和刪除數據 47
3.1 使用映射來定義各種文檔 48
3.1.1 檢索和定義映射 49
3.1.2 擴展現有的映射 50
3.2 用於定義文檔字段的核心類型 51
3.2.1 字符串類型 52
3.2.2 數值類型 54
3.2.3 日期類型 55
3.2.4 布爾類型 56
3.3 數組和多字段 56
3.3.1 數組 56
3.3.2 多字段 57
3.4 使用預定義字段 58
3.4.1 控製如何存儲和搜索文檔 59
3.4.2 識彆文檔 61
3.5 更新現有文檔 63
3.5.1 使用更新API 64
3.5.2 通過版本來實現並發控製 66
3.6 刪除數據 69
3.6.1 刪除文檔 70
3.6.2 刪除索引 71
3.6.3 關閉索引 72
3.6.4 重新索引樣本文檔 73
3.7 小結 73
第4章 搜索數據 74
4.1 搜索請求的結構 75
4.1.1 確定搜索範圍 75
4.1.2 搜索請求的基本模塊 76
4.1.3 基於請求主體的搜索請求 78
4.1.4 理解迴復的結構 81
4.2 介紹查詢和過濾器DSL 82
4.2.1 match查詢和term過濾器 82
4.2.2 常用的基礎查詢和過濾器 85
4.2.3 match查詢和term過濾器 91
4.2.4 phrase_prefix查詢 92
4.3 組閤查詢或復閤查詢 93
4.3.1 bool查詢 93
4.3.2 bool過濾器 96
4.4 超越match和過濾器查詢 98
4.4.1 range查詢和過濾器 98
4.4.2 prefix查詢和過濾器 99
4.4.3 wildcard查詢 100
4.5 使用過濾器查詢字段的存在性 102
4.5.1 exists過濾器 102
4.5.2 missing過濾器 102
4.5.3 將任何查詢轉變為過濾器 103
4.6 為任務選擇最好的查詢 104
4.7 小結 105
第5章 分析數據 106
5.1 什麼是分析 106
5.1.1 字符過濾 107
5.1.2 切分為分詞 108
5.1.3 分詞過濾器 108
5.1.4 分詞索引 108
5.2 為文檔使用分析器 109
5.2.1 在索引創建時增加分析器 109
5.2.2 在Elasticsearch的配置中添加分析器 111
5.2.3 在映射中指定某個字段的分析器 112
5.3 使用分析API來分析文本 113
5.3.1 選擇一個分析器 114
5.3.2 通過組閤即興地創建分析器 115
5.3.3 基於某個字段映射的分析 115
5.3.4 使用詞條嚮量API來學習索引詞條 116
5.4 分析器、分詞器和分詞過濾器 117
5.4.1 內置的分析器 117
5.4.2 分詞器 119
5.4.3 分詞過濾器 122
5.5 N元語法、側邊N元語法和滑動窗口 128
5.5.1 一元語法過濾器 128
5.5.2 二元語法過濾器 129
5.5.3 三元語法過濾器 129
5.5.4 設置min_gram和max_gram 129
5.5.5 側邊N元語法過濾器 129
5.5.6 N元語法的設置 130
5.5.7 滑動窗口分詞過濾器 131
5.6 提取詞乾 132
5.6.1 算法提取詞乾 133
5.6.2 使用字典提取詞乾 133
5.6.3 重寫分詞過濾器的詞乾提取 134
5.7 小結 134
第6章 使用相關性進行搜索 136
6.1 Elasticsearch的打分機製 137
6.1.1 文檔打分是如何運作的 137
6.1.2 詞頻 137
6.1.3 逆文檔頻率 138
6.1.4 Lucene評分公式 138
6.2 其他打分方法 139
6.3 boosting 141
6.3.1 索引期間的boosting 142
6.3.2 查詢期間的boosting 142
6.3.3 跨越多個字段的查詢 143
6.4 使用“解釋”來理解文檔是如何被評分的 144
6.5 使用查詢再打分來減小評分操作的性能影響 147
6.6 使用function_score來定製得分 148
6.6.1 weight函數 149
6.6.2 閤並得分 150
6.6.3 field_value_factor函數 151
6.6.4 腳本 152
6.6.5 隨機 152
6.6.6 衰減函數 153
6.6.7 配置選項 155
6.7 嘗試一起使用它們吧 156
6.8 使用腳本來排序 157
6.9 字段數據 158
6.9.1 字段數據緩存 158
6.9.2 字段數據用在哪裏 159
6.9.3 管理字段數據 160
6.10 小結 163
第7章 使用聚集來探索數據 164
7.1 理解聚集的具體結構 166
7.1.1 理解聚集請求的結構 166
7.1.2 運行在查詢結果上的聚集 168
7.1.3 過濾器和聚集 169
7.2 度量聚集 170
7.2.1 統計數據 171
7.2.2 高級統計 172
7.2.3 近似統計 173
7.3 多桶型聚集 176
7.3.1 terms聚集 177
7.3.2 range聚集 183
7.3.3 histogram聚集 185
7.4 嵌套聚集 187
7.4.1 嵌套多桶聚集 189
7.4.2 通過嵌套聚集獲得結果分組 190
7.4.3 使用單桶聚集 192
7.5 小結 196
第8章 文檔間的關係 197
8.1 定義文檔間關係的選項概覽 197
8.1.1 對象類型 198
8.1.2 嵌套類型 200
8.1.3 父子關係 200
8.1.4 反規範化 200
8.2 將對象作為字段值 202
8.2.1 映射和索引對象 203
8.2.2 在對象中搜索 204
8.3 嵌套類型:聯結嵌套的文檔 206
8.3.1 映射並索引嵌套文檔 207
8.3.2 搜索和聚集嵌套文檔 210
8.4 父子關係:關聯分隔的文檔 216
8.4.1 子文檔的索引、更新和刪除 218
8.4.2 在父文檔和子文檔中搜索 220
8.5 反規範化:使用冗餘的數據管理 227
8.5.1 反規範化的使用案例 228
8.5.2 索引、更新和刪除反規範化的數據 230
8.5.3 查詢反規範化的數據 233
8.6 應用端的連接 234
8.7 小結 235
第二部分
第9章 嚮外擴展 238
9.1 嚮Elasticsearch集群加入節點 238
9.2 發現其他Elasticsearch節點 241
9.2.1 通過廣播來發現 241
9.2.2 通過單播來發現 242
9.2.3 選舉主節點和識彆錯誤 243
9.2.4 錯誤的識彆 244
9.3 刪除集群中的節點 245
9.4 升級Elasticsearch的節點 250
9.4.1 進行輪流重啓 250
9.4.2 最小化重啓後的恢復時間 251
9.5 使用_cat API 252
9.6 擴展策略 254
9.6.1 過度分片 254
9.6.2 將數據切分為索引和分片 255
9.6.3 最大化吞吐量 256
9.7 彆名 257
9.7.1 什麼是彆名 258
9.7.2 彆名的創建 259
9.8 路由 261
9.8.1 為什麼使用路由 261
9.8.2 路由策略 262
9.8.3 使用_search_shards API來決定搜索在哪裏執行 263
9.8.4 配置路由 265
9.8.5 結閤路由和彆名 265
9.9 小結 267
第10章 提升性能 268
10.1 閤並請求 269
10.1.1 批量索引、更新和 刪除 269
10.1.2 多條搜索和多條獲取 API接口 273
10.2 優化Lucene分段的 處理 276
10.2.1 刷新和衝刷的閾值 276
10.2.2 閤並以及閤並策略 279
10.2.3 存儲和存儲限流 282
10.3 充分利用緩存 285
10.3.1 過濾器和過濾器 緩存 285
10.3.2 分片查詢緩存 291
10.3.3 JVM堆和操作係統 緩存 293
10.3.4 使用預熱器讓緩存 熱身 296
10.4 其他的性能權衡 297
10.4.1 大規模的索引還是 昂貴的搜索 298
10.4.2 調優腳本,要麼 彆用它 301
10.4.3 權衡網絡開銷,更少的 數據和更好的分布式 得分 305
10.4.4 權衡內存,進行深度 分頁 308
10.5 小結 310
第11章 管理集群 311
11.1 改善默認的配置 311
11.1.1 索引模闆 312
11.1.2 默認的映射 315
11.2 分配的感知 318
11.2.1 基於分片的分配 318
11.2.2 強製性的分配感知 319
11.3 監控瓶頸 320
11.3.1 檢查集群的健康 狀態 320
11.3.2 CPU:慢日誌、熱綫程和 綫程池 322
11.3.3 內存:堆的大小、字段和 過濾器緩存 326
11.3.4 操作係統緩存 330
11.3.5 存儲限流 330
11.4 備份你的數據 331
11.4.1 快照API 331
11.4.2 將數據備份到共享的文件係統 332
11.4.3 從備份中恢復 335
11.4.4 使用資料庫插件 336
11.5 小結 337
附錄A 處理地理空間的數據(網上下載)
附錄B 插件(網上下載)
附錄C 高亮(網上下載)
附錄D Elasticsearch的監控插件(網上下載)
附錄E 使用滲濾器將搜索顛倒過來(網上下載)
附錄F 為自動完成和“您是指”功能使用建議器(網上下載)
· · · · · · (收起)

讀後感

評分

Elasticsearch makes it easy to add efficient and scalable searches to enterprise applications. Busy administrators and developers love this open source real-time search and analytics engine because they can simply install it, make a few tweaks, and go on wi...

評分

Elasticsearch makes it easy to add efficient and scalable searches to enterprise applications. Busy administrators and developers love this open source real-time search and analytics engine because they can simply install it, make a few tweaks, and go on wi...

評分

Elasticsearch makes it easy to add efficient and scalable searches to enterprise applications. Busy administrators and developers love this open source real-time search and analytics engine because they can simply install it, make a few tweaks, and go on wi...

評分

Elasticsearch makes it easy to add efficient and scalable searches to enterprise applications. Busy administrators and developers love this open source real-time search and analytics engine because they can simply install it, make a few tweaks, and go on wi...

評分

Elasticsearch makes it easy to add efficient and scalable searches to enterprise applications. Busy administrators and developers love this open source real-time search and analytics engine because they can simply install it, make a few tweaks, and go on wi...

用戶評價

评分

看起來就是比較係統一些,如果沒有收藏技術書的癖好,可以直接看官網資料。

评分

入門推薦

评分

看起來就是比較係統一些,如果沒有收藏技術書的癖好,可以直接看官網資料。

评分

好久沒看技術書瞭。雖然其中不少內容都已經過時瞭,但是對於理解ES的設計來說,確是一本好書

评分

看起來就是比較係統一些,如果沒有收藏技術書的癖好,可以直接看官網資料。

本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

© 2025 book.quotespace.org All Rights Reserved. 小美書屋 版权所有