天天看點

ES入門系列 — 2 Elasticsearch介紹

簡單寫一個ES系列,希望對NewSql、檢索有興趣的同學可以快速入手,争取在7月份完成該系列文章

ES入門系列

  • ES入門系列 — 1 windows系統安裝Elasticsearch
  • ES入門系列 — 2 Elasticsearch介紹
  • ES入門系列 — 3 走進elasticsearch
  • ES入門系列 — 4 索引
ES入門系列 — 2 Elasticsearch介紹

搜尋已經無時無刻在網際網路存在,很典型的就是Google、百度之類的綜合搜尋,幾乎作為每個普通網民還是IT從事人員,幾乎每天都在和綜合搜尋打交道,通過搜尋你可以觸及你想要的資訊,這是一種可以是業内最普遍的資訊主動連結的方式。相比于複雜的綜合搜尋,還有一類就是垂直搜尋(目前垂直搜尋也是很複雜的)

ES入門系列 — 2 Elasticsearch介紹

相比綜合搜尋,垂直搜尋從資訊内容上更加專一,比如上圖淘寶網的搜尋,那麼搜尋的就是商品資訊。很明顯,你在上面肯定搜不到樓主的這篇部落格的(或許有一天淘寶有這樣訴求呢。。。目前不可能的),那麼很多中小公司的垂直搜尋用的就是Elasticseach實作的了(當然淘寶這樣的公司在搜尋引擎上是會有自己的産品支援),比如很多部落格系統,你搜尋時候輸入文章裡面的一個特定短語,可以搜到包含這個短語或近似的相關部落格,之類還有UGC、PGC、電商、門戶、物流、内容分發類等等系統

Elasticsearch 的用途是什麼?

Elasticsearch 在速度和可擴充性方面都表現出色,而且還能夠索引多種類型的内容,這意味着其可用于多種用例:

  • 應用程式搜尋
  • 網站搜尋
  • 企業搜尋
  • 日志處理和分析
  • 基礎設施名額和容器監測
  • 應用程式性能監測
  • 地理空間資料分析和可視化
  • 安全分析
  • 業務分析

Elasticsearch 的工作原理是什麼?

原始資料會從多個來源(包括日志、系統名額和網絡應用程式)輸入到 Elasticsearch 中。資料采集指在 Elasticsearch 中進行索引之前解析、标準化并充實這些原始資料的過程。這些資料在 Elasticsearch 中索引完成之後,使用者便可針對他們的資料運作複雜的查詢,并使用聚合來檢索自身資料的複雜彙總。在 Kibana 中,使用者可以基于自己的資料建立強大的可視化,分享儀表闆,并對 Elastic Stack 進行管理。

Elasticsearch 索引是什麼?

Elasticsearch 索引指互相關聯的文檔集合。Elasticsearch 會以 JSON 文檔的形式存儲資料。每個文檔都會在一組鍵(字段或屬性的名稱)和它們對應的值(字元串、數字、布爾值、日期、數值組、地理位置或其他類型的資料)之間建立聯系。

Elasticsearch 使用的是一種名為反向索引的資料結構,這一結構的設計可以允許十分快速地進行全文本搜尋。反向索引會列出在所有文檔中出現的每個特有詞彙,并且可以找到包含每個詞彙的全部文檔。

在索引過程中,Elasticsearch 會存儲文檔并建構反向索引,這樣使用者便可以近實時地對文檔資料進行搜尋。索引過程是在索引 API 中啟動的,通過此 API 您既可向特定索引中添加 JSON 文檔,也可更改特定索引中的 JSON 文檔。

為何使用 Elasticsearch?

Elasticsearch 很快。 由于 Elasticsearch 是在 Lucene 基礎上建構而成的,是以在全文本搜尋方面表現十分出色。Elasticsearch 同時還是一個近實時的搜尋平台,這意味着從文檔索引操作到文檔變為可搜尋狀态之間的延時很短,一般隻有一秒。是以,Elasticsearch 非常适用于對時間有嚴苛要求的用例,例如安全分析和基礎設施監測。

Elasticsearch 具有分布式的本質特征。 Elasticsearch 中存儲的文檔分布在不同的容器中,這些容器稱為分片,可以進行複制以提供資料備援副本,以防發生硬體故障。Elasticsearch 的分布式特性使得它可以擴充至數百台(甚至數千台)伺服器,并處理 PB 量級的資料。

Elasticsearch 包含一系列廣泛的功能。 除了速度、可擴充性和彈性等優勢以外,Elasticsearch 還有大量強大的内置功能(例如資料彙總和索引生命周期管理),可以友善使用者更加高效地存儲和搜尋資料。

Elastic Stack 簡化了資料采集、可視化和報告過程。 通過與 Beats 和 Logstash 進行內建,使用者能夠在向 Elasticsearch 中索引資料之前輕松地處理資料。同時,Kibana 不僅可針對 Elasticsearch 資料提供實時可視化,同時還提供 UI 以便使用者快速通路應用程式性能監測 (APM)、日志和基礎設施名額等資料。

OK,對Elasticsearch的介紹就到這裡,對elasticsearch有個簡單的認識就可以了,這東西是做搜尋用的,分布式(可擴充),很快(不到1秒)、資料采集等等

歡迎關注,歡迎訂閱,樓主努力更新中

繼續閱讀