天天看點

使用 RediSearch 在 Redis 中進行全文檢索

原文連結: 使用 RediSearch 在 Redis 中進行全文檢索

Redis 大家肯定都不陌生了,作為一種快速、高性能的鍵值存儲資料庫,廣泛應用于緩存、隊列、會話存儲等方面。

然而,Redis 在原生狀态下并不支援全文檢索功能,這使得處理文本資料變得相對困難。但是在有一些場景下還需要這樣的功能,有什麼好辦法呢?答案就是 RediSearch。

RediSearch 是 Redis 的一個插件,它為 Redis 資料庫添加了全文搜尋和查詢功能,使開發人員能夠在 Redis 中高效地執行全文檢索操作。

它基于 Redis Module API 建構,通過使用自定義的資料結構和索引算法,實作了高效的全文搜尋功能。

安裝

如果單純用來測試的話,可以直接通過 docker 來啟動;如果是生産環境,就需要根據公司的實際情況來支援了。

$ docker run -p 6379:6379 redis/redis-stack-server:latest
           

啟動服務之後,可以使用 FT.* 指令集來體驗搜尋功能。

概覽

為了使用全文搜尋功能,我們必須将文檔存儲在哈希中,使用指令 FT.CREATE 建立索引并使用 FT.SEARCH 做文本搜尋。

這樣說可能會比較懵,看下面的示意圖就明白了:

使用 RediSearch 在 Redis 中進行全文檢索

現在,讓我們插入兩條文檔:

redis-cli 'hset post:1 title "hello world" body "this is a cool document"'
redis-cli 'hset post:2 title "goodbye everybody" body "this is the best document"'
           

上面指令建立兩個哈希值,分别是 post:1 和 post:2,其中包含的字段是 title 和 body。

建立索引

接下來建立索引:

FT.CREATE post_index prefix 1 post: SCHEMA title TEXT body text
           
使用 RediSearch 在 Redis 中進行全文檢索

在這裡,我們建立了 post_index 索引,它将索引以 post: 字首開頭的所有 Redis 哈希鍵。隻有 title 和 body 字段才會被索引,并且索引立即生效。

搜尋索引

使用 FT.SEARCH 指令,參數是索引名稱和需要搜尋的關鍵詞:

FT.SEARCH post_index "world"
           
使用 RediSearch 在 Redis 中進行全文檢索

實時索引

當新增一個文檔時,它會被自動添加到索引:

redis-cli 'hset post:3 title "really?" body "yeah"'
           

立即可以被搜尋到:

> ft.search post_index "really"
1) (integer) 1
2) "post:3"
3) 1) "title"
   2) "really?"
   3) "body"
   4) "yeah"
           

搜尋特定字段

可以選擇要搜尋的字段,比如 title:

ft.search post_index "@title:world"
           

按清單中的任何單詞搜尋

類似于邏輯 OR 操作,比如要查找與 hello 或 goodbye 比對的所有文檔:

ft.search post_index "hello|goodbye"
           

搜尋結果分頁

和 SQL 是一樣的,使用 LIMIT 關鍵詞,比如:

ft.search post_index "world" LIMIT 10, 5
           

反向搜尋

在搜尋關鍵詞前使用 - 來排除結果中包含該字段的資訊:

ft.search post_index "-foo"
           

部分搜尋

還可以使用 * 隻搜尋單詞的一部分,比如要查找以 good 開頭的單詞的所有文檔:

ft.search post_index "good*"
           

需要注意的是,這樣做僅限于字首,比如關鍵詞是這樣的話 *good,是不支援的。

模糊比對

這個功能很強大,它是一種近似的搜尋手段,使用 %。

假設你把想要查找的單詞寫錯了,把 world 寫成了 wold,它依然能查出來,比如:

ft.search post_index "%wold%"
           

總結

最近在工作中遇到了一個問題,因為資料都存儲在了 Redis 中,而且大部分功能都可以滿足。但其中有一個接口需要模糊查詢,這在 Redis 原生方法中是不容易的。

是以查找了一些資料,了解到 RediSearch,使用一下還是挺友善的,并且完美地解決了我的問題。也把這篇文章分享給大家,希望對大家有幫助。

以上就是本文的全部内容,如果覺得還不錯的話歡迎點贊,轉發和關注,感謝支援。

參考文章:

  • https://github.com/RediSearch
  • https://medium.com/datadenys/full-text-search-in-redis-using-redisearch-31df0deb4f3e

推薦閱讀:

  • Go 語言切片是如何擴容的?

繼續閱讀