同义词支持

Redis 开源版同义词支持详情

Redis 开源版支持同义词。也就是说，可以搜索由同义词数据结构定义的同义词。

同义词数据结构是一组组，每组包含同义词条。例如，以下同义词数据结构包含三组，每组包含三个同义词条

{boy, child, baby}
{girl, child, baby}
{man, person, adult}

当这三组位于同义词数据结构内部时，搜索“child”即可获得包含“boy”、“girl”、“child”和“baby”的文档。

同义词搜索技术

使用简单的 HashMap 将词条和组 ID 映射起来。在创建索引期间，会检查当前词条是否出现在同义词映射中，如果出现，则获取该词条所属的所有组 ID。

对于每个组 ID，会在倒排索引中添加一个名为“~<id>”的记录，该记录包含与词条本身相同的信息。执行搜索时，会检查搜索的词条是否出现在同义词映射中，如果出现，则获取该词条所属的所有组 ID。对于每个组 ID，搜索“~<id>”并返回合并结果。此技术确保将返回给定词条的所有同义词。

处理并发

由于索引是在单独的线程中执行的，因此同义词映射在索引过程中可能会发生变化，这反过来可能会导致索引或搜索期间的数据损坏或崩溃。为了解决这个问题，会创建一个只读副本用于索引。只读副本使用引用计数进行维护。

只要同义词映射没有改变，原始同义词映射就会保留对其只读副本的引用，因此它不会被释放。同义词映射中的数据发生变化后，同义词映射会减少其只读副本的引用计数。这确保了所有索引器使用完只读副本后，该副本将自动释放。这确保了下次索引器请求只读副本时，同义词映射将创建一个新副本（包含新数据）并返回。

示例

# Create an index
> FT.CREATE idx schema t text

# Create a synonym group 
> FT.SYNUPDATE idx group1 hello world

# Insert documents
> HSET foo t hello
(integer) 1
> HSET bar t world
(integer) 1

# Search
> FT.SEARCH idx hello
1) (integer) 2
2) "foo"
3) 1) "t"
   2) "hello"
4) "bar"
5) 1) "t"
   2) "world"

产品

工具

获取 Redis

连接

学习

最新

了解工作原理

同义词支持

同义词搜索技术

处理并发

示例

在本页