建模数据以支持关键字搜索

在本页面

Note

关键字搜索与文本搜索或全文搜索不同,并且不提供词干或其他文本处理功能。有关更多信息,请参见关键字索引的局限性部分。

在 2.4 中,MongoDB 提供了文本搜索功能。有关更多信息,请参见Text Indexes

如果您的应用程序需要查询包含文本的字段的内容,则可以对文本进行完全匹配,也可以使用$regex使用正则表达式模式匹配。但是,对于许多文本操作,这些方法不能满足应用程序要求。

此模式描述了一种使用 MongoDB 支持关键字搜索以支持应用程序搜索功能的方法,该方法使用存储在与文本字段相同的文档中的数组中的关键字。与multi-key index结合使用,该模式可以支持应用程序的关键字搜索操作。

Pattern

要将结构添加到文档中以支持基于关键字的查询,请在文档中创建一个数组字段,然后将关键字作为字符串添加到数组中。然后,您可以在数组上创建multi-key index并创建从数组中选择值的查询。

Example

给定要提供基于主题的搜索的库卷的集合。对于每个卷,您添加数组topics,并添加给定卷所需的任意多个关键字。

对于Moby-Dick卷,您可能具有以下文档:

{ title : "Moby-Dick" ,
author : "Herman Melville" ,
published : 1851 ,
ISBN : 0451526996 ,
topics : [ "whaling" , "allegory" , "revenge" , "American" ,
"novel" , "nautical" , "voyage" , "Cape Cod" ]
}

然后,您在topics数组上创建一个多键索引:

db.volumes.createIndex( { topics: 1 } )

多键索引为topics数组中的每个关键字创建单独的索引条目。例如,索引包含一个用于whaling的条目,另一个包含allegory的条目。

然后,您将根据关键字进行查询。例如:

db.volumes.findOne( { topics : "voyage" }, { title: 1 } )

Note

具有大量元素的数组,例如具有数百或数千个关键字的元素,将在插入时产生更高的索引成本。

关键字索引的局限性

MongoDB 可以使用特定的数据模型和multi-key indexes支持关键字搜索;但是,这些关键字索引在以下方面不足以与全文产品相提并论:

  • 加注。 MongoDB 中的关键字查询无法解析词根或相关词的关键字。

  • 同义词。基于关键字的搜索功能必须在应用程序层中提供对同义词或相关查询的支持。

  • 排行 。本文档中描述的关键字查找没有提供加权结果的方法。

  • 异步索引。 MongoDB 同步构建索引,这意味着用于关键字索引的索引始终是最新的并且可以实时运行。但是,异步批量索引对于某些类型的内容和工作负载可能更有效。