搜索 – 像关系数据库一样使用Lucene

我只是想知道我们是否可以在lucene中实现一些RDBMS功能.

例:
1)我有10,000个项目文档(pdf文件),必须将其内容编入索引以使其可供搜索.
2)每份文件都与单一项目有关.项目可以包含项目名称,编号,开始日期,结束日期,位置,类型等详细信息.

我必须在pdf文件的内容中搜索给定的关键字,但在显示结果时,我想显示项目元数据,如第(2)点所述.

我的想法是在索引时将名为projectId的字段与每个pdf文件相关联.一旦我们得到了,我们将再次触发搜索以获取项目元数据.

这样我们就可以避免重复数据.此外,如果我们想要更新项目元数据,我们最终只能在SINGLE PLACE更新.否则,如果我们使用所有pdf doument索引存储这个元数据,我们将最终更新所有文档,这不是我想要的方式.

请指教.

解决方法

如果我理解正确,你有两个问题:

>我可以在Lucene中存储项目ID并将其用于进一步搜索吗?是的你可以.这是一种常见的做法.>我可以使用此项目ID来搜索Lucene的项目元数据吗?是的你可以.我不知道这是不是一个好主意.这取决于元数据更新的频率和访问模式.如果元数据是相对静态的,并且您只能通过id访问它,Lucene可能是存储它的好地方.否则,您可以将项目ID用作数据库表的主键,这可能更适合.

相关文章

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注