倒排索引和正排索引的区别
倒排索引和正排索引是用于搜索文档或文档集中文本的数据结构。
倒排索引
倒排索引将单词存储为索引,并将文档名称存储为映射的引用。
正排索引
正排索引将文档名称存储为索引,并将单词存储为映射的引用。
以下是倒排索引和正排索引之间一些重要的区别。
序号 | 关键点 | 倒排索引 | 正排索引 |
---|---|---|---|
1 | 映射模式 | 倒排索引将单词存储为索引,并将文档名称存储为映射的引用。 | 正排索引将文档名称存储为索引,并将单词存储为映射的引用。 |
2 | 索引构建过程 |
|
|
3 | 索引 | 在倒排索引中,索引速度较慢,因为在准备索引之前必须检查每个单词。 | 在正排索引中,索引速度很快,因为找到关键字后会附加。 |
4 | 搜索 | 在倒排索引中,搜索速度很快。 | 在正排索引中,搜索速度很慢。 |
5 | 示例 | Word Documents ------------------------- Welcome doc1 Hello doc1, doc3 Hi doc2 ------------------------- | Word Documents ------------------------- doc1 Welcome, Hello doc2 Hi doc3 Hello ------------------------- |
6 | 重复性 | 在倒排索引中,索引中不存储重复的关键字。 | 在正排索引中,索引中可能存在重复的关键字,例如“Hello”。 |
7 | 现实生活中的例子 | 索引末尾的词汇表,反向查找。 | 书籍开头的目录,DNS 查找。 |
广告