正排索引和倒排索引

2020年4月25日20:31:15 评论 581字阅读1分56秒

正排索引和倒排索引

正排索引(正向索引)

正排表是以文档的ID为关键字,表中记录文档中每个字的位置信息,查找时扫描表中每个文档中字的信息直到找出所有包含查询关键字的文档。

正排索引和倒排索引

这种组织方法在建立索引的时候结构比较简单,建立比较方便且易于维护;因为索引是基于文档建立的,若是有新的文档加入,直接为该文档建立一个新的索引块,挂接在原来索引文件的后面。若是有文档删除,则直接找到该文档号文档对应的索引信息,将其直接删除。但是在查询的时候需对所有的文档进行扫描以确保没有遗漏,这样就使得检索时间大大延长,检索效率低下。

尽管正排表的工作原理非常的简单,但是由于其检索效率太低,除非在特定情况下,否则实用性价值不大。

倒排索引(反向索引)

倒排表以字或词为关键字进行索引,表中关键字所对应的记录表项记录了出现这个字或词的所有文档,一个表项就是一个字表段,它记录该文档的ID和字符在该文档中出现的位置情况。

正排索引和倒排索引

由于每个字或词对应的文档数量在动态变化,所以倒排表的建立和维护都较为复杂,但是在查询的时候由于可以一次得到查询关键字所对应的所有文档,所以效率高于正排表。在全文检索中,检索的快速响应是一个最为关键的性能,而索引建立由于在后台进行,尽管效率相对低一些,但不会影响整个搜索引擎的效率。

正排索引是从文档到关键字的映射(已知文档求关键字),倒排索引是从关键字到文档的映射(已知关键字求文档)。

  • 文本由 发表于 2020年4月25日20:31:15
  • 除非特殊声明,本站文章均为原创,转载请务必保留本文链接
百度搜索网页标题规范 SEO

百度搜索网页标题规范

百度搜索网页标题规范 对搜索用户来说,标题是一个网页最直观的认知渠道和展现方式,也是吸引用户点击搜索结果进入落地页的关键因素。 为了保障搜索用户对所需资源的有效获取,保证搜索结果的公平性,现百度搜索对...
黑帽SEO能否利用canonical标签陷害竞争对手 SEO

黑帽SEO能否利用canonical标签陷害竞争对手

黑帽SEO能否利用canonical标签陷害竞争对手 今天再介绍一个黑帽负面SEO的想法:利用canonical标签陷害竞争对手。 聊黑帽SEO绝不是建议读者做黑帽,优化正规网站的还是尽量别尝试,风险...
Google算法更新大全 SEO

Google算法更新大全

Google算法更新大全 前两个星期总结了有官方确认和名称的百度算法更新,对应的,当然也要总结一下Google算法更新。谷歌公布的算法更新更多,不总结一下真是记不清楚。做英文SEO的可以参考,尤其是遇...
百度搜索引擎的工作原理 SEO

百度搜索引擎的工作原理

百度搜索引擎的工作原理 百度以及其它搜索引擎的工作原理,其实大家已经讨论过很多,但随着科技的进步、互联网业的发展,各家搜索引擎都发生着巨大的变化,并且这些变化都是飞快的,本文的目的,除了从百度官方的角...
匿名

发表评论

匿名网友 填写信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: