注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

anqiang专栏

不要问细节是怎么搞的,源码说明一切

 
 
 

日志

 
 

索引机制开篇  

2009-11-30 10:54:49|  分类: Lucene |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

检索系统的基础是索引系统,现在的索引系统都是使用倒排技术来实现检索功能。倒排的机制相信稍微有一点检索系统基本知识的人都清楚,在这里就不讲了。现代检索系统也是建立在这个机制之上上的。当然一个检索系统如果要在实际中使用,要考虑的方面有很多,检索的效率、索引存储空间的大小、检索的可配置性等等。这些方面的要求使实现一个检索系统越来越复杂了。为了满足这些方面的要求,Lucene的索引系统部分代码变得非常庞大、复杂。

在索引部分,我们会从几个方面介绍:

1.索引中各个不同的文件格式的读写以及它们代表的含义(FieldInfosReaderTermInfosReaderTermInfosWriterTermVectorsReaderTermVectorsWriter)

2.索引的读写(IndexReaderIndexWriterDirectoryReaderSegmentReader;

3.一些常用的接口作用介绍(TermDocsTermEnumTermFreqVector

4.索引的合并方式(MergePolicy)

5.索引的构建类相关

  评论这张
 
阅读(234)| 评论(0)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017