|
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
专门做了这个例子;而java的这个例子好像就是为了教学而写的,很多教学目的的例子是不考虑优化、性能的。
Lucene是一个基于Java的全文索引工具包。
基于Java的全文索引引擎Lucene简介:关于作者和Lucene的汗青
全文检索的完成:Luene全文索引和数据库索引的对照
中文切分词机制简介:基于词库和主动切分词算法的对照
详细的安装和利用简介:体系布局先容和演示
HackingLucene:简化的查询剖析器,删除的完成,定制的排序,使用接口的扩大
从Lucene我们还能够学到甚么
基于Java的全文索引/检索引擎——Lucene
Lucene不是一个完全的全文索引使用,而是是一个用Java写的全文索引引擎工具包,它能够便利的嵌进到各类使用中完成针对使用的全文索引/检索功效。
Lucene的Lucene的奉献者DougCutting是一名资深全文索引/检索专家,已经是V-Twin搜刮引擎(Apple的Copland操纵体系的成绩之一)的次要开辟者,后在Excite担当初级体系架构计划师,今朝处置于一些INTERNET底层架构的研讨。他奉献出的Lucene的方针是为各类中小型使用程序到场全文检索功效。
Lucene的开展过程:新近公布在作者本人的www.lucene.com,厥后公布在SourceForge,2001年岁尾成为APACHE基金会jakarta的一个子项目:http://jakarta.apache.org/lucene/
已有良多Java项目都利用了Lucene作为厥后台的全文索引引擎,对照出名的有:
Jive:WEB论坛体系;
Eyebrows:邮件列表HTML回档/扫瞄/查询体系,本文的次要参考文档“TheLucenesearchengine:Powerful,flexible,andfree”作者就是EyeBrows体系的次要开辟者之一,而EyeBrows已成为今朝APACHE项目标次要邮件列表回档体系。
Cocoon:基于XML的web公布框架,全文检索部分利用了Lucene
Eclipse:基于Java的开摊开发平台,匡助部分的全文索引利用了Lucene
关于中文用户来讲,最体贴的成绩是其是不是撑持中文的全文检索。但经由过程前面关于Lucene的布局的先容,你会懂得到因为Lucene优秀架构计划,对中文的撑持只需对其言语词法剖析接口举行扩大就可以完成对中文检索的撑持。
全文检索的完成机制
Lucene的API接口计划的对照通用,输出输入布局都很像数据库的表==>纪录==>字段,以是良多传统的使用的文件、数据库等都能够对照便利的映照到Lucene的存储布局/接口中。整体上看:能够先把Lucene当做一个撑持全文索引的数据库体系。
对照一下Lucene和数据库:
<p>
大型的应用一般不会用这些框架(因为性能考虑);开发人员根据需要选择用一些框架,也可以不选用框架;不用框架并不代表要自己写框架;修改框架的可能性更小。 |
|