发布一篇Lucene:基于Java的全文检索引擎简介
专门做了这个例子;而java的这个例子好像就是为了教学而写的,很多教学目的的例子是不考虑优化、性能的。Lucene是一个基于Java的全文索引工具包。
基于Java的全文索引引擎Lucene简介:关于作者和Lucene的汗青
全文检索的完成:Luene全文索引和数据库索引的对照
中文切分词机制简介:基于词库和主动切分词算法的对照
详细的安装和利用简介:体系布局先容和演示
HackingLucene:简化的查询剖析器,删除的完成,定制的排序,使用接口的扩大
从Lucene我们还能够学到甚么
基于Java的全文索引/检索引擎——Lucene
Lucene不是一个完全的全文索引使用,而是是一个用Java写的全文索引引擎工具包,它能够便利的嵌进到各类使用中完成针对使用的全文索引/检索功效。
Lucene的Lucene的奉献者DougCutting是一名资深全文索引/检索专家,已经是V-Twin搜刮引擎(Apple的Copland操纵体系的成绩之一)的次要开辟者,后在Excite担当初级体系架构计划师,今朝处置于一些INTERNET底层架构的研讨。他奉献出的Lucene的方针是为各类中小型使用程序到场全文检索功效。
Lucene的开展过程:新近公布在作者本人的www.lucene.com,厥后公布在SourceForge,2001年岁尾成为APACHE基金会jakarta的一个子项目:http://jakarta.apache.org/lucene/
已有良多Java项目都利用了Lucene作为厥后台的全文索引引擎,对照出名的有:
Jive:WEB论坛体系;
Eyebrows:邮件列表HTML回档/扫瞄/查询体系,本文的次要参考文档“TheLucenesearchengine:Powerful,flexible,andfree”作者就是EyeBrows体系的次要开辟者之一,而EyeBrows已成为今朝APACHE项目标次要邮件列表回档体系。
Cocoon:基于XML的web公布框架,全文检索部分利用了Lucene
Eclipse:基于Java的开摊开发平台,匡助部分的全文索引利用了Lucene
关于中文用户来讲,最体贴的成绩是其是不是撑持中文的全文检索。但经由过程前面关于Lucene的布局的先容,你会懂得到因为Lucene优秀架构计划,对中文的撑持只需对其言语词法剖析接口举行扩大就可以完成对中文检索的撑持。
全文检索的完成机制
Lucene的API接口计划的对照通用,输出输入布局都很像数据库的表==>纪录==>字段,以是良多传统的使用的文件、数据库等都能够对照便利的映照到Lucene的存储布局/接口中。整体上看:能够先把Lucene当做一个撑持全文索引的数据库体系。
对照一下Lucene和数据库:
<p>
大型的应用一般不会用这些框架(因为性能考虑);开发人员根据需要选择用一些框架,也可以不选用框架;不用框架并不代表要自己写框架;修改框架的可能性更小。 Pet Store.(宠物店)是SUN公司为了演示其J2EE编程规范而推出的开放源码的程序,应该很具有权威性,想学J2EE和EJB的朋友不要 错过了。 应用在电视机、电话、闹钟、烤面包机等家用电器的控制和通信。由于这些智能化家电的市场需求没有预期的高,Sun公司放弃了该项计划。随着1990年代互联网的发展 《JAVA语言程序设计》或《JAVA从入门到精通》这两本书开始学,等你编程有感觉的时候也可以回看一下。《JAVA读书笔记》这本书,因为讲的代码很多,也很容易看懂,涉及到面也到位。是你学习技术巩固的好书,学完后就看看《JAVA编程思想》这本书,找找一个自己写的代码跟书上的代码有什么不一样。 Java 编程语言的风格十分接近C、C++语言。 你可以去承接一些项目做了,一开始可能有些困难,可是你有技术积累,又考虑周全,接下项目来可以迅速作完,相信大家以后都会来找你的,所以Money就哗啦啦的。。。。。。 当然你也可以参加一些开源项目,一方面可以提高自己,另一方面也是为中国软件事业做贡献嘛!开发者在互联网上用CVS合作开发,用QQ,MSN,E-mail讨论联系,天南海北的程序员分散在各地却同时开发同一个软件,是不是很有意思呢? 在全球云计算和移动互联网的产业环境下,Java更具备了显著优势和广阔前景。 是一种将安全性(Security)列为第一优先考虑的语言 你快去找一份Java的编程工作来做吧(如果是在校学生可以去做兼职啊),在实践中提高自己,那才是最快的。不过你得祈祷在公司里碰到一个高手,而且他 还愿意不厌其烦地教你,这样好象有点难哦!还有一个办法就是读开放源码的程序了。我们知道开放源码大都出自高手,他们设计合理,考虑周到,再加上有广大的程序员参与,代码的价值自然是字字珠叽,铿锵有力(对不起,偶最近《金装四大才子》看多了)。 所以现在应用最广泛又最好学的就是J2EE了。 J2EE又包括许多组件,如Jsp,Servlet,JavaBean,EJB,JDBC,JavaMail等。要学习起来可不是一两天的事。那么又该如何学习J2EE呢?当然Java语法得先看一看的,I/O包,Util包,Lang包你都熟悉了吗?然后再从JSP学起。 是一种语言,用以产生「小应用程序(Applet(s)) 你可以去承接一些项目做了,一开始可能有些困难,可是你有技术积累,又考虑周全,接下项目来可以迅速作完,相信大家以后都会来找你的,所以Money就哗啦啦的。。。。。。
页:
[1]