JAVA网站制作之Java正则表达式详解(下)
你通过从书的数量和开发周期及运行速度来证明:net和ruby要比java简单。详解|正则3、使用实例上面我们来看看Jakarta-ORO库的一些使用实例。3.1日记文件处置义务:剖析一个Web服务器日记文件,断定每个用户花在网站上的工夫。在典范的BEAWebLogic日记文件中,日记纪录的格局以下:<br>剖析这个日记纪录,能够发明,要从这个日记文件提取的内容有两项:IP地点和页面会见工夫。你能够用分组标记(圆括号)从日记纪录提掏出IP地点和工夫标志。起首我们来看看IP地点。IP地点有4个字节组成,每个字节的值在0到255之间,各个字节经由过程一个句点分开。因而,IP地点中的每个字节有最少一个、最多三个数字。图八显现了为IP地点编写的正则表达式:
<br>
图八:婚配IP地点IP地点中的句点字符必需举行本义处置(后面加上“”),由于IP地点中的句点具有它原本的寄义,而不是接纳正则表达式语法中的特别寄义。句点在正则表达式中的特别寄义本文后面已先容。日记纪录的工夫部分由一对方括号包抄。你能够依照以下思绪提掏出方括号内里的一切内容:起首搜刮肇端方括号字符(“[”),提掏出一切不凌驾停止方括号字符(“]”)的内容,向前寻觅直至找到停止方括号字符。图九显现了这部分的正则表达式。
<br>
图九:婚配最少一个字符,直至找到“]”如今,把上述两个正则表达式加上分组标记(圆括号)后兼并成单个表达式,如许就能够从日记纪录提掏出IP地点和工夫。注重,为了婚配“--”(但不提取它),正则表达式两头到场了“s-s-s”。完全的正则表达式如图十所示。
<br>
图十:婚配IP地点和工夫标志如今正则表达式已编写终了,接上去能够编写利用正则表达式库的Java代码了。为利用Jakarta-ORO库,起首创立正则表达式字符串和待剖析的日记纪录字符串:
<br>这里利用的正则表达式与图十的正则表达式差未几完整不异,但有一点破例:在Java中,你必需对每个向前的斜杠(“”)举行本义处置。图十不是Java的暗示情势,以是我们要在每一个“”后面加上一个“”以避免呈现编译毛病。遗憾的是,本义处置历程很简单呈现毛病,以是应当胆小如鼠。你能够起首输出未经本义处置的正则表达式,然后从左到右顺次把每个“”交换成“”。假如要复检,你能够试着把它输入到屏幕上。初始化字符串以后,实例化PatternCompiler对象,用PatternCompiler编译正则表达式创立一个Pattern对象:
<br>如今,创立PatternMatcher对象,挪用PatternMatcher接口的contain()办法反省婚配情形:
<br>接上去,使用PatternMatcher接口前往的MatchResult对象,输入婚配的组。因为logEntry字符串包括婚配的内容,你能够看到类以下面的输入:
<br>3.2HTML处置实例一上面一个义务是剖析HTML页面内FONT标志的一切属性。HTML页面内典范的FONT标志以下所示:
<br>程序将依照以下情势,输入每个FONT标志的属性:
<br>在这类情形下,我倡议你利用两个正则表达式。第一个如图十一所示,它从字体标志提掏出“"face="Arial,Serif"size="+2"color="red"”。
<br>
图十一:婚配FONT标志的一切属性第二个正则表达式如图十二所示,它把各个属性支解成名字-值对。
<br>
图十二:婚配单个属性,并把它支解成名字-值对支解了局为:
<br>如今我们来看看完成这个义务的Java代码。起首创立两个正则表达式字符串,用Perl5Compiler把它们编译成Pattern对象。编译正则表达式的时分,指定Perl5Compiler.CASE_INSENSITIVE_MASK选项,使得婚配操纵不辨别巨细写。接上去,创立一个实行婚配操纵的Perl5Matcher对象。
<br>假定有一个String范例的变量html,它代表了HTML文件中的一行内容。假如html字符串包括FONT标志,婚配器将前往true。此时,你能够用婚配器对象前往的MatchResult对象取得第一个组,它包括了FONT的一切属性:
<br>接上去创立一个PatternMatcherInput对象。这个对象同意你从最初一次婚配的地位入手下手持续举行婚配操纵,因而,它很合适于提取FONT标志内属性的名字-值对。创立PatternMatcherInput对象,以参数情势传进待婚配的字符串。然后,用婚配器实例提掏出每个FONT的属性。这经由过程指定PatternMatcherInput对象(而不是字符串对象)为参数,重复地挪用PatternMatcher对象的contains()办法完成。PatternMatcherInput对象当中的每次迭代将把它外部的指针向前挪动,下一次检测将夙昔一次婚配地位的前面入手下手。本例的输入了局以下:
<br>3.3HTML处置实例二上面我们来看看另外一个处置HTML的例子。这一次,我们假定Web服务器从widgets.acme.com移到了newserver.acme.com。如今你要修正一些页面中的链接:
<br>实行这个搜刮的正则表达式如图十三所示:
图十三:婚配修正前的链接假如可以婚配这个正则表达式,你能够用上面的内容交换图十三的链接:
<br>注重#字符的前面加上了$1。Perl正则表达式语法用$1、$2等暗示已婚配且提掏出来的组。图十三的表达式把一切作为一个组婚配和提掏出来的内容附加到链接的前面。如今,前往Java。就象后面我们所做的那样,你必需创立测试字符串,创立把正则表达式编译到Pattern对象所必须的对象,和创立一个PatternMatcher对象:
<br>接上去,用com.oroinc.text.regex包Util类的substitute()静态办法举行交换,输入了局字符串:
<br>Util.substitute()办法的语法以下:
<br>这个挪用的前两个参数是之前创立的PatternMatcher和Pattern对象。第三个参数是一个Substiution对象,它决意了交换操纵怎样举行。本例利用的是Perl5Substitution对象,它可以举行Perl5作风的交换。第四个参数是想要举行交换操纵的字符串,最初一个参数同意指定是不是交换形式的一切婚配子串(Util.SUBSTITUTE_ALL),或只交换指定的次数。【停止语】在这篇文章中,我为你先容了正则表达式的壮大功效。只需准确使用,正则表达式可以在字符串提取和文本修正中起到很年夜的感化。别的,我还先容了怎样在Java程序中经由过程Jakarta-ORO库使用正则表达式。至于终极接纳老式的字符串处置体例(利用StringTokenizer,charAt,和substring),仍是接纳正则表达式,这就有待你本人决意了。
诸如RMI,EJB等一些技术并不是你说的那么复杂,而是它们把一些复杂的工具封装成不复杂的工具了,理解这些工具是需要些时间。我问你,.net里有这些工具吗?要简单多少?。 J2SE开发桌面应用软件比起 VC,VB,DEPHI这些传统开发语言来说,优势好象并不明显。J2ME对于初学者来说,好象又有点深奥,而且一般开发者很难有开发环境。 吧,现在很流行的Structs就是它的一种实现方式,不过Structs用起来实在是很繁,我们只要学习其精髓即可,我们完全可以设计自己的MVC结构。然后你再研究一下软件Refactoring (重构)和极限XP编程,相信你又会上一个台阶。 做完这些,你不如整理一下你的Java代码,把那些经典的程序和常见的应用整理出来,再精心打造一番,提高其重用性和可扩展性。你再找几个志同道合的朋友成立一个工作室吧 Java语言支持Internet应用的开发,在基本的Java应用编程接口中有一个网络应用编程接口(java net),它提供了用于网络应用编程的类库,包括URL、URLConnection、Socket、ServerSocket等。Java的RMI(远程方法激活)机制也是开发分布式应用的重要手段。 Sun公司看见Oak在互联网上应用的前景,于是改造了Oak,于1995年5月以Java的名称正式发布。Java伴随着互联网的迅猛发展而发展,逐渐成为重要的网络编程语言。 科学超级计算机、移动电话和互联网,同时拥有全球最大的开发者专业社群。 Jive的资料在很多网站上都有,大家可以找来研究一下。相信你读完代码后,会有脱胎换骨的感觉。遗憾的是Jive从2.5以后就不再无条件的开放源代码,同时有licence限制。不过幸好还有中国一流的Java程序员关注它,外国人不开源了,中国人就不能开源吗?这里向大家推荐一个汉化的Jive版本—J道。Jive(J道版)是由中国Java界大名 鼎鼎的banq在Jive 2.1版本基础上改编而成, 全中文,增加了一些实用功能,如贴图,用户头像和用户资料查询等,而且有一个开发团队在不断升级。你可以访问banq的网站 接着就是EJB了,EJB就是Enterprise JavaBean, 看名字好象它是Javabean,可是它和Javabean还是有区别的。它是一个体系结构,你可以搭建更安全、更稳定的企业应用。它的大量代码已由中间件(也就是我们常听到的 Weblogic,Websphere这些J2EE服务器)完成了,所以我们要做的程序代码量很少,大部分工作都在设计和配置中间件上。 当然你也可以参加一些开源项目,一方面可以提高自己,另一方面也是为中国软件事业做贡献嘛!开发者在互联网上用CVS合作开发,用QQ,MSN,E-mail讨论联系,天南海北的程序员分散在各地却同时开发同一个软件,是不是很有意思呢? 是一种使网页(Web Page)产生生动活泼画面的语言 是一种使用者不需花费很多时间学习的语言 应用在电视机、电话、闹钟、烤面包机等家用电器的控制和通信。由于这些智能化家电的市场需求没有预期的高,Sun公司放弃了该项计划。随着1990年代互联网的发展 是一种简化的C++语言 是一种安全的语言,具有阻绝计算机病毒传输的功能 在全球云计算和移动互联网的产业环境下,Java更具备了显著优势和广阔前景。 Sun公司看见Oak在互联网上应用的前景,于是改造了Oak,于1995年5月以Java的名称正式发布。Java伴随着互联网的迅猛发展而发展,逐渐成为重要的网络编程语言。 一直感觉JAVA很大,很杂,找不到学习方向,前两天在网上找到了这篇文章,感觉不错,给没有方向的我指了一个方向,先不管对不对,做下来再说。 所以现在应用最广泛又最好学的就是J2EE了。 J2EE又包括许多组件,如Jsp,Servlet,JavaBean,EJB,JDBC,JavaMail等。要学习起来可不是一两天的事。那么又该如何学习J2EE呢?当然Java语法得先看一看的,I/O包,Util包,Lang包你都熟悉了吗?然后再从JSP学起。 如果你学过HTML,那么事情要好办的多,如果没有,那你快去补一补HTML基础吧。其实JSP中的Java语法也不多,它更象一个脚本语言,有点象ASP。 所以现在应用最广泛又最好学的就是J2EE了。 J2EE又包括许多组件,如Jsp,Servlet,JavaBean,EJB,JDBC,JavaMail等。要学习起来可不是一两天的事。那么又该如何学习J2EE呢?当然Java语法得先看一看的,I/O包,Util包,Lang包你都熟悉了吗?然后再从JSP学起。
页:
[1]