|
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
你通过从书的数量和开发周期及运行速度来证明:net和ruby要比java简单。详解|正则3、使用实例上面我们来看看Jakarta-ORO库的一些使用实例。3.1日记文件处置义务:剖析一个Web服务器日记文件,断定每个用户花在网站上的工夫。在典范的BEAWebLogic日记文件中,日记纪录的格局以下:
<br>剖析这个日记纪录,能够发明,要从这个日记文件提取的内容有两项:IP地点和页面会见工夫。你能够用分组标记(圆括号)从日记纪录提掏出IP地点和工夫标志。起首我们来看看IP地点。IP地点有4个字节组成,每个字节的值在0到255之间,各个字节经由过程一个句点分开。因而,IP地点中的每个字节有最少一个、最多三个数字。图八显现了为IP地点编写的正则表达式:
<br>
图八:婚配IP地点IP地点中的句点字符必需举行本义处置(后面加上“”),由于IP地点中的句点具有它原本的寄义,而不是接纳正则表达式语法中的特别寄义。句点在正则表达式中的特别寄义本文后面已先容。日记纪录的工夫部分由一对方括号包抄。你能够依照以下思绪提掏出方括号内里的一切内容:起首搜刮肇端方括号字符(“[”),提掏出一切不凌驾停止方括号字符(“]”)的内容,向前寻觅直至找到停止方括号字符。图九显现了这部分的正则表达式。
<br>
图九:婚配最少一个字符,直至找到“]”如今,把上述两个正则表达式加上分组标记(圆括号)后兼并成单个表达式,如许就能够从日记纪录提掏出IP地点和工夫。注重,为了婚配“--”(但不提取它),正则表达式两头到场了“s-s-s”。完全的正则表达式如图十所示。
<br>
图十:婚配IP地点和工夫标志如今正则表达式已编写终了,接上去能够编写利用正则表达式库的Java代码了。为利用Jakarta-ORO库,起首创立正则表达式字符串和待剖析的日记纪录字符串:
<br>这里利用的正则表达式与图十的正则表达式差未几完整不异,但有一点破例:在Java中,你必需对每个向前的斜杠(“”)举行本义处置。图十不是Java的暗示情势,以是我们要在每一个“”后面加上一个“”以避免呈现编译毛病。遗憾的是,本义处置历程很简单呈现毛病,以是应当胆小如鼠。你能够起首输出未经本义处置的正则表达式,然后从左到右顺次把每个“”交换成“”。假如要复检,你能够试着把它输入到屏幕上。初始化字符串以后,实例化PatternCompiler对象,用PatternCompiler编译正则表达式创立一个Pattern对象:
<br>如今,创立PatternMatcher对象,挪用PatternMatcher接口的contain()办法反省婚配情形:
<br>接上去,使用PatternMatcher接口前往的MatchResult对象,输入婚配的组。因为logEntry字符串包括婚配的内容,你能够看到类以下面的输入:
<br>3.2HTML处置实例一上面一个义务是剖析HTML页面内FONT标志的一切属性。HTML页面内典范的FONT标志以下所示:
<br>程序将依照以下情势,输入每个FONT标志的属性:
<br>在这类情形下,我倡议你利用两个正则表达式。第一个如图十一所示,它从字体标志提掏出“"face="Arial,Serif"size="+2"color="red"”。
<br>
图十一:婚配FONT标志的一切属性第二个正则表达式如图十二所示,它把各个属性支解成名字-值对。
<br>
图十二:婚配单个属性,并把它支解成名字-值对支解了局为:
<br>如今我们来看看完成这个义务的Java代码。起首创立两个正则表达式字符串,用Perl5Compiler把它们编译成Pattern对象。编译正则表达式的时分,指定Perl5Compiler.CASE_INSENSITIVE_MASK选项,使得婚配操纵不辨别巨细写。接上去,创立一个实行婚配操纵的Perl5Matcher对象。
<br>假定有一个String范例的变量html,它代表了HTML文件中的一行内容。假如html字符串包括FONT标志,婚配器将前往true。此时,你能够用婚配器对象前往的MatchResult对象取得第一个组,它包括了FONT的一切属性:
<br>接上去创立一个PatternMatcherInput对象。这个对象同意你从最初一次婚配的地位入手下手持续举行婚配操纵,因而,它很合适于提取FONT标志内属性的名字-值对。创立PatternMatcherInput对象,以参数情势传进待婚配的字符串。然后,用婚配器实例提掏出每个FONT的属性。这经由过程指定PatternMatcherInput对象(而不是字符串对象)为参数,重复地挪用PatternMatcher对象的contains()办法完成。PatternMatcherInput对象当中的每次迭代将把它外部的指针向前挪动,下一次检测将夙昔一次婚配地位的前面入手下手。本例的输入了局以下:
<br>3.3HTML处置实例二上面我们来看看另外一个处置HTML的例子。这一次,我们假定Web服务器从widgets.acme.com移到了newserver.acme.com。如今你要修正一些页面中的链接:
<br>实行这个搜刮的正则表达式如图十三所示:
图十三:婚配修正前的链接假如可以婚配这个正则表达式,你能够用上面的内容交换图十三的链接:
<br>注重#字符的前面加上了$1。Perl正则表达式语法用$1、$2等暗示已婚配且提掏出来的组。图十三的表达式把一切作为一个组婚配和提掏出来的内容附加到链接的前面。如今,前往Java。就象后面我们所做的那样,你必需创立测试字符串,创立把正则表达式编译到Pattern对象所必须的对象,和创立一个PatternMatcher对象:
<br>接上去,用com.oroinc.text.regex包Util类的substitute()静态办法举行交换,输入了局字符串:
<br>Util.substitute()办法的语法以下:
<br>这个挪用的前两个参数是之前创立的PatternMatcher和Pattern对象。第三个参数是一个Substiution对象,它决意了交换操纵怎样举行。本例利用的是Perl5Substitution对象,它可以举行Perl5作风的交换。第四个参数是想要举行交换操纵的字符串,最初一个参数同意指定是不是交换形式的一切婚配子串(Util.SUBSTITUTE_ALL),或只交换指定的次数。【停止语】在这篇文章中,我为你先容了正则表达式的壮大功效。只需准确使用,正则表达式可以在字符串提取和文本修正中起到很年夜的感化。别的,我还先容了怎样在Java程序中经由过程Jakarta-ORO库使用正则表达式。至于终极接纳老式的字符串处置体例(利用StringTokenizer,charAt,和substring),仍是接纳正则表达式,这就有待你本人决意了。
诸如RMI,EJB等一些技术并不是你说的那么复杂,而是它们把一些复杂的工具封装成不复杂的工具了,理解这些工具是需要些时间。我问你,.net里有这些工具吗?要简单多少?。 |
|