JAVA网页设计Java中四种XML剖析手艺之不完整测试
为什么外国人还要写那些框架进行代码封装,他们不就是为了别人使用时可以更简单么!如果要达到一个企业级项目的不用框架是很难的。小一些的项目还行,大的光是MVC模式的设计的编码量就够大的了。还有性能方面,单轮windows,这个工具是微软写的,。xml在平常事情中,不免会碰到把XML作为数据存储格局。面临今朝品种单一的办理计划,哪一个最合适我们呢?在这篇文章中,我对这四种支流计划做一个不完整评测,仅仅针对遍历XML这块来测试,由于遍历XML是事情中利用最多的(最少我以为)。 准备 测试情况: AMD毒龙1.4GOC1.5G、256MDDR333、Windows2000ServerSP4、SunJDK1.4.1+Eclipse2.1+Resin2.1.8,在Debug形式下测试。 XML文件格局以下: <?xmlversion="1.0"encoding="GB2312"?><RESULT><VALUE> <NO>A1234</NO> <ADDR>四川省XX县XX镇XX路X段XX号</ADDR></VALUE><VALUE> <NO>B1234</NO> <ADDR>四川省XX市XX乡XX村XX组</ADDR></VALUE></RESULT> 测试办法: 接纳JSP端挪用Bean(至于为何接纳JSP来挪用,请参考:http://blog.csdn.net/rosen/archive/2004/10/15/138324.aspx),让每种计划分离剖析10K、100K、1000K、10000K的XML文件,盘算其损耗工夫(单元:毫秒)。 JSP文件: <%@pagecontentType="text/html;charset=gb2312"%><%@pageimport="com.test.*"%> <html><body><%Stringargs[]={""};MyXMLReader.main(args);%></body></html> 测试 起首进场的是DOM(JAXPCrimson剖析器) DOM是用与平台和言语有关的体例暗示XML文档的官方W3C尺度。DOM是以条理布局构造的节点或信息片段的汇合。这个条理布局同意开辟职员在树中寻觅特定信息。剖析该布局一般必要加载全部文档和机关条理布局,然后才干做任何事情。因为它是基于信息条理的,因此DOM被以为是基于树或基于对象的。DOM和狭义的基于树的处置具有几个长处。起首,因为树在内存中是耐久的,因而能够修正它以便使用程序能对数据和布局作出变动。它还能够在任什么时候候在树中高低导航,而不是像SAX那样是一次性的处置。DOM利用起来也要复杂很多。 另外一方面,关于出格年夜的文档,剖析和加载全部文档大概很慢且很耗资本,因而利用其他手腕来处置如许的数据会更好。这些基于事务的模子,好比SAX。 Bean文件: packagecom.test; importjava.io.*;importjava.util.*;importorg.w3c.dom.*;importjavax.xml.parsers.*; publicclassMyXMLReader{ publicstaticvoidmain(Stringarge[]){ longlasting=System.currentTimeMillis(); try{ Filef=newFile("data_10k.xml"); DocumentBuilderFactoryfactory=DocumentBuilderFactory.newInstance(); DocumentBuilderbuilder=factory.newDocumentBuilder(); Documentdoc=builder.parse(f); NodeListnl=doc.getElementsByTagName("VALUE"); for(inti=0;i<nl.getLength();i++){ System.out.print("车商标码:"+doc.getElementsByTagName("NO").item(i).getFirstChild().getNodeValue()); System.out.println("车主地点:"+doc.getElementsByTagName("ADDR").item(i).getFirstChild().getNodeValue()); } }catch(Exceptione){ e.printStackTrace(); } System.out.println("运转工夫:"+(System.currentTimeMillis()-lasting)+"毫秒");}} 10k损耗工夫:265203219172 100k损耗工夫:9172901688919000 1000k损耗工夫:691719675407708375739656 10000k损耗工夫:OutOfMemoryError 接着是SAX 这类处置的长处十分相似于流媒体的长处。剖析可以当即入手下手,而不是守候一切的数据被处置。并且,因为使用程序只是在读取数据时反省数据,因而不必要将数据存储在内存中。这关于年夜型文档来讲是个伟大的长处。现实上,使用程序乃至不用剖析全部文档;它能够在某个前提失掉满意时中断剖析。一样平常来讲,SAX还比它的替换者DOM快很多。 选择DOM仍是选择SAX? 关于必要本人编写代码来处置XML文档的开辟职员来讲, 选择DOM仍是SAX剖析模子是一个十分主要的计划决议。 DOM接纳创建树形布局的体例会见XML文档,而SAX接纳的事务模子。 DOM剖析器把XML文档转化为一个包括其内容的树,并能够对树举行遍历。用DOM剖析模子的长处是编程简单,开辟职员只必要挪用建立的指令,然后使用navigationAPIs会见所需的树节点来完成义务。能够很简单的增加和修正树中的元素。但是因为利用DOM剖析器的时分必要处置全部XML文档,以是对功能和内存的请求对照高,特别是碰到很年夜的XML文件的时分。因为它的遍历才能,DOM剖析器经常使用于XML文档必要频仍的改动的服务中。 SAX剖析器接纳了基于事务的模子,它在剖析XML文档的时分能够触发一系列的事务,当发明给定的tag的时分,它能够激活一个回调办法,告知该办法制订的标签已找到。SAX对内存的请求一般会对照低,由于它闪开发职员本人来决意所要处置的tag。出格是当开辟职员只必要处置文档中所包括的部分数据时,SAX这类扩大才能失掉了更好的表现。但用SAX剖析器的时分编码事情会对照坚苦,并且很难同时会见统一个文档中的多处分歧数据。 Bean文件: packagecom.test;importorg.xml.sax.*;importorg.xml.sax.helpers.*;importjavax.xml.parsers.*; publicclassMyXMLReaderextendsDefaultHandler{ java.util.Stacktags=newjava.util.Stack(); publicMyXMLReader(){ super();} publicstaticvoidmain(Stringargs[]){ longlasting=System.currentTimeMillis(); try{ SAXParserFactorysf=SAXParserFactory.newInstance(); SAXParsersp=sf.newSAXParser(); MyXMLReaderreader=newMyXMLReader(); sp.parse(newInputSource("data_10k.xml"),reader); }catch(Exceptione){ e.printStackTrace(); } System.out.println("运转工夫:"+(System.currentTimeMillis()-lasting)+"毫秒");} publicvoidcharacters(charch[],intstart,intlength)throwsSAXException{ Stringtag=(String)tags.peek(); if(tag.equals("NO")){ System.out.print("车商标码:"+newString(ch,start,length));}if(tag.equals("ADDR")){ System.out.println("地点:"+newString(ch,start,length));}} publicvoidstartElement(Stringuri,StringlocalName,StringqName,Attributesattrs){ tags.push(qName);}} 10k损耗工夫:1104710978 100k损耗工夫:344406375422 1000k损耗工夫:3234328136883312 10000k损耗工夫:3257834313317973189030328 然后是JDOMhttp://www.jdom.org/ JDOM的目标是成为Java特定文档模子,它简化与XML的交互而且比利用DOM完成更快。因为是第一个Java特定模子,JDOM一向失掉鼎力推行和增进。正在思索经由过程“Java标准哀求JSR-102”将它终极用作“Java尺度扩大”。从2000岁首就已入手下手了JDOM开辟。 JDOM与DOM次要有两方面分歧。起首,JDOM仅利用详细类而不利用接口。这在某些方面简化了API,可是也限定了天真性。第二,API大批利用了Collections类,简化了那些已熟习这些类的Java开辟者的利用。 JDOM文档声明其目标是“利用20%(或更少)的精神办理80%(或更多)Java/XML成绩”(依据进修曲线假定为20%)。JDOM关于年夜多半Java/XML使用程序来讲固然是有效的,而且年夜多半开辟者发明API比DOM简单了解很多。JDOM还包含对程序举动的相称普遍反省以避免用户做任安在XML中偶然义的事。但是,它仍必要您充实了解XML以便做一些超越基础的事情(大概乃至了解某些情形下的毛病)。这大概是比进修DOM或JDOM接口都更成心义的事情。 JDOM本身不包括剖析器。它一般利用SAX2剖析器来剖析和考证输出XML文档(只管它还能够将之前机关的DOM暗示作为输出)。它包括一些转换器以将JDOM暗示输入成SAX2事务流、DOM模子或XML文本文档。JDOM是在Apache允许证变体下公布的开放源码。 Bean文件: packagecom.test; importjava.io.*;importjava.util.*;importorg.jdom.*;importorg.jdom.input.*; publicclassMyXMLReader{ publicstaticvoidmain(Stringarge[]){ longlasting=System.currentTimeMillis(); try{ SAXBuilderbuilder=newSAXBuilder(); Documentdoc=builder.build(newFile("data_10k.xml")); Elementfoo=doc.getRootElement(); ListallChildren=foo.getChildren(); for(inti=0;i<allChildren.size();i++){ System.out.print("车商标码:"+((Element)allChildren.get(i)).getChild("NO").getText()); System.out.println("车主地点:"+((Element)allChildren.get(i)).getChild("ADDR").getText()); } }catch(Exceptione){ e.printStackTrace(); } System.out.println("运转工夫:"+(System.currentTimeMillis()-lasting)+"毫秒");}} 10k损耗工夫:1256218794 100k损耗工夫:704625640766 1000k损耗工夫:27984307502785930656 10000k损耗工夫:OutOfMemoryError 最初是DOM4Jhttp://dom4j.sourceforge.net/ 固然DOM4J代表了完整自力的开辟了局,但最后,它是JDOM的一种智能分支。它兼并了很多超越基础XML文档暗示的功效,包含集成的XPath撑持、XMLSchema撑持和用于年夜文档或流化文档的基于事务的处置。它还供应了构建文档暗示的选项,它经由过程DOM4JAPI和尺度DOM接口具有并行会见功效。从2000下半年入手下手,它就一向处于开辟当中。 为撑持一切这些功效,DOM4J利用接口和笼统基础类办法。DOM4J大批利用了API中的Collections类,可是在很多情形下,它还供应一些替换办法以同意更好的功能或更间接的编码办法。间接优点是,固然DOM4J支付了更庞大的API的价值,可是它供应了比JDOM年夜很多的天真性。 在增加天真性、XPath集成和对年夜文档处置的方针时,DOM4J的方针与JDOM是一样的:针对Java开辟者的易用性和直不雅操纵。它还努力于成为比JDOM更完全的办理计划,完成在实质上处置一切Java/XML成绩的方针。在完成该方针时,它比JDOM更少夸大避免不准确的使用程序举动。 DOM4J是一个十分十分优异的JavaXMLAPI,具有功能优秀、功效壮大和极度易用利用的特性,同时它也是一个开放源代码的软件。现在你能够看到愈来愈多的Java软件都在利用DOM4J来读写XML,出格值得一提的是连Sun的JAXM也在用DOM4J。 Bean文件: packagecom.test; importjava.io.*;importjava.util.*;importorg.dom4j.*;importorg.dom4j.io.*; publicclassMyXMLReader{ publicstaticvoidmain(Stringarge[]){ longlasting=System.currentTimeMillis(); try{ Filef=newFile("data_10k.xml"); SAXReaderreader=newSAXReader(); Documentdoc=reader.read(f); Elementroot=doc.getRootElement(); Elementfoo; for(Iteratori=root.elementIterator("VALUE");i.hasNext();){ foo=(Element)i.next(); System.out.print("车商标码:"+foo.elementText("NO")); System.out.println("车主地点:"+foo.elementText("ADDR")); } }catch(Exceptione){ e.printStackTrace(); } System.out.println("运转工夫:"+(System.currentTimeMillis()-lasting)+"毫秒");}} 10k损耗工夫:1097810931 100k损耗工夫:297359172312 1000k损耗工夫:2281235923442469 10000k损耗工夫:20938199222003121078 JDOM和DOM在功能测试时体现欠安,在测试10M文档时内存溢出。在小文档情形下还值得思索利用DOM和JDOM。固然JDOM的开辟者已申明他们希冀在正式刊行版前专注功能成绩,可是从功能概念来看,它的确没有值得保举的地方。别的,DOM还是一个十分好的选择。DOM完成普遍使用于多种编程言语。它仍是很多别的与XML相干的尺度的基本,由于它正式取得W3C保举(与基于非尺度的Java模子绝对),以是在某些范例的项目中大概也必要它(如在JavaScript中利用DOM)。 SAX体现较好,这要依附于它特定的剖析体例。一个SAX检测行将到来的XML流,但并没有载进到内存(固然当XML流被读进时,会有部分文档临时埋没在内存中)。 无疑,DOM4J是这场测试的得胜者,今朝很多开源项目中大批接纳DOM4J,比方赫赫有名的Hibernate也用DOM4J来读取XML设置文件。假如不思索可移植性,那就接纳DOM4J吧!(文/rosen)其实产生见解的过程就是训练自己发现问题,分析问题的能力。根据以上的认识我想谈下传统的学习与通过视频独立学习的优缺点: 设计模式是高级程序员真正掌握面向对象核心思想的必修课。设计模式并不是一种具体"技术",它讲述的是思想,它不仅仅展示了接口或抽象类在实际案例中的灵活应用和智慧 Jive的资料在很多网站上都有,大家可以找来研究一下。相信你读完代码后,会有脱胎换骨的感觉。遗憾的是Jive从2.5以后就不再无条件的开放源代码,同时有licence限制。不过幸好还有中国一流的Java程序员关注它,外国人不开源了,中国人就不能开源吗?这里向大家推荐一个汉化的Jive版本—J道。Jive(J道版)是由中国Java界大名 鼎鼎的banq在Jive 2.1版本基础上改编而成, 全中文,增加了一些实用功能,如贴图,用户头像和用户资料查询等,而且有一个开发团队在不断升级。你可以访问banq的网站 多重继承(以接口取代)等特性,增加了垃圾回收器功能用于回收不再被引用的对象所占据的内存空间,使得程序员不用再为内存管理而担忧。在 Java 1.5 版本中,Java 又引入了泛型编程(Generic Programming)、类型安全的枚举、不定长参数和自动装/拆箱等语言特性。 是一种使网页(Web Page)产生生动活泼画面的语言 Java 不同于一般的编译执行计算机语言和解释执行计算机语言。它首先将源代码编译成二进制字节码(bytecode),然后依赖各种不同平台上的虚拟机来解释执行字节码。从而实现了“一次编译、到处执行”的跨平台特性。 还好,SUN提供了Javabean可以把你的JSP中的 Java代码封装起来,便于调用也便于重用。 Java语言支持Internet应用的开发,在基本的Java应用编程接口中有一个网络应用编程接口(java net),它提供了用于网络应用编程的类库,包括URL、URLConnection、Socket、ServerSocket等。Java的RMI(远程方法激活)机制也是开发分布式应用的重要手段。 我大二,Java也只学了一年,觉得还是看thinking in java好,有能力的话看英文原版(中文版翻的不怎么好),还能提高英文文档阅读能力。 Java是一种计算机编程语言,拥有跨平台、面向对java J2SE开发桌面应用软件比起 VC,VB,DEPHI这些传统开发语言来说,优势好象并不明显。J2ME对于初学者来说,好象又有点深奥,而且一般开发者很难有开发环境。 是一种由美国SUN计算机公司(Sun Microsystems, Inc.)所研究而成的语言 还好,SUN提供了Javabean可以把你的JSP中的 Java代码封装起来,便于调用也便于重用。 你一定会高兴地说,哈哈,原来成为Java高手就这么简单啊!记得Tomjava也曾碰到过一个项目经理,号称Java很简单,只要三个月就可以学会。 Jive的资料在很多网站上都有,大家可以找来研究一下。相信你读完代码后,会有脱胎换骨的感觉。遗憾的是Jive从2.5以后就不再无条件的开放源代码,同时有licence限制。不过幸好还有中国一流的Java程序员关注它,外国人不开源了,中国人就不能开源吗?这里向大家推荐一个汉化的Jive版本—J道。Jive(J道版)是由中国Java界大名 鼎鼎的banq在Jive 2.1版本基础上改编而成, 全中文,增加了一些实用功能,如贴图,用户头像和用户资料查询等,而且有一个开发团队在不断升级。你可以访问banq的网站 你一定会高兴地说,哈哈,原来成为Java高手就这么简单啊!记得Tomjava也曾碰到过一个项目经理,号称Java很简单,只要三个月就可以学会。 接着就是EJB了,EJB就是Enterprise JavaBean, 看名字好象它是Javabean,可是它和Javabean还是有区别的。它是一个体系结构,你可以搭建更安全、更稳定的企业应用。它的大量代码已由中间件(也就是我们常听到的 Weblogic,Websphere这些J2EE服务器)完成了,所以我们要做的程序代码量很少,大部分工作都在设计和配置中间件上。 至于JDBC,就不用我多说了,你如果用java编过存取数据库的程序,就应该很熟悉。还有,如果你要用Java编发送电子邮件的程序,你就得看看Javamail 了。 如果要向java web方向发展也要吧看看《Java web从入门到精通》学完再到《Struts2.0入门到精通》这样你差不多就把代码给学完了。有兴趣可以看一些设计模块和框架的包等等。 你快去找一份Java的编程工作来做吧(如果是在校学生可以去做兼职啊),在实践中提高自己,那才是最快的。不过你得祈祷在公司里碰到一个高手,而且他 还愿意不厌其烦地教你,这样好象有点难哦!还有一个办法就是读开放源码的程序了。我们知道开放源码大都出自高手,他们设计合理,考虑周到,再加上有广大的程序员参与,代码的价值自然是字字珠叽,铿锵有力(对不起,偶最近《金装四大才子》看多了)。
页:
[1]
2