飘灵儿 发表于 2015-1-18 11:37:02

JAVA网页设计将 HTML 文件转换成 XML

但是一些大型开发或者是保密型比较高的项目都会用java,原因有2点,一:java是开源的,不怕别人留后门,偷我工具,.net就不一样了,保持微软的一向风格,源代码不公开xml|转换在Java专家MichaelGeisler为Builder澳年夜利亚写的第一篇文章中,他向读者展现了怎样利用JTidy将HTML文件转换成XML。

有关Java的最主要的事变是有良多扩大尺度库能够作为尺度平台的一部分,并且在那些库中有对XML供应了十分多的撑持。但是关于某些特定的必要,在尺度库中大概没有间接的撑持。



实在你有两个选择:

完整由本人来构建一些工具。这一样平常很疾苦,并且很费工夫。
往“社区”看看是不是已有人碰到了一样的成绩(这类情形十分有大概产生),看他是不是愿意与你分享他的功效。
关于这个情形,SourceForge上有一个十分有效的小项目,叫做JTidy。JTidy的Web站点位于http://sourceforge.net/projects/jtidy/。

JTidy供应HTML语法反省和HTML的“prettyprinting(大度打印)”,可是关于你来讲,它还同意你将一个HTML文件作为输出,然后将其转换成为XML。JTidy读取输出文件,然后假如发明有任何不婚配或漏掉的闭合标志,将改正这些标志,最初输入一个格局优秀的XML文档。

从上面的示例代码中能够看到,JTidy的用法相称复杂。复杂地将JTidy实例设置为输入XML,供应一个输出URL,输入文件和毛病文件,然后启动转换历程就能够了。

importjava.net.URL;
importjava.io.*;
importorg.w3c.tidy.Tidy;

publicclassTestHTML2XML{
privateStringurl;
privateStringoutFileName;
privateStringerrOutFileName;

publicTestHTML2XML(Stringurl,StringoutFileName,String
errOutFileName){
this.url=url;
this.outFileName=outFileName;
this.errOutFileName=errOutFileName;
}

publicvoidconvert(){
URLu;
BufferedInputStreamin;
FileOutputStreamout;

Tidytidy=newTidy();

//TellTidytoconvertHTMLtoXML
tidy.setXmlOut(true);

try{
//Setfileforerrormessages
tidy.setErrout(newPrintWriter(newFileWriter(errOutFileName),true));
u=newURL(url);

//Createinputandoutputstreams
in=newBufferedInputStream(u.openStream());
out=newFileOutputStream(outFileName);

//Convertfiles
tidy.parse(in,out);

//Cleanup
in.close();
out.close();

}catch(IOExceptione){
System.out.println(this.toString()+e.toString());
}
}

publicstaticvoidmain(String[]args){
/*
*Parametersare:
*URLofHTMLfile
*Filenameofoutputfile
*Filenameoferrorfile
*/
TestHTML2XMLt=newTestHTML2XML(args,args,args);
t.convert();
}
}




再说说缺点:首先java功能强大的背后是其复杂性,就拿web来说,当今流行的框架有很多,什么struts,spring,jQuery等等,而这无疑增加了java的复杂性。

谁可相欹 发表于 2015-1-21 11:10:05

应用在电视机、电话、闹钟、烤面包机等家用电器的控制和通信。由于这些智能化家电的市场需求没有预期的高,Sun公司放弃了该项计划。随着1990年代互联网的发展

爱飞 发表于 2015-2-6 14:02:13

Sun公司看见Oak在互联网上应用的前景,于是改造了Oak,于1995年5月以Java的名称正式发布。Java伴随着互联网的迅猛发展而发展,逐渐成为重要的网络编程语言。

灵魂腐蚀 发表于 2015-2-16 10:08:55

其实说这种话的人就如当年小日本号称“三个月拿下中国”一样大言不惭。不是Tomjava泼你冷水,你现在只是学到了Java的骨架,却还没有学到Java的精髓。接下来你得研究设计模式了。

蒙在股里 发表于 2015-2-20 09:18:45

自从Sun推出Java以来,就力图使之无所不包,所以Java发展到现在,按应用来分主要分为三大块:J2SE,J2ME和J2EE,这也就是Sun ONE(Open Net Environment)体系。J2SE就是Java2的标准版,主要用于桌面应用软件的编程;J2ME主要应用于嵌入是系统开发,如手机和PDA的编程;J2EE是Java2的企业版,主要用于分布式的网络程序的开发,如电子商务网站和ERP系统。

精灵巫婆 发表于 2015-3-5 20:49:11

是一种使网页(Web Page)由静态(Static)转变为动态(Dynamic)的语言

海妖 发表于 2015-3-5 23:34:22

http://www.jdon.com/去下载,或到同济技术论坛的服务器ftp://nro.shtdu.edu.cn去下,安装上有什么问题,可以到论坛上去提问。

小女巫 发表于 2015-3-9 23:55:17

至于JDBC,就不用我多说了,你如果用java编过存取数据库的程序,就应该很熟悉。还有,如果你要用Java编发送电子邮件的程序,你就得看看Javamail 了。

第二个灵魂 发表于 2015-3-17 03:09:14

是一种使用者不需花费很多时间学习的语言

活着的死人 发表于 2015-3-23 16:55:52

让你能够真正掌握接口或抽象类的应用,从而在原来的Java语言基础上跃进一步,更重要的是,设计模式反复向你强调一个宗旨:要让你的程序尽可能的可重用。

小魔女 发表于 2015-4-1 01:08:31

关于设计模式的资料,还是向大家推荐banq的网站 http://www.jdon.com/,他把GOF的23种模式以通俗易懂的方式诠释出来,纯Java描述,真是经典中的经典。

只想知道 发表于 2015-4-1 07:08:35

一直感觉JAVA很大,很杂,找不到学习方向,前两天在网上找到了这篇文章,感觉不错,给没有方向的我指了一个方向,先不管对不对,做下来再说。

若天明 发表于 2015-4-1 22:11:06

科学超级计算机、移动电话和互联网,同时拥有全球最大的开发者专业社群。

再见西城 发表于 2015-4-10 18:08:25

Java语言支持Internet应用的开发,在基本的Java应用编程接口中有一个网络应用编程接口(java net),它提供了用于网络应用编程的类库,包括URL、URLConnection、Socket、ServerSocket等。Java的RMI(远程方法激活)机制也是开发分布式应用的重要手段。

金色的骷髅 发表于 2015-4-14 05:09:43

Sun公司看见Oak在互联网上应用的前景,于是改造了Oak,于1995年5月以Java的名称正式发布。Java伴随着互联网的迅猛发展而发展,逐渐成为重要的网络编程语言。

不帅 发表于 2015-6-10 01:01:04

《JAVA语言程序设计》或《JAVA从入门到精通》这两本书开始学,等你编程有感觉的时候也可以回看一下。《JAVA读书笔记》这本书,因为讲的代码很多,也很容易看懂,涉及到面也到位。是你学习技术巩固的好书,学完后就看看《JAVA编程思想》这本书,找找一个自己写的代码跟书上的代码有什么不一样。

冷月葬花魂 发表于 2015-6-22 22:28:54

应用在电视机、电话、闹钟、烤面包机等家用电器的控制和通信。由于这些智能化家电的市场需求没有预期的高,Sun公司放弃了该项计划。随着1990年代互联网的发展

仓酷云 发表于 2015-7-7 13:11:50

关于设计模式的资料,还是向大家推荐banq的网站 http://www.jdon.com/,他把GOF的23种模式以通俗易懂的方式诠释出来,纯Java描述,真是经典中的经典。

简单生活 发表于 2015-7-9 21:57:30

是一种为 Internet发展的计算机语言
页: [1]
查看完整版本: JAVA网页设计将 HTML 文件转换成 XML