|
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
轮性能微软曾做过一个例子,就是同一个项目用java和.net网页编程来作,结果开发周期,.net网页编程是java的一半,性能java是.net网页编程的十分之一,代码量java是.net网页编程的三倍。呵呵,这说明了什么,.net网页编程的全方位比java好。但是有的人说.net网页编程不能跨平台,这个问题我和我同学曾讨论过,都认为微软的.net网页编程很可能早都可以跨平台了,但是微软为了保护他们的操作系统,所以才没有推出跨平台的.net网页编程,只是推出了跨语言的.net网页编程,
原始成绩以下:
http://topic.csdn.net/u/20080902/02/a6445aa1-2e6b-45c6-a47c-79009718c0fa.html
html网页的内容大抵以下:
<!DOCTYPEhtmlPUBLIC"-//W3C//DTDXHTML1.0Transitional//EN""http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html>
<head>
<metahttp-equiv="Content-Type;charset=gb2312"/>
<title>CSDN首页</title>
...
</head>
<body>
.....
</html>
我利用以下语句抓取相似下面的网页:
URLurl=newURL("http://www.csdn.net");
HttpURLConnectionconnection=(HttpURLConnection)url.openConnection();
//创建毗连后,利用上面两句获得网页的编码格局
StringcontentType=connection.getHeaderField("Content-Type");
contentType=connection.getContentType();
不管是哪一句,失掉的contentType的值都是text/html,而不包括前面的charset=gb2312,这是为何?
我注重到一个成绩,content="text/html;charset=gb2312"这里,在;和charset之间有一个空格,是不是由于这个空格的原因,而不克不及失掉content-type的正确值
另有没有其他的举措能够失掉页面的编码字符集?
回覆:
connection.getContentType();
这个必要服务器设置了ContentType才能够,这个数据在文件头内里,而不是在文件的主体(也就是你看到的html)内里。
以是检测页面范例必要分3步,假如这一步不可,则用下一个
1看header内里的ContentType,也就是你用的谁人办法
2看html内里的ContentType,也就是剖析html页面
3对html数据举行主动评价,相似于it内里的主动检测编码范例。
一段典范的前往信息的Header数据
HTTP/1.1200OK
Date:Mon,01Sep200823:13:31GMT
Server:Apache/2.2.4(Win32)mod_jk/1.2.26
Vary:Host,Accept-Encoding
Set-Cookie:JAVA2000_STYLE_ID=1;Domain=www.java2000.net;Expires=Thu,03-Nov-201109:00:10GMT;Path=/
Content-Encoding:gzip
Transfer-Encoding:chunked
Content-Type:text/html;charset=UTF-8
<html>
。。。。从这里入手下手是数据的本体
此文保藏于:http://www.java2000.net/p9226
用java开发web只要两本书:一本是关于java基础的,一本是关于jsp、servlet的就可以了。开发周期长,我就来讲句题外话,现在有很多思想都是通过java来展现。 |
|