|
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
首先第一点:jsp,servlet,javabean这些最基本的,嘿嘿,就算你是高手的话,在大行的企业级应用的话还是需要框架的,一个好的框架确实能构解决许多问题。js|网页1、媒介
从一个网站上,看到一个“抓网页”的代码,以为有点意义,可是没有供应源代码,因而,本人想写一个,实在代码对照复杂的。
2、代码
<%@pagecontentType="text/html;charset=gb2312"%>
<%
StringsCurrentLine;
StringsTotalString;
sCurrentLine="";
sTotalString="";
java.io.InputStreaml_urlStream;
java.net.URLl_url=newjava.net.URL("http://www.163.net/");
java.net.HttpURLConnectionl_connection=(java.net.HttpURLConnection)l_url.openConnection();
l_connection.connect();
l_urlStream=l_connection.getInputStream();
java.io.BufferedReaderl_reader=newjava.io.BufferedReader(newjava.io.InputStreamReader(l_urlStream));
while((sCurrentLine=l_reader.readLine())!=null)
{
sTotalString+=sCurrentLine;
}
out.println(sTotalString);
%>
3、跋文
固然代码对照复杂,可是,我以为依据这个,能够完成“收集爬虫”的功效,好比从页面找href毗连,然后再失掉谁人毗连,然后再“抓”,一直止地(固然能够限制层数),如许,能够完成“网页搜刮”功效。
还是要自己一点一点写代码,然后编译,改错再编译好那。还有最重要的是.net的编译环境非常好,你甚是不需要了解太多工具,对于简单的系统,你可以之了解一些语法就哦了。 |
|