|
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
也得学会了PHP。然后再学,见异思迁是最不可取的,狗熊掰玉米就是这个道理,如果经常中途放弃,只能是一无所获,还浪费了N多的时间和经历,得不偿失,最重要的是,你会被别人瞧不起。 本文为一个提取一批旧事网页中的文本的小法式,它可以将各篇旧事的内容存为以该旧事题目为文件名的文本文件。若有更好的处置办法,请和我接洽:
lwx3069@sina.com
这里以国民网中的“昔日要闻”下的旧事为例.
<?php
($url) ? "" : $url = "http://www.unn.com.cn/GB/channel2/3/11/index.html"; // 昔日要闻
if(isset($url)&&$url!="") {
$str = implode("",file($url));
$str_ary = explode("<ul>",$str);
$str_ary = explode("<li>",trim($str_ary[1]));
for ($i=0; $i<8; $i++) {
if (strlen(trim($str_ary[$i]))<3){
continue;
}
echo "旧事".$i.":".$str_ary[$i];
$str1=strstr("$str_ary[$i]",'<a href="/');
$str2=strstr("$str_ary[$i]",'" target');
$len1=strlen("$str1");
$len2=strlen("$str2");
$len=$len1-$len2;
$url=substr("$str1",10,$len-10);
if (strlen(trim($url))!=0) {
$url = "http://www.unn.com.cn/".$url;
define(CONTENTS_DIR,"./contents/");
if(isset($url)&&$url!="") {
$str = implode("",file($url));
$str1=explode('<div align="right">',$str); //去失落文件没用的上半局部
$str2 = explode('<h4 align="center"> </h4>',$str1[1]);
//掏出文件的下半局部,并去失落没用的下半局部,这时候失掉的都是有效的
$str3=explode('</font><font size="+2"><b><font size="3">',$str2[0]); //从全部有效局部掏出文件题目和注释
$str4=explode('</div>',$str2[0]); //掏出日期和工夫
$str5=explode('</font></b></font><font size="2">',$str3[1]); //从题目和注释局部掏出题目
$title=str_replace("<br>","",$str5[0]);
$str3=explode('<p><font size="2">',$str2[0]); //从全部有效局部掏出文件注释
$str3[1]=str_replace('<br><br> ',"\n"." ",$str3[1]);
$str3[1]=str_replace(' ',"",$str3[1]);
$str3=strip_tags($str3[1]);
$pf=trim($title).".txt";
$ppf=fopen(CONTENTS_DIR."$pf",'w');
fputs($ppf,$title);
fputs($ppf,"$str4[0]");
fputs($ppf,$str3);
}
}
}
}
?> 转自:静态网制造指南 www.knowsky.com对我一点用处没有啊,我知道该怎么学,但是我想如何才能更快的学,一周速成,啊不,24小时速成那种,皮皮你有没? |
|