PHP网页编程之PHP 抓取和剖析
最近陆续的有人问我学习php的心得,现在整理为下面,希望可以对大家有些帮助。 抓取和剖析一个文件长短常复杂的事。这个教程将经由过程一个例子率领你一步一步地去完成它。让咱们入手下手吧!起首,我首必需决意咱们将抓取的URL地址。可以经由过程在剧本中设定或经由过程$QUERY_STRING传递。为了复杂起见,让咱们将变量直接设在剧本中。
<?
$url = 'http://www.php.net';
?>
第二步,咱们抓取指定文件,而且经由过程file()函数将它存在一个数组里。
<?
$url = 'http://www.php.net';
$lines_array = file($url);
?>
好了,如今在数组里已有了文件了。然而,咱们想剖析的文本能够不全在一行外面。为懂得决这个文件,咱们可以复杂地将数组$lines_array转化成一个字符串。咱们可使用implode(x,y)函数来完成它。如果在前面你想用explode(将字符串变量数组),将x设成"|"或"!"或其它相似的分隔符能够会更好。然而出于咱们的目标,最好将x设成空格。y是另外一个需要的参数,由于它是你想用implode()处置的数组。
<?
$url = 'http://www.php.net';
$lines_array = file($url);
$lines_string = implode('', $lines_array);
?>
如今,抓取任务就做完了,上面该停止剖析了。出于这个例子的目标,咱们想失掉在<head>到</head>之间的一切器材。为了剖析出字符串,咱们还需求叫做正轨表达式的器材。
<?
$url = 'http://www.php.net';
$lines_array = file($url);
$lines_string = implode('', $lines_array);
eregi("<head>(.*)</head>", $lines_string, $head);
?>
让咱们看一下代码。正如你所见,eregi()函数按上面的格局履行:
eregi("<head>(.*)</head>", $lines_string, $head);
"(.*)"暗示一切器材,可以注释为,"剖析在<head>和</head>间的所以器材"。$lines_string是咱们正在剖析的字符串,$head是剖析后的了局寄存的数组。
最初,咱们可以输数据。由于仅在<head>和</head>间存在一个实例,咱们可以平安的假定数组中仅存在着一个元素,并且就是咱们想要的。让咱们把它打印出来吧。
<?
$url = 'http://www.php.net';
$lines_array = file($url);
$lines_string = implode('', $lines_array);
eregi("<head>(.*)</head>", $lines_string, $head);
echo $head;
?>
这就是全体的代码了。
学习数据库了,MYSQL可算是PHP的黄金搭档了,不过,虽然话是这么说,你也可能恨不得把MYSQL给生吞活剥了,因为这一行一列的东东简直让自己头晕目眩。 作为一个合格的coder 编码的规范是必须,命名方面我推崇“驼峰法”,另外就是自己写的代码最好要带注释,不然时间长了,就算是自己的代码估计看起来都费事,更不用说别人拉。 其实没啥难的,多练习,练习写程序,真正的实践比看100遍都有用。不过要熟悉引擎 遇到出错的时候,我经常把错误信息直接复制到 google的搜索栏,一般情况都是能搜到结果的,不过有时候会搜出来一大片英文的出来,这时候就得过滤一下,吧中文的弄出来,挨着式方法。 对于懒惰的朋友,我推荐php的集成环境xampp或者是wamp。这两个软件安装方便,使用简单。但是我还是强烈建议自己动手搭建开发环境。 如果你可以写完像留言板这样的程序,那么你可以去一些别人的代码了, 爱上php,他也会爱上你。 我学习了一段时间后,我发现效果并不好(估计是我自身的问题)。因为一个人的精力总是有限的,同时学习这么多,会导致每个的学习时间都得不到保证。 首推的搜索引擎当然是Google大神,其次我比较喜欢 百度知道。不过搜出来的结果往往都是 大家copy来copy去的,运气的的概率很大。 遇到出错的时候,我经常把错误信息直接复制到 google的搜索栏,一般情况都是能搜到结果的,不过有时候会搜出来一大片英文的出来,这时候就得过滤一下,吧中文的弄出来,挨着式方法。 其实没啥难的,多练习,练习写程序,真正的实践比看100遍都有用。不过要熟悉引擎 曾经犯过一个很低级的错误,我在文件命名的时候用了一个横线\\\\\\\'-\\\\\\\' 号,结果找了好几个小时的错误,事实是命名的时候 是不能用横线 \\\\\\\'-\\\\\\\' 的,应该用的是下划线\\\\\\\'_\\\\\\\' ; 你很难利用原理去编写自己的代码。对于php来说,系统的学习我认为还是很重要的,当你有一定理解后,你可你针对某种效果研究,我想那时你不会只是复制代码的水平了。 写js我最烦的就是 ie 和 firefox下同样的代码 结果显示的结果千差万别,还是就是最好不要用遨游去调试,因为有时候遨游是禁用js的,有可能代码是争取结果被遨游折腾的认为是代码写错。 爱上php,他也会爱上你。 在我安装pear包的时候老是提示,缺少某某文件,才发现 那群extension 的排列是应该有一点的顺序,而我安装的版本的排序不是正常的排序。没办法我只好把那群冒号加了上去,只留下我需要使用的扩展。 基础有没有对学习php没有太大区别,关键是兴趣。 对于初学者来说不推荐去拿钱买的。当然如果一个网站你经常去用,而且里面的资料也比较有用,最好还是买个会员比较好,毕竟那些也是别人的工作成果。 写的比较杂,因为我也是个新手,不当至于大家多多指正。 小鸟是第一次发帖(我习惯潜水的(*^__^*) 嘻嘻……),有错误之处还请大家批评指正,另外,前些日子听人说有高手能用php写驱动程序,真是学无止境,人外有人,天外有天。
页:
[1]