仓酷云

标题: PHP网页编程之PHP 抓取和剖析 [打印本页]

作者: 兰色精灵    时间: 2015-2-4 00:13
标题: PHP网页编程之PHP 抓取和剖析
最近陆续的有人问我学习php的心得,现在整理为下面,希望可以对大家有些帮助。   抓取和剖析一个文件长短常复杂的事。这个教程将经由过程一个例子率领你一步一步地去完成它。让咱们入手下手吧!  
  起首,我首必需决意咱们将抓取的URL地址。可以经由过程在剧本中设定或经由过程$QUERY_STRING传递。为了复杂起见,让咱们将变量直接设在剧本中。  
<?  
$url = 'http://www.php.net';  
?>  

  第二步,咱们抓取指定文件,而且经由过程file()函数将它存在一个数组里。  
<?  
$url = 'http://www.php.net';  
$lines_array = file($url);  
?>  

  好了,如今在数组里已有了文件了。然而,咱们想剖析的文本能够不全在一行外面。为懂得决这个文件,咱们可以复杂地将数组$lines_array转化成一个字符串。咱们可使用implode(x,y)函数来完成它。如  果在前面你想用explode(将字符串变量数组),将x设成"|"或"!"或其它相似的分隔符能够会更好。然而出于咱们的目标,最好将x设成空格。y是另外一个需要的参数,由于它是你想用implode()处置的数组。  
<?  
$url = 'http://www.php.net';  
$lines_array = file($url);  
$lines_string = implode('', $lines_array);  
?>  

  如今,抓取任务就做完了,上面该停止剖析了。出于这个例子的目标,咱们想失掉在<head>到</head>之间的一切器材。为了剖析出字符串,咱们还需求叫做正轨表达式的器材。  
<?  
$url = 'http://www.php.net';  
$lines_array = file($url);  
$lines_string = implode('', $lines_array);  
eregi("<head>(.*)</head>", $lines_string, $head);  
?>  

  让咱们看一下代码。正如你所见,eregi()函数按上面的格局履行:  
eregi("<head>(.*)</head>", $lines_string, $head);  
  "(.*)"暗示一切器材,可以注释为,"剖析在<head>和</head>间的所以器材"。$lines_string是咱们正在剖析的字符串,$head是剖析后的了局寄存的数组。  
  最初,咱们可以输数据。由于仅在<head>和</head>间存在一个实例,咱们可以平安的假定数组中仅存在着一个元素,并且就是咱们想要的。让咱们把它打印出来吧。  
<?  
$url = 'http://www.php.net';  
$lines_array = file($url);  
$lines_string = implode('', $lines_array);  
eregi("<head>(.*)</head>", $lines_string, $head);  
echo $head[0];  
?>  

  这就是全体的代码了。
学习数据库了,MYSQL可算是PHP的黄金搭档了,不过,虽然话是这么说,你也可能恨不得把MYSQL给生吞活剥了,因为这一行一列的东东简直让自己头晕目眩。
作者: 飘飘悠悠    时间: 2015-2-4 10:03
作为一个合格的coder 编码的规范是必须,命名方面我推崇“驼峰法”,另外就是自己写的代码最好要带注释,不然时间长了,就算是自己的代码估计看起来都费事,更不用说别人拉。
作者: 深爱那片海    时间: 2015-2-9 22:03
其实没啥难的,多练习,练习写程序,真正的实践比看100遍都有用。不过要熟悉引擎
作者: 爱飞    时间: 2015-2-17 23:33
遇到出错的时候,我经常把错误信息直接复制到 google的搜索栏,一般情况都是能搜到结果的,不过有时候会搜出来一大片英文的出来,这时候就得过滤一下,吧中文的弄出来,挨着式方法。
作者: 简单生活    时间: 2015-2-18 03:44
对于懒惰的朋友,我推荐php的集成环境xampp或者是wamp。这两个软件安装方便,使用简单。但是我还是强烈建议自己动手搭建开发环境。
作者: 小魔女    时间: 2015-3-5 10:57
如果你可以写完像留言板这样的程序,那么你可以去一些别人的代码了,
作者: 海妖    时间: 2015-3-8 11:13
爱上php,他也会爱上你。
作者: 兰色精灵    时间: 2015-3-11 12:36
我学习了一段时间后,我发现效果并不好(估计是我自身的问题)。因为一个人的精力总是有限的,同时学习这么多,会导致每个的学习时间都得不到保证。
作者: 分手快乐    时间: 2015-3-11 17:11
首推的搜索引擎当然是Google大神,其次我比较喜欢 百度知道。不过搜出来的结果往往都是 大家copy来copy去的,运气的的概率很大。
作者: 柔情似水    时间: 2015-3-19 02:47
遇到出错的时候,我经常把错误信息直接复制到 google的搜索栏,一般情况都是能搜到结果的,不过有时候会搜出来一大片英文的出来,这时候就得过滤一下,吧中文的弄出来,挨着式方法。
作者: 冷月葬花魂    时间: 2015-3-22 04:03
其实没啥难的,多练习,练习写程序,真正的实践比看100遍都有用。不过要熟悉引擎
作者: 变相怪杰    时间: 2015-3-22 18:36
曾经犯过一个很低级的错误,我在文件命名的时候用了一个横线\\\\\\\'-\\\\\\\' 号,结果找了好几个小时的错误,事实是命名的时候 是不能用横线 \\\\\\\'-\\\\\\\' 的,应该用的是下划线  \\\\\\\'_\\\\\\\' ;
作者: 灵魂腐蚀    时间: 2015-3-31 08:09
你很难利用原理去编写自己的代码。对于php来说,系统的学习我认为还是很重要的,当你有一定理解后,你可你针对某种效果研究,我想那时你不会只是复制代码的水平了。
作者: 小女巫    时间: 2015-4-1 11:11
写js我最烦的就是 ie 和 firefox下同样的代码 结果显示的结果千差万别,还是就是最好不要用遨游去调试,因为有时候遨游是禁用js的,有可能代码是争取结果被遨游折腾的认为是代码写错。
作者: 仓酷云    时间: 2015-4-1 14:10
爱上php,他也会爱上你。
作者: 莫相离    时间: 2015-4-3 01:59
在我安装pear包的时候老是提示,缺少某某文件,才发现 那群extension 的排列是应该有一点的顺序,而我安装的版本的排序不是正常的排序。没办法我只好把那群冒号加了上去,只留下我需要使用的扩展。
作者: 只想知道    时间: 2015-4-17 02:16
基础有没有对学习php没有太大区别,关键是兴趣。
作者: 第二个灵魂    时间: 2015-4-17 07:36
对于初学者来说不推荐去拿钱买的。当然如果一个网站你经常去用,而且里面的资料也比较有用,最好还是买个会员比较好,毕竟那些也是别人的工作成果。
作者: 活着的死人    时间: 2015-5-1 05:10
写的比较杂,因为我也是个新手,不当至于大家多多指正。
作者: 若相依    时间: 2015-5-2 03:20
小鸟是第一次发帖(我习惯潜水的(*^__^*) 嘻嘻……),有错误之处还请大家批评指正,另外,前些日子听人说有高手能用php写驱动程序,真是学无止境,人外有人,天外有天。




欢迎光临 仓酷云 (http://ckuyun.com/) Powered by Discuz! X3.2