仓酷云

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 736|回复: 19
打印 上一主题 下一主题

[学习教程] PHP网页编程之PHP 抓取和剖析

[复制链接]
兰色精灵 该用户已被删除
跳转到指定楼层
#
发表于 2015-2-4 00:13:50 | 只看该作者 回帖奖励 |正序浏览 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
最近陆续的有人问我学习php的心得,现在整理为下面,希望可以对大家有些帮助。   抓取和剖析一个文件长短常复杂的事。这个教程将经由过程一个例子率领你一步一步地去完成它。让咱们入手下手吧!  
  起首,我首必需决意咱们将抓取的URL地址。可以经由过程在剧本中设定或经由过程$QUERY_STRING传递。为了复杂起见,让咱们将变量直接设在剧本中。  
<?  
$url = 'http://www.php.net';  
?>  

  第二步,咱们抓取指定文件,而且经由过程file()函数将它存在一个数组里。  
<?  
$url = 'http://www.php.net';  
$lines_array = file($url);  
?>  

  好了,如今在数组里已有了文件了。然而,咱们想剖析的文本能够不全在一行外面。为懂得决这个文件,咱们可以复杂地将数组$lines_array转化成一个字符串。咱们可使用implode(x,y)函数来完成它。如  果在前面你想用explode(将字符串变量数组),将x设成"|"或"!"或其它相似的分隔符能够会更好。然而出于咱们的目标,最好将x设成空格。y是另外一个需要的参数,由于它是你想用implode()处置的数组。  
<?  
$url = 'http://www.php.net';  
$lines_array = file($url);  
$lines_string = implode('', $lines_array);  
?>  

  如今,抓取任务就做完了,上面该停止剖析了。出于这个例子的目标,咱们想失掉在<head>到</head>之间的一切器材。为了剖析出字符串,咱们还需求叫做正轨表达式的器材。  
<?  
$url = 'http://www.php.net';  
$lines_array = file($url);  
$lines_string = implode('', $lines_array);  
eregi("<head>(.*)</head>", $lines_string, $head);  
?>  

  让咱们看一下代码。正如你所见,eregi()函数按上面的格局履行:  
eregi("<head>(.*)</head>", $lines_string, $head);  
  "(.*)"暗示一切器材,可以注释为,"剖析在<head>和</head>间的所以器材"。$lines_string是咱们正在剖析的字符串,$head是剖析后的了局寄存的数组。  
  最初,咱们可以输数据。由于仅在<head>和</head>间存在一个实例,咱们可以平安的假定数组中仅存在着一个元素,并且就是咱们想要的。让咱们把它打印出来吧。  
<?  
$url = 'http://www.php.net';  
$lines_array = file($url);  
$lines_string = implode('', $lines_array);  
eregi("<head>(.*)</head>", $lines_string, $head);  
echo $head[0];  
?>  

  这就是全体的代码了。
学习数据库了,MYSQL可算是PHP的黄金搭档了,不过,虽然话是这么说,你也可能恨不得把MYSQL给生吞活剥了,因为这一行一列的东东简直让自己头晕目眩。
若相依 该用户已被删除
19#
发表于 2015-5-2 03:20:21 | 只看该作者
小鸟是第一次发帖(我习惯潜水的(*^__^*) 嘻嘻……),有错误之处还请大家批评指正,另外,前些日子听人说有高手能用php写驱动程序,真是学无止境,人外有人,天外有天。
活着的死人 该用户已被删除
18#
发表于 2015-5-1 05:10:24 | 只看该作者
写的比较杂,因为我也是个新手,不当至于大家多多指正。
第二个灵魂 该用户已被删除
17#
发表于 2015-4-17 07:36:46 | 只看该作者
对于初学者来说不推荐去拿钱买的。当然如果一个网站你经常去用,而且里面的资料也比较有用,最好还是买个会员比较好,毕竟那些也是别人的工作成果。
只想知道 该用户已被删除
16#
发表于 2015-4-17 02:16:08 | 只看该作者
基础有没有对学习php没有太大区别,关键是兴趣。
莫相离 该用户已被删除
15#
发表于 2015-4-3 01:59:46 | 只看该作者
在我安装pear包的时候老是提示,缺少某某文件,才发现 那群extension 的排列是应该有一点的顺序,而我安装的版本的排序不是正常的排序。没办法我只好把那群冒号加了上去,只留下我需要使用的扩展。
14#
发表于 2015-4-1 14:10:20 | 只看该作者
爱上php,他也会爱上你。
小女巫 该用户已被删除
13#
发表于 2015-4-1 11:11:20 | 只看该作者
写js我最烦的就是 ie 和 firefox下同样的代码 结果显示的结果千差万别,还是就是最好不要用遨游去调试,因为有时候遨游是禁用js的,有可能代码是争取结果被遨游折腾的认为是代码写错。
灵魂腐蚀 该用户已被删除
12#
发表于 2015-3-31 08:09:56 | 只看该作者
你很难利用原理去编写自己的代码。对于php来说,系统的学习我认为还是很重要的,当你有一定理解后,你可你针对某种效果研究,我想那时你不会只是复制代码的水平了。
变相怪杰 该用户已被删除
11#
发表于 2015-3-22 18:36:29 | 只看该作者
曾经犯过一个很低级的错误,我在文件命名的时候用了一个横线\\\\\\\'-\\\\\\\' 号,结果找了好几个小时的错误,事实是命名的时候 是不能用横线 \\\\\\\'-\\\\\\\' 的,应该用的是下划线  \\\\\\\'_\\\\\\\' ;
冷月葬花魂 该用户已被删除
10#
发表于 2015-3-22 04:03:39 | 只看该作者
其实没啥难的,多练习,练习写程序,真正的实践比看100遍都有用。不过要熟悉引擎
柔情似水 该用户已被删除
9#
发表于 2015-3-19 02:47:52 | 只看该作者
遇到出错的时候,我经常把错误信息直接复制到 google的搜索栏,一般情况都是能搜到结果的,不过有时候会搜出来一大片英文的出来,这时候就得过滤一下,吧中文的弄出来,挨着式方法。
分手快乐 该用户已被删除
8#
发表于 2015-3-11 17:11:33 | 只看该作者
首推的搜索引擎当然是Google大神,其次我比较喜欢 百度知道。不过搜出来的结果往往都是 大家copy来copy去的,运气的的概率很大。
兰色精灵 该用户已被删除
7#
 楼主| 发表于 2015-3-11 12:36:16 | 只看该作者
我学习了一段时间后,我发现效果并不好(估计是我自身的问题)。因为一个人的精力总是有限的,同时学习这么多,会导致每个的学习时间都得不到保证。
海妖 该用户已被删除
6#
发表于 2015-3-8 11:13:35 | 只看该作者
爱上php,他也会爱上你。
小魔女 该用户已被删除
5#
发表于 2015-3-5 10:57:18 | 只看该作者
如果你可以写完像留言板这样的程序,那么你可以去一些别人的代码了,
简单生活 该用户已被删除
地板
发表于 2015-2-18 03:44:43 | 只看该作者
对于懒惰的朋友,我推荐php的集成环境xampp或者是wamp。这两个软件安装方便,使用简单。但是我还是强烈建议自己动手搭建开发环境。
爱飞 该用户已被删除
板凳
发表于 2015-2-17 23:33:46 | 只看该作者
遇到出错的时候,我经常把错误信息直接复制到 google的搜索栏,一般情况都是能搜到结果的,不过有时候会搜出来一大片英文的出来,这时候就得过滤一下,吧中文的弄出来,挨着式方法。
深爱那片海 该用户已被删除
沙发
发表于 2015-2-9 22:03:45 | 只看该作者
其实没啥难的,多练习,练习写程序,真正的实践比看100遍都有用。不过要熟悉引擎
飘飘悠悠 该用户已被删除
楼主
发表于 2015-2-4 10:03:34 | 只看该作者
作为一个合格的coder 编码的规范是必须,命名方面我推崇“驼峰法”,另外就是自己写的代码最好要带注释,不然时间长了,就算是自己的代码估计看起来都费事,更不用说别人拉。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|仓酷云 鄂ICP备14007578号-2

GMT+8, 2024-9-20 19:33

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表