仓酷云

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 1421|回复: 19
打印 上一主题 下一主题

[学习教程] PHP网站制作之抓取和剖析

[复制链接]
再见西城 该用户已被删除
跳转到指定楼层
楼主
发表于 2015-2-4 00:15:26 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
不断巩固,摸透大部分PHP常用函数,并可理解OOP,MYSQL优化,以及模板   抓取和剖析一个文件长短常复杂的事。这个教程将经由过程一个例子率领你一步一步地去完成它。让咱们入手下手吧!

  起首,我首必需决意咱们将抓取的URL地址。可以经由过程在剧本中设定或经由过程$QUERY_STRING传递。为了复杂起见,让咱们将变量直接设在剧本中。

<?
$url = 'http://www.php.net';
?>

  第二步,咱们抓取指定文件,而且经由过程file()函数将它存在一个数组里。

<?
$url = 'http://www.php.net';
$lines_array = file($url);
?>

  好了,如今在数组里已有了文件了。然而,咱们想剖析的文本能够不全在一行外面。为懂得这个文件,咱们可以复杂地将数组$lines_array转化成一个字符串。咱们可使用implode(x,y)函数来完成它。假如在前面你想用explode(将字符串变量数组),将x设成"|"或"!"或其它相似的分隔符能够会更好。然而出于咱们的目标,最好将x设成空格。y是另外一个需要的参数,由于它是你想用implode()处置的数组。

<?
$url = 'http://www.php.net';
$lines_array = file($url);
$lines_string = implode('', $lines_array);
?>

  如今,抓取任务就做完了,上面该停止剖析了。出于这个例子的目标,咱们想失掉在<head>到</head> 之间的一切器材。为了剖析出字符串,咱们还需求叫做正轨表达式的器材。

<?
$url = 'http://www.php.net';
$lines_array = file($url);
$lines_string = implode('', $lines_array);
eregi("<head>(.*)</head>", $lines_string, $head);
?>

  让咱们看一下代码。正如你所见,eregi()函数按上面的格局履行:

eregi("<head>(.*)</head>", $lines_string, $head);

  "(.*)"暗示一切器材,可以注释为,"剖析在<head>和</head>间的所以器材"。$lines_string是咱们正在剖析的字符串,$head是剖析后的了局寄存的数组。

  最初,咱们可以输数据。由于仅在<head>和</head>间存在一个实例,咱们可以平安的假定数组中仅存在着一个元素,并且就是咱们想要的。让咱们把它打印出来吧。

<?
$url = 'http://www.php.net';
$lines_array = file($url);
$lines_string = implode('', $lines_array);
eregi("<head>(.*)</head>", $lines_string, $head);
echo $head[0];
?>

  这就是全体的代码了。


  也许您在学习PHP的时候只想尽快的开发一个网站,也就会想我做网站,干嘛要学什么网页这些小儿科?不难看出,眼高手低的新手不在少数,这种思想无疑于建造空中楼阁,你不建地基,何来的房顶呢?
小女巫 该用户已被删除
沙发
发表于 2015-2-4 10:15:35 | 只看该作者
本人接触php时间不长,算是phper中的小菜鸟一只吧。由于刚开始学的时候没有名师指,碰过不少疙瘩,呗很多小问题卡过很久,白白浪费不少宝贵的时间,在次分享一些子的学习的心得。
山那边是海 该用户已被删除
板凳
发表于 2015-2-5 08:54:19 | 只看该作者
这些都是最基本最常用功能,我们这些菜鸟在系统学习后,可以先对这些功能深入研究。
飘灵儿 该用户已被删除
地板
发表于 2015-2-11 08:17:39 | 只看该作者
学习php的目的往往是为了开发动态网站,phper就业的要求也涵盖了很多。我大致总结为:精通php和mysql
再见西城 该用户已被删除
5#
 楼主| 发表于 2015-3-2 01:14:24 | 只看该作者
写的比较杂,因为我也是个新手,不当至于大家多多指正。
精灵巫婆 该用户已被删除
6#
发表于 2015-3-10 08:11:34 | 只看该作者
本文当是我的笔记啦,遇到的问题随时填充
灵魂腐蚀 该用户已被删除
7#
发表于 2015-3-12 18:16:57 | 只看该作者
学好程序语言,多些才是王道,写两个小时代码的作用绝对超过看一天书,这个我是深有体会(顺便还能练打字速度)。
愤怒的大鸟 该用户已被删除
8#
发表于 2015-3-14 05:17:21 | 只看该作者
找到的的资料很多都是在论坛里的,需要注册,所以我一般没到一个论坛都注册一个id,所有的id都注册成一样的,这样下次再进来的时候就不用重复注册啦。当然有些论坛的某些资料是需要的付费的。
因胸联盟 该用户已被删除
9#
发表于 2015-3-14 09:07:25 | 只看该作者
对于初学者来说不推荐去拿钱买的。当然如果一个网站你经常去用,而且里面的资料也比较有用,最好还是买个会员比较好,毕竟那些也是别人的工作成果。
再现理想 该用户已被删除
10#
发表于 2015-3-21 01:12:25 | 只看该作者
不禁又想起那些说php是草根语言的人,为什么认得差距这么大呢。
老尸 该用户已被删除
11#
发表于 2015-4-6 03:08:30 | 只看该作者
环境搭建好,当你看见你的浏览器输出“it works\\\\\\\"时你一定是喜悦的。在你解决问题的时候,我强烈建议多读php手册。
小魔女 该用户已被删除
12#
发表于 2015-4-7 01:28:56 | 只看该作者
小鸟是第一次发帖(我习惯潜水的(*^__^*) 嘻嘻……),有错误之处还请大家批评指正,另外,前些日子听人说有高手能用php写驱动程序,真是学无止境,人外有人,天外有天。
金色的骷髅 该用户已被删除
13#
发表于 2015-4-12 13:44:55 | 只看该作者
要进行开发,搭建环境是首先需要做的事,windows下面我习惯把环境那个安装在C盘下面,因为我配的环境经常出现诡异事件,什么事都没做环境有的时候就不能用啦。
爱飞 该用户已被删除
14#
发表于 2015-4-14 11:56:37 | 只看该作者
实践是检验自己会不会的真理。
飘飘悠悠 该用户已被删除
15#
发表于 2015-4-21 17:03:39 | 只看该作者
在我安装pear包的时候老是提示,缺少某某文件,才发现 那群extension 的排列是应该有一点的顺序,而我安装的版本的排序不是正常的排序。没办法我只好把那群冒号加了上去,只留下我需要使用的扩展。
简单生活 该用户已被删除
16#
发表于 2015-4-26 23:09:05 | 只看该作者
再就是混迹于论坛啦,咱们的phpchina的论坛就很强大,提出的问题一般都是有达人去解答的,以前的帖子也要多看看也能学到不少前辈们的经验。别的不错的论坛例如php100,javaeye也是很不错的。
深爱那片海 该用户已被删除
17#
发表于 2015-5-11 10:55:26 | 只看该作者
当然这种网站的会员费就几十块钱。
若天明 该用户已被删除
18#
发表于 2015-6-13 06:19:18 | 只看该作者
对于懒惰的朋友,我推荐php的集成环境xampp或者是wamp。这两个软件安装方便,使用简单。但是我还是强烈建议自己动手搭建开发环境。
乐观 该用户已被删除
19#
发表于 2015-6-25 05:40:40 | 只看该作者
写的比较杂,因为我也是个新手,不当至于大家多多指正。
活着的死人 该用户已被删除
20#
发表于 2015-7-6 21:47:32 | 只看该作者
学习php的目的往往是为了开发动态网站,phper就业的要求也涵盖了很多。我大致总结为:精通php和mysql
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|仓酷云 鄂ICP备14007578号-2

GMT+8, 2024-12-23 03:57

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表