|
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
我先解释一下我的学习思路。xml 若何对文档停止解析?
在完成一切的筹办任务后,如今剧本终究可以解析XML文档:
Xml_parse_from_file(),一个自界说的函数,翻开参数中指定的文件,并以4kb的巨细停止解析
xml_parse(),和xml_parse_from_file()一样,当产生毛病时,即XML文档的格局不完整时,将会前往false。
咱们可使用xml_get_error_code()函数来失掉最初一个毛病的数字代码。将此数字代码传递给xml_error_string()函数便可失掉毛病的文本信息。输入XML以后的行数,使得调试更轻易。
当解析文档时,关于Expat需求强调成绩的是:若何坚持文档布局的根基描写?
如前所述,基于事务的解析器自己其实不发生任何布局信息。不外标签(tag)布局是XML的主要特征。例如,元素序列<book><title>暗示的意思分歧于<figure><title>。书名和图名是没有关系的,固然它们都用到"title"这个术语。因而,为了更无效地利用基于事务的解析器处置XML,必需利用本人的栈(stacks)或列表(lists)来保护文档的布局信息。
为了发生文档布局的镜像,剧本最少需求晓得今朝元素的父元素。用Exapt的API是没法完成的,它只呈报今朝元素的事务,而没有任何前后关系的信息。因而,需求创立本人的栈布局。
剧本典范利用先辈后出(FILO)的栈布局。经由过程一个数组,栈将保留全体的入手下手元素。关于入手下手元素处置函数,今朝的元素将被array_push()函数推到栈的顶部。响应的,停止元素处置函数经由过程array_pop()将最顶的元素移走。
关于序列<book><title></title></book>,栈的填充以下:
入手下手元素book:将"book"赋给栈的第一个元素($stack[0])。
入手下手元素title:将"title"赋给栈的顶部($stack[1])。
停止元素title:从栈中将最顶部的元素移去($stack[1])。
停止元素title:从栈中将最顶部的元素移去($stack[0])。
PHP3.0经由过程一个$depth变量手动掌握元素的嵌套来完成典范,这就使剧本看起来对照庞杂。PHP4.0经由过程array_pop()和array_push()两个函数来使剧本看起来更简约。
若何搜集XML文档中的元素信息?
为了搜集每一个元素的信息,剧本需求记住每一个元素的事务。经由过程利用一个全局的数组变量$elements来保留文档中一切分歧的元素。数组的项目是元素类的实例,有4个属性(类的变量)
$count -该元素在文档中被发明的次数
$chars -元素中字符事务的字节数
$parents -父元素
$childs - 子元素
注重:PHP的一个特征是你可以经由过程while(list() = each())loop遍历全部类布局,好像你遍历全部响应的数组一样。一切的类变量(当你用PHP3.0时还无方法名)都以字符串的体例输入。
当发明一个元素时,咱们需求增添其响应的记数器来跟踪它在文档中呈现几何次。在响应的$elements项中的记数元素也要加一。
咱们一样要让父元素晓得今朝的元素是它的子元素。因而,今朝元素的称号将会到场到父元素的$childs数组的项目中。最初,今朝元素应当记住谁是它的父元素。所以,父元素被到场到今朝元素$parents数组的项目中。
显示统计信息
剩下的代码在$elements数组和其子数组中轮回显示其统计了局。这就是最复杂的嵌套轮回,虽然输入准确的了局,但代码既不简约又没有任何出格的技能,它仅仅是一个你能够天天用他来完成任务的轮回。
剧本典范被设计为经由过程PHP的CGI体例的号令行来挪用。因而,统计了局输入的格局为文本格局。假如你要将剧本应用到互联网上,那末你需求修正输入函数来发生HTML格局。
若何用PHP&XML编制一个迷你搜刮引擎实例?
让咱们起首来熟习一下咱们法式顶用到的谁人XML(保留为xyz.xml)。
<?xml version="1.0" encoding="gb2312" ?>
<links>采取PHP和XML手艺构建的搜刮引擎
<web memo="memo1" url="">name1</web>
<sub>电脑收集
<web memo="nemo2">name2</web>
<sub>法式设计
<web memo="memo3">name3</web>
<sub>PHP
<web url="http://www.phpbuilder.com/" memo="[英文]PHP开辟资本。">
www.phpbuilder.com</web>
<web url="http://www.fokus.gmd.de" memo="[英文]PHP开辟手册。 ">
PHP Manual</web>
</sub>
</sub>
</sub>
</links>
它的布局相当复杂,根元素就是links,sub代表着一个种别,web就是一个网站的信息,个中包括着属性,url代表网站的联接,memo为备注信息,<web>??</web> 、<sub>??</sub>中包括的为元素的数据在这里就是种别和网站的称号,这是合适下面的划定的。
如今咱们往返答下面提出的成绩:为何要用XML来编制搜刮引擎?
第一个缘由就是有时分因为各类缘由咱们能够不克不及用到数据库(MySQL或其他);
其次,关于小数据量的搜刮引擎来讲,它的数据量很小,假如用数据库来做,效力未必有多高;
最主要的一点是,这个搜刮引擎保护起来相当的复杂,而且不必编写繁琐的数据库的保护的法式。例如,咱们要添加一个种别或网页,只需编纂文本的文件,加上一福web>???</web>或是<sub>????</sub>就能够了,并且,假如想把一个种别挪动到另外一个中央的话,咱们只需将这一局部的sub复制曩昔就好了。
上面一个最复杂的用PHP显示XML的典范。
上面的法式是将解析XML并依照树形布局输入至阅读器,并显示每层的元素总数。
<?php
$file = "demo.xml";// XML文件
function xml_parse_from_file($parser, $file) {// 解析XML文件的函数 }
function start_element($parser, $name, $attrs) {//碰到了开元素标志如<a href="link">就履行这一段}
function stop_element($parser, $name) {//碰到了开元素标志如</body>就履行这一段}
function data($parser, $data) {……}
function showcount(){ //显示每层的元素总数}
global $level,$levelcount,$maxlevel;
$level = -1;
$parser = xml_parser_create();// 发生解析器的实例
xml_set_element_handler($parser, "start_element", "stop_element"); // 设置处置函数
xml_set_character_data_handler($parser, "data");
xml_parser_set_option($parser, XML_OPTION_CASE_FOLDING, 0);
$ret = xml_parse_from_file($parser, $file); // 解析文件
if(!$ret) {
die(sprintf("XML error: %s at line %d", xml_error_string(xml_get_error_code($parser)), xml_get_current_line_number($parser)));
}
xml_parser_free($parser); // 释放解析器
showcount();
?>
在下面的法式的基本上,可以显示一段子树,咱们按照元素的层数和他在该层的第几号来对他停止定位
例如:
links (0,1)
+----web (1,1)
+----sub (1,2)
| +----web (2,1)
| +----sub (2,2)
| | +----web (3,1)
| | +----sub (3,2)
:
:
:
上面的代码是咱们的搜刮引擎的基本。由于,要显示出一个子种别(如法式设计->PHP->)的信息就要用到他。
<?php
……
function start_element($parser, $name, $attrs) {
global $level,$levelcount,$maxlevel,$hide,$lev,$num,$PHP_SELF;
$level += 1;
if($level>$maxlevel)
$maxlevel=$level;
$levelcount[$level]+=1;
if($hide){ //判别是不是在子树的局限内,$hide==FALSE 为在
if($level==$lev&&$levelcount[$level]==$num)
$hide=FALSE;
}else{
if($level<=$lev)$hide=TRUE;
}
if(!$hide){
……//输入
}
}
function data($parser, $data) {
global $level,$hide;
if(!$hide){
if(trim($data)!=""){ echo trim($data); }
}
}
……
global $hide,$lev,$num,$PHP_SELF;
$level = -1;
$hide = TRUE;
echo "<p><a href=$PHP_SELF>Root</a></p>";
if($lev==""){
$lev=0;$num=1;
}
……
?>
mini的搜刮引擎究竟若何做呢?
作了若干的铺垫,上面咱们就来看一下咱们的搜刮引擎的次要文件。
第一段为仿sina,yahoo的依照种别查询
第二段为搜刮查询局部(把全部树遍历一遍)显示合适的内容。
xml3.php
关头字婚配采取eregi函数,咱们假定输出的文字都是不会招致毛病的。
<全文完>
一下弹出N多页面!很明显,你的留言本并没有做好安全防范,被人用JS代码小小的耍了一下,我很同情你这个时候的感受,但是没有别的办法了,继续努力吧! |
|