仓酷云

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 1532|回复: 19
打印 上一主题 下一主题

[学习教程] PHP网页编程之复杂站内HTML文件搜刮法式

[复制链接]
透明 该用户已被删除
跳转到指定楼层
楼主
发表于 2015-2-4 00:30:49 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
最近陆续的有人问我学习php的心得,现在整理为下面,希望可以对大家有些帮助。法式       本人写来复杂的搜刮本人电脑上的手艺材料的. 也许的思绪就是寻觅指定目次下的文本, 然后假如有与关头字相婚配的数据就把文件名前往, 最初把一切搜刮了局显示出来. 显示了局相似于百度/谷歌, 呵呵, 这个是地道为了好玩.  法式代码:
<?php
/**
* 文件: search.php
* 功效: 搜刮指定目次下的HTML文件
* 创立: 2005-9-23
* 作者: heiyeluren <heiyeluren AT gmail.com>
*/

/* 根基函数 */
//获得目次下文件函数
function getFile($dir)
{
$dp = opendir($dir);
$fileArr = array();
while (!false == $curFile = readdir($dp)) {
  if ($curFile!="." && $curFile!=".." && $curFile!="") {
   if (is_dir($curFile)) {
    $fileArr = getFile($dir."/".$curFile);
   } else {
    $fileArr[] = $dir."/".$curFile;
   }
  }
}
return $fileArr;
}
//获得文件内容
function getFileContent($file)
{
if (!$fp = fopen($file, "r")) {
  die("Cannot open file $file");
}
while ($text = fread($fp, 4096)) {
  $fileContent .= $text;
}
return $fileContent;
}
//搜刮指定文件
function searchText($file, $keyword)
{
$text = getFileContent($file);
if (preg_match("/$keyword/i", $text)) {
  return true;
}
return false;
}
//搜刮出文章的题目
function getFileTitle($file, $default="None subject")
{
$fileContent = getFileContent($file);
$sResult = preg_match("/<title>.*<\/title>/i", $fileContent, $matchResult);
$title = preg_replace(array("/(<title>)/i","/(<\/title>)/i"), "", $matchResult[0]);
if (empty($title)) {
  return $default;
} else {
  return $title;
}
}
//获得文件描写信息
function getFileDescribe($file,$length=200, $default="None describe")
{
$metas = get_meta_tags($file);
if ($meta['description'] != "") {
  return $metas['description'];
}
$fileContent = getFileContent($file);
preg_match("/(<body.*<\/body>)/is", $fileContent, $matchResult);
$pattern = array("/(<[^\x80-\xff]+>)/i","/(<input.*>)+/i", "/(<a.*>)+/i", "/(<img.*>)+/i", "/([<script.*>])+.*([<\/script>])+/i","/&/i","/"/i","/'/i", "/\s/");
$description = preg_replace($pattern, "", $matchResult[0]);
$description = mb_substr($description, 0, $length)." ...";
return $description;
}
//加亮搜刮了局中的关头字
function highLightKeyword($text, $keyword, $color="#C60A00")
{
$newword = "<font color=$color>$keyword</font>";
$text = str_replace($keyword, $newword, $text);
return $text;
}
//获得文件巨细(KB)
function getFileSize($file)
{
$filesize = intval(filesize($file)/1024)."K";
return $filesize;
}
//获得文件最初修正的工夫
function getFileTime($file)
{
$filetime = date("Y-m-d", filemtime($file));
return $filetime;
}
//搜刮目次下一切文件
function searchFile($dir, $keyword)
{
$sFile = getFile($dir);
if (count($sFile) <= 0) {
  return false;
}
$sResult = array();
foreach ($sFile as $file) {
  if (searchText($file, $keyword)) {
   $sResult[] = $file;
  }
}
if (count($sResult) <= 0) {
  return false;
} else {
  return $sResult;
}
}

/* 测试代码 */
//指定要搜刮的目次
$dir = "./php_Linux";
//要搜刮的关头字
$keyword = "sendmail";
$fileArr = searchFile($dir, $keyword);
$searchSum = count($fileArr);
echo "搜刮关头字: <b>$keyword</b>   搜刮目次: <b>$dir</b>   搜刮了局: <b>$searchSum</b><br><hr size=1><br>";
if ($searchSum <= 0) {
echo "没有搜刮就任何了局";
} else {
foreach ($fileArr as $file) {
  echo "<a href='$file' target='_blank'>". highLightKeyword(getFileTitle($file), $keyword) .
    "</a> - ".getFileSize($file)." ". getFileTime($file) .
    "<br>\n<font size=2>".highLightKeyword(getFileDescribe($file), $keyword) .
    "</font><br><br>";
}
}
?>
 完整可以用在本人已生成静态内容的的搜刮, 然而法式效力不高. 假如可以恰当的加上 索引/缓存 等机制的话, 我想法式会风趣良多.
  不过还好,PHP语言给出的语法错误很详细,只要稍微熟悉一点之后,看错误提示就能很容易找出错误所在的。PHP还有一个特别好用的调试功能,在PHP语句中,你可以随时用echo来输出结果。
小魔女 该用户已被删除
沙发
发表于 2015-2-4 13:16:07 | 只看该作者
小鸟是第一次发帖(我习惯潜水的(*^__^*) 嘻嘻……),有错误之处还请大家批评指正,另外,前些日子听人说有高手能用php写驱动程序,真是学无止境,人外有人,天外有天。
透明 该用户已被删除
板凳
 楼主| 发表于 2015-2-9 23:23:52 | 只看该作者
这些中手常用的知识,当你把我说的这些关键字都可以熟练运用的时候,你可以选择自己
愤怒的大鸟 该用户已被删除
地板
发表于 2015-2-16 09:51:38 | 只看该作者
环境搭建好,当你看见你的浏览器输出“it works\\\\\\\"时你一定是喜悦的。在你解决问题的时候,我强烈建议多读php手册。
谁可相欹 该用户已被删除
5#
发表于 2015-3-5 03:32:53 | 只看该作者
建数据库表的时候,int型要输入长度的,其实是个摆设的输入几位都没影响的,只要大于4就行,囧。
第二个灵魂 该用户已被删除
6#
发表于 2015-3-9 16:32:24 | 只看该作者
实践是检验自己会不会的真理。
admin 该用户已被删除
7#
发表于 2015-3-19 06:25:26 | 只看该作者
做为1门年轻的语言,php一直很努力。
山那边是海 该用户已被删除
8#
发表于 2015-3-26 09:43:18 | 只看该作者
本人接触php时间不长,算是phper中的小菜鸟一只吧。由于刚开始学的时候没有名师指,碰过不少疙瘩,呗很多小问题卡过很久,白白浪费不少宝贵的时间,在次分享一些子的学习的心得。
乐观 该用户已被删除
9#
发表于 2015-4-1 07:11:02 | 只看该作者
对于懒惰的朋友,我推荐php的集成环境xampp或者是wamp。这两个软件安装方便,使用简单。但是我还是强烈建议自己动手搭建开发环境。
海妖 该用户已被删除
10#
发表于 2015-4-1 22:11:16 | 只看该作者
这些中手常用的知识,当你把我说的这些关键字都可以熟练运用的时候,你可以选择自己
兰色精灵 该用户已被删除
11#
发表于 2015-4-2 22:50:29 | 只看该作者
爱上php,他也会爱上你。
再见西城 该用户已被删除
12#
发表于 2015-4-8 03:05:49 | 只看该作者
至于模板嘛,各位高人一直以来就是争论不休,我一只小菜鸟就不加入战团啦,咱们新手还是多学点东西的好。
莫相离 该用户已被删除
13#
发表于 2015-4-13 17:43:00 | 只看该作者
我还是推荐用firefox ,配上firebug 插件调试js能省下不受时间。谷歌的浏览器最好也不少用,因为谷歌的大侠们实在是太天才啦,把一些原来的js代码加了一些特效。
再现理想 该用户已被删除
14#
发表于 2015-5-8 02:18:24 | 只看该作者
这些中手常用的知识,当你把我说的这些关键字都可以熟练运用的时候,你可以选择自己
分手快乐 该用户已被删除
15#
发表于 2015-5-8 09:54:18 | 只看该作者
说点我烦的低级错误吧,曾经有次插入mysql的时间 弄了300年结果老报错,其实mysql的时间是有限制的,大概是到203X年  具体的记不清啦,囧。
冷月葬花魂 该用户已被删除
16#
发表于 2015-6-4 19:22:20 | 只看该作者
在学习的过程中不能怕麻烦,不能有懒惰的思想。学习php首先应该搭建一个lamp环境或者是wamp环境。这是学习php开发的根本。虽然网络上有很多集成的环境,安装很方便,使用起来也很稳定、
因胸联盟 该用户已被删除
17#
发表于 2015-6-8 09:42:10 | 只看该作者
装在C盘下面可以利用windows的ghost功能可以还原回来(顺便当做是重转啦),当然啦我的编译目录要放在别的盘下,不然自己的劳动成果就悲剧啦。
飘飘悠悠 该用户已被删除
18#
发表于 2015-6-18 09:31:43 | 只看该作者
最后祝愿,php会给你带来快乐的同时 你也会给他带来快乐。
不帅 该用户已被删除
19#
发表于 2015-6-20 06:22:54 | 只看该作者
爱上php,他也会爱上你。
若相依 该用户已被删除
20#
发表于 2015-6-25 13:57:18 | 只看该作者
首先我是坚决反对新手上来就用框架的,因为对底层的东西一点都不了解,造成知识上的真空,会对以后的发展不利。我的观点上手了解下框架就好,代码还是手写。当然啦如果是位别的编程语言的高手的话,这个就另当别论啦。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|仓酷云 鄂ICP备14007578号-2

GMT+8, 2024-11-14 13:43

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表