仓酷云

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 2576|回复: 20
打印 上一主题 下一主题

[学习教程] PHP教程之经由过程PHP法式统计蜘蛛是不是会见你的网站

[复制链接]
乐观 该用户已被删除
跳转到指定楼层
楼主
发表于 2015-2-3 23:56:36 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
熟悉了PHP和MYSQL开发的要领之后,再回头看你写的那个留言本,你也许会怀疑那真的是你写的吗?当然,如果屋里还有鬼的话,也许是它写的-_-法式|会见|统计|蜘蛛     搜刮引擎的蜘蛛会见网站是经由过程近程抓取页面来停止的,咱们不克不及利用JS代码来获得蜘蛛的Agent信息,然而咱们可以经由过程image标签,如许咱们就能够失掉蜘蛛的agent材料了,经由过程对agent材料的剖析,就能够肯定蜘蛛的品种、性别等要素,咱们在经由过程数据库或文原本纪录就能够停止统计了。
  数据库布局:
#
# 表的布局 `naps_stats_bot`
#

CREATE TABLE `naps_stats_bot` (
  `botid` int(10) unsigned NOT NULL auto_increment,
  `botname` varchar(100) NOT NULL default '',
  `botagent` varchar(200) NOT NULL default '',
  `bottag` varchar(100) NOT NULL default '',
  `botcount` int(11) NOT NULL default '0',
  `botlast` datetime NOT NULL default '0000-00-00 00:00:00',
  `botlasturl` varchar(250) NOT NULL default '',
  UNIQUE KEY `botid` (`botid`),
  KEY `botname` (`botname`)
) TYPE=MyISAM AUTO_INCREMENT=9 ;

#
# 导出表中的数据 `naps_stats_bot`
#

INSERT INTO `naps_stats_bot` VALUES (1, 'Googlebot', 'Googlebot/2.X (+http://www.谷歌bot.com/bot.html)', '谷歌bot', 0, '0000-00-00 00:00:00', '');
INSERT INTO `naps_stats_bot` VALUES (2, 'MSNbot', 'MSNBOT/0.1 (http://search.msn.com/msnbot.htm)', 'msnbot', 0, '0000-00-00 00:00:00', '');
INSERT INTO `naps_stats_bot` VALUES (3, 'Inktomi Slurp', 'Slurp/2.0', 'slurp', 0, '0000-00-00 00:00:00', '');
INSERT INTO `naps_stats_bot` VALUES (4, 'Baiduspider', 'Baiduspider+(+http://www.百度.com/search/spider.htm)', '百度spider', 0, '0000-00-00 00:00:00', '');
INSERT INTO `naps_stats_bot` VALUES (5, 'Yahoobot', 'Mozilla/5.0+(compatible;+Yahoo!+Slurp;+http://help.yahoo.com/help/us/ysearch/slurp)', 'slurp', 0, '0000-00-00 00:00:00', '');
INSERT INTO `naps_stats_bot` VALUES (6, 'Sohubot', 'sohu-search', 'sohu-search', 0, '0000-00-00 00:00:00', '');
INSERT INTO `naps_stats_bot` VALUES (7, 'Lycos', 'Lycos/x.x', 'lycos', 0, '0000-00-00 00:00:00', '');
INSERT INTO `naps_stats_bot` VALUES (8, 'Robozilla', 'Robozilla/1.0', 'robozilla', 0, '0000-00-00 00:00:00', '');
  PHP法式:
/***************************************************************************
* NAPS -- Network Article Publish System
* ----------------------------------------------
*                                 bot.php
*                            -------------------
*   begin                : 2004-08-15
*   copyright            : (C) 2004 week9
*   email                : wapshow@gmail.com
*   homepage             : http://www.week9.com
*                          http://www.wapshow.com
*
***************************************************************************/

/***************************************************************************
*
*   This program is free software; you can redistribute it and/or modify
*   it under the terms of the GNU General Public License as published by
*   the Free Software Foundation; either version 2 of the License.
*
***************************************************************************/

/***************************************************************************
*
*   NAPS产物是自在软件。你可以且必需依据《GNU GPL-GNU通用公共允许证》的相干划定
*   复制、修正及分发NAPS产物。任何故NAPS产物为基本的衍生刊行版未必需经由飘飘的受权。
*
***************************************************************************/

error_reporting(E_ALL & ~E_NOTICE);

function get_naps_bot()
{
        $useragent = strtolower($_SERVER['HTTP_USER_AGENT']);
                        
        if (strpos($useragent, '谷歌bot') !== false){
                return 'Googlebot';
        }
        
        if (strpos($useragent, 'msnbot') !== false){
                return 'MSNbot';
        }
        
        if (strpos($useragent, 'slurp') !== false){
                return 'Yahoobot';
        }
        
        if (strpos($useragent, '百度spider') !== false){
                return 'Baiduspider';
        }
        
        if (strpos($useragent, 'sohu-search') !== false){
                return 'Sohubot';
        }
        
        if (strpos($useragent, 'lycos') !== false){
                return 'Lycos';
        }
        
        if (strpos($useragent, 'robozilla') !== false){
                return 'Robozilla';
        }        
        return false;
}

$tlc_thispage = addslashes($_SERVER['HTTP_USER_AGENT']);
//添加蜘蛛的抓取纪录
$searchbot = get_naps_bot();
if ($searchbot) {
        $DB_naps->query("UPDATE naps_stats_bot SET botcount=botcount+1, botlast=NOW(), botlasturl='$tlc_thispage' WHERE botname='$searchbot'");
}

?>
熟悉了PHP和MYSQL开发的要领之后,再回头看你写的那个留言本,你也许会怀疑那真的是你写的吗?当然,如果屋里还有鬼的话,也许是它写的-_-
admin 该用户已被删除
沙发
发表于 2015-2-4 07:06:16 | 只看该作者
装在C盘下面可以利用windows的ghost功能可以还原回来(顺便当做是重转啦),当然啦我的编译目录要放在别的盘下,不然自己的劳动成果就悲剧啦。
分手快乐 该用户已被删除
板凳
发表于 2015-2-5 12:15:36 | 只看该作者
如果你已经到这种程度了,那么你已经可以做我的老师了。其实php也分很多的区域,
精灵巫婆 该用户已被删除
地板
发表于 2015-2-11 00:02:26 | 只看该作者
我还是推荐用firefox ,配上firebug 插件调试js能省下不受时间。谷歌的浏览器最好也不少用,因为谷歌的大侠们实在是太天才啦,把一些原来的js代码加了一些特效。
飘灵儿 该用户已被删除
5#
发表于 2015-3-1 18:13:49 | 只看该作者
有位前辈曾经跟我说过,phper 至少要掌握200个函数 编起程序来才能顺畅点,那些不熟悉的函数记不住也要一拿手册就能找到。所以建议新手们没事就看看php的手册(至少array函数和string函数是要记牢的)。
简单生活 该用户已被删除
6#
发表于 2015-3-10 21:41:38 | 只看该作者
说php的话,首先得提一下数组,开始的时候我是最烦数组的,总是被弄的晕头转向,不过后来呢,我觉得数组里php里最强大的存储方法,所以建议新手们要学好数组。
冷月葬花魂 该用户已被删除
7#
发表于 2015-3-16 07:35:50 | 只看该作者
当留言板完成的时候,下步可以把做1个单人的blog程序,做为目标,
若天明 该用户已被删除
8#
发表于 2015-3-17 02:09:24 | 只看该作者
如果你可以写完像留言板这样的程序,那么你可以去一些别人的代码了,
灵魂腐蚀 该用户已被删除
9#
发表于 2015-3-18 22:01:20 | 只看该作者
首推的搜索引擎当然是Google大神,其次我比较喜欢 百度知道。不过搜出来的结果往往都是 大家copy来copy去的,运气的的概率很大。
小女巫 该用户已被删除
10#
发表于 2015-3-24 19:54:04 | 只看该作者
对于懒惰的朋友,我推荐php的集成环境xampp或者是wamp。这两个软件安装方便,使用简单。但是我还是强烈建议自己动手搭建开发环境。
柔情似水 该用户已被删除
11#
发表于 2015-4-6 01:09:39 | 只看该作者
作为一个合格的coder 编码的规范是必须,命名方面我推崇“驼峰法”,另外就是自己写的代码最好要带注释,不然时间长了,就算是自己的代码估计看起来都费事,更不用说别人拉。
金色的骷髅 该用户已被删除
12#
发表于 2015-4-10 23:30:34 | 只看该作者
写js我最烦的就是 ie 和 firefox下同样的代码 结果显示的结果千差万别,还是就是最好不要用遨游去调试,因为有时候遨游是禁用js的,有可能代码是争取结果被遨游折腾的认为是代码写错。
爱飞 该用户已被删除
13#
发表于 2015-4-11 03:08:53 | 只看该作者
个人呢觉得,配wamp 最容易漏的一步就是忘了把$PHP$目录下的libmysql.dll拷贝到windows系统目录的system32目录下,还有重启apache。
深爱那片海 该用户已被删除
14#
发表于 2015-4-15 04:11:31 | 只看该作者
这些都是最基本最常用功能,我们这些菜鸟在系统学习后,可以先对这些功能深入研究。
蒙在股里 该用户已被删除
15#
发表于 2015-4-16 02:14:53 | 只看该作者
有位前辈曾经跟我说过,phper 至少要掌握200个函数 编起程序来才能顺畅点,那些不熟悉的函数记不住也要一拿手册就能找到。所以建议新手们没事就看看php的手册(至少array函数和string函数是要记牢的)。
只想知道 该用户已被删除
16#
发表于 2015-5-3 11:04:24 | 只看该作者
首先声明:我是一个菜鸟,是一个初学者。学习了一段php后总是感觉自己没有提高,无奈。经过反思我认为我学习过程中存在很多问题,我改变了学习方法后自我感觉有了明显的进步。
谁可相欹 该用户已被删除
17#
发表于 2015-6-16 20:31:22 | 只看该作者
学好程序语言,多些才是王道,写两个小时代码的作用绝对超过看一天书,这个我是深有体会(顺便还能练打字速度)。
莫相离 该用户已被删除
18#
发表于 2015-6-22 23:19:51 | 只看该作者
开发工具也会慢慢的更专业,每个公司的可能不一样,但是zend studio是个大伙都会用的。
变相怪杰 该用户已被删除
19#
发表于 2015-7-4 02:21:40 | 只看该作者
做为1门年轻的语言,php一直很努力。
兰色精灵 该用户已被删除
20#
发表于 2015-7-14 22:28:15 | 只看该作者
多看优秀程序员编写的代码,仔细理解他们解决问题的方法,对自身有很大的帮助。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|仓酷云 鄂ICP备14007578号-2

GMT+8, 2024-11-15 03:16

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表