仓酷云

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 1283|回复: 19
打印 上一主题 下一主题

[学习教程] PHP网页编程之php下经由过程curl抓取yahoo boss 搜刮了局...

[复制链接]
因胸联盟 该用户已被删除
跳转到指定楼层
楼主
发表于 2015-2-3 23:36:41 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
我的文章不会对您的学习起到实质性的作用,您能否成功,还得靠自己的,坚持,坚持,再坚持,就是步入成功的不二法门。   1.编写curl类,停止网页内容抓取
复制代码 代码以下:
class CurlUtil
{
private $curl;
private $timeout = 10;
/**
* 初始化curl对象
*/
public function __construct()
{
$this->curl = curl_init();
curl_setopt($this->curl, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($this->curl, CURLOPT_USERAGENT, "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1)");
curl_setopt($this->curl, CURLOPT_HEADER, false); //设定是不是显示头信息
curl_setopt($this->curl, CURLOPT_NOBODY, false); //设定是不是输入页面内容
curl_setopt($this->curl, CURLOPT_CONNECTTIMEOUT, $this->timeout);
curl_setopt($this->curl, CURLOPT_FOLLOWLOCATION, true);
curl_setopt($this->curl, CURLOPT_AUTOREFERER, true);
}
/**
* 刊出函数 封闭curl对象
*/
public function __destruct()
{
curl_close($this->curl);
}
/**
* 获得网页的内容
*/
public function getWebPageContent($url)
{
curl_setopt($this->curl, CURLOPT_URL, $url);
return curl_exec($this->curl);
}
}


2.创立curl对象
复制代码 代码以下:
$CurlUtil = new CurlUtil();

3.抓取yahoo搜刮了局
复制代码 代码以下:
function getYahooSearch(CurlUtil $curl, $key)
{
$key = urlencode($key);
$searchUrl = "http://boss.yahooapis.com/ysearch/web/v1/$key?appid=你的雅虎appid&lang=tzh&region=hk&abstract=long&count=20&format=json&start=0&count=10";
$josnStr = $curl->getWebPageContent($searchUrl);
$searchDataInfo = json_decode($josnStr, true);
$searchData = $searchDataInfo['ysearchresponse']['resultset_web'];
$returnArray = array();
if (!empty($searchData)) {
foreach ($searchData as $data) {
$returnArray[] = array("url" => $data['url'], "date" => $data['date'], 'title' => strip_tags($data['title']), 'description' => strip_tags($data['abstract']));
}
}
return $returnArray;
}

4.测试了局
var_dump(getYahooSearch($CurlUtil, "百度"));多个成员之间重复做相同的工作,很容易因为交流沟通的时候没有进行一致性的文档要求而出现不明错误,严重影响开发进度,导致在预定时间内无法完成该项目或者完成的项目跟原先计划所要实现的项目功能不符合。
兰色精灵 该用户已被删除
沙发
发表于 2015-2-9 14:21:12 | 只看该作者
使用zendstdio 写代码的的时候,把tab 的缩进设置成4个空格是很有必要的
只想知道 该用户已被删除
板凳
发表于 2015-2-27 05:39:02 | 只看该作者
当然这种网站的会员费就几十块钱。
第二个灵魂 该用户已被删除
地板
发表于 2015-3-8 22:36:02 | 只看该作者
在我安装pear包的时候老是提示,缺少某某文件,才发现 那群extension 的排列是应该有一点的顺序,而我安装的版本的排序不是正常的排序。没办法我只好把那群冒号加了上去,只留下我需要使用的扩展。
若天明 该用户已被删除
5#
发表于 2015-3-16 15:20:20 | 只看该作者
我学习了一段时间后,我发现效果并不好(估计是我自身的问题)。因为一个人的精力总是有限的,同时学习这么多,会导致每个的学习时间都得不到保证。
因胸联盟 该用户已被删除
6#
 楼主| 发表于 2015-3-17 06:40:10 | 只看该作者
本文当是我的笔记啦,遇到的问题随时填充
愤怒的大鸟 该用户已被删除
7#
发表于 2015-3-24 00:11:48 | 只看该作者
装在C盘下面可以利用windows的ghost功能可以还原回来(顺便当做是重转啦),当然啦我的编译目录要放在别的盘下,不然自己的劳动成果就悲剧啦。
精灵巫婆 该用户已被删除
8#
发表于 2015-3-30 14:18:41 | 只看该作者
首先我是坚决反对新手上来就用框架的,因为对底层的东西一点都不了解,造成知识上的真空,会对以后的发展不利。我的观点上手了解下框架就好,代码还是手写。当然啦如果是位别的编程语言的高手的话,这个就另当别论啦。
山那边是海 该用户已被删除
9#
发表于 2015-4-9 09:06:20 | 只看该作者
本文当是我的笔记啦,遇到的问题随时填充
10#
发表于 2015-4-12 22:23:32 | 只看该作者
本人接触php时间不长,算是phper中的小菜鸟一只吧。由于刚开始学的时候没有名师指,碰过不少疙瘩,呗很多小问题卡过很久,白白浪费不少宝贵的时间,在次分享一些子的学习的心得。
莫相离 该用户已被删除
11#
发表于 2015-4-13 03:57:04 | 只看该作者
Ps:以上纯属原创,如有雷同,纯属巧合
金色的骷髅 该用户已被删除
12#
发表于 2015-4-13 07:32:09 | 只看该作者
没接触过框架的人,也不用害怕,其实框架就是一种命名规范及插件,学会一个框架其余的框架都很好上手的。
谁可相欹 该用户已被删除
13#
发表于 2015-4-22 01:04:22 | 只看该作者
Ps:以上纯属原创,如有雷同,纯属巧合
若相依 该用户已被删除
14#
发表于 2015-5-8 10:52:31 | 只看该作者
当然这种网站的会员费就几十块钱。
乐观 该用户已被删除
15#
发表于 2015-6-13 07:40:58 | 只看该作者
Apache不是非得用80或者8080端口的,我刚开始安得时候就是80端口老占用,就用了个 81端口,结果照常,就是输localhost的时候,应该输入为 localhost:81
爱飞 该用户已被删除
16#
发表于 2015-6-24 07:25:39 | 只看该作者
基础有没有对学习php没有太大区别,关键是兴趣。
变相怪杰 该用户已被删除
17#
发表于 2015-6-29 22:13:56 | 只看该作者
遇到出错的时候,我经常把错误信息直接复制到 google的搜索栏,一般情况都是能搜到结果的,不过有时候会搜出来一大片英文的出来,这时候就得过滤一下,吧中文的弄出来,挨着式方法。
再见西城 该用户已被删除
18#
发表于 2015-7-11 05:32:58 | 只看该作者
最后祝愿,php会给你带来快乐的同时 你也会给他带来快乐。
透明 该用户已被删除
19#
发表于 2015-7-12 20:19:55 | 只看该作者
刚开始安装php的时候,我图了个省事,把php的扩展全都打开啦(就是把php.ini 那一片 extension 前面的冒号全去掉啦),这样自然有好处,以后不用再需要什么功能再来打开。
飘灵儿 该用户已被删除
20#
发表于 2015-7-13 10:26:54 | 只看该作者
首推的搜索引擎当然是Google大神,其次我比较喜欢 百度知道。不过搜出来的结果往往都是 大家copy来copy去的,运气的的概率很大。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|仓酷云 鄂ICP备14007578号-2

GMT+8, 2024-12-22 15:56

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表