CURL的学习和应用
curl安装:
xp下面的安装
:修改php.ini文件的设置,找到php_curl.dll
//取消下在的注释
extension=php_curl.dll
linux下面安装:
# wget http://curl.haxx.se/download/curl-7.17.1.tar.gz
# tar zxvf curl-7.17.1.tar.gz //解压
#cd curl-7.17.1
# ./configure --prefix=/usr/local/curl
# make
# make install
这是安装php之前安装的方法.
***************************phpinf查看是否加载成功!
使用curl的POST数据飞信接口
用curl 写了飞信接口吧,网上有很多,这里只是做个测试
01
$username =
13800138000;
02
$password =
123456;
03
$sendto =
13912345678;
04
$message = "测试一个试试看!";
05
06
$curlPost = 'username='.urlencode($username).'&password='.urlencode($password).'&sendto='.urlencode($sendto).'&message='.urlencode($message).'';
07
08
$ch =
curl_init();//初始化curl
09
curl_setopt($ch,CURLOPT_URL,'http://sms.api.bz/fetion.php');//抓取指定网页
10
curl_setopt($ch,
CURLOPT_HEADER, 0);//设置header
11
curl_setopt($ch,
CURLOPT_RETURNTRANSFER, 1);//要求结果为字符串且输出到屏幕上
12
curl_setopt($ch,
CURLOPT_POST, 1);//post提交方式
13
curl_setopt($ch,
CURLOPT_POSTFIELDS, $curlPost);
14
$data =
curl_exec($ch);//运行curl
15
curl_close($ch);
16
print_r($data);//输出结果
返回的结果是:短信已提交到发送队列!
飞信接口的地址是http://sms.api.bz/
飞信接口模式:
http://sms.api.bz/fetion.php?username=您的移动飞信登录手机号
&password=您的移动飞信登录密码
&sendto=接收短信的飞信好友手机号
&message=短信内容
格式:http://sms.api.bz/fetion.php?username=13800138000&password=123456&sendto=13912345678&message=短信内容
注意要保持utf-8格式的,这点我犯错了
总结一下使用curl方法:
-
初始化curl
-
使用curl_setopt设置目标url,和其他选项,这些选项方法详细参考:http://cn2.php.net/manual/zh/ref.curl.php
-
curl_exec,执行curl
-
执行后,关闭curl
-
最后一步就是输出
使用curl实现多线程
curl一般用来抓取网页,第二种就是get或者post数据,第三种应用就是实现PHP的多线程任务
下面来实现多线程的
01
<?php
02
/*
03
curl
多线程抓取
04
*/
05
06
/**
07
*
curl 多线程
08
*
09
*
@param array $array 并行网址
10
*
@param int $timeout 超时时间
11
*
@return array
12
*/
13
function Curl_http($array,$timeout){
14
$res = array();
15
$mh =
curl_multi_init();//创建多个curl语柄
16
$startime =
getmicrotime();
17
foreach($array as $k=>$url){
18
$conn[$k]=curl_init($url);
19
20
curl_setopt($conn[$k],
CURLOPT_TIMEOUT, $timeout);//设置超时时间
21
curl_setopt($conn[$k],
CURLOPT_USERAGENT, 'Mozilla/5.0
(compatible; MSIE 5.01; Windows NT 5.0)');
22
curl_setopt($conn[$k],
CURLOPT_MAXREDIRS, 7);//HTTp定向级别
23
curl_setopt($conn[$k],
CURLOPT_HEADER, 0);//这里不要header,加块效率
24
curl_setopt($conn[$k],
CURLOPT_FOLLOWLOCATION, 1); //
302 redirect
25
curl_setopt($conn[$k],CURLOPT_RETURNTRANSFER,1);
26
curl_multi_add_handle
($mh,$conn[$k]);
27
}
28
//防止死循环耗死cpu
这段是根据网上的写法
29
do {
30
$mrc =
curl_multi_exec($mh,$active);//当无数据,active=true
31
} while ($mrc ==
CURLM_CALL_MULTI_PERFORM);//当正在接受数据时
32
while ($active and $mrc ==
CURLM_OK) {//当无数据时或请求暂停时,active=true
33
if (curl_multi_select($mh)
!= -1) {
34
do {
35
$mrc =
curl_multi_exec($mh, $active);
36
} while ($mrc ==
CURLM_CALL_MULTI_PERFORM);
37
}
38
}
39
40
foreach ($array as $k => $url)
{
41
curl_error($conn[$k]);
42
$res[$k]=curl_multi_getcontent($conn[$k]);//获得返回信息
43
$header[$k]=curl_getinfo($conn[$k]);//返回头信息
44
curl_close($conn[$k]);//关闭语柄
45
curl_multi_remove_handle($mh , $conn[$k]); //释放资源
46
}
47
48
curl_multi_close($mh);
49
$endtime =
getmicrotime();
50
$diff_time = $endtime - $startime;
51
52
return array('diff_time'=>$diff_time,
53
'return'=>$res,
54
'header'=>$header
55
);
56
57
}
58
//计算当前时间
59
function getmicrotime()
{
60
list($usec, $sec)
= explode("
",microtime());
61
return ((float)$usec +
(float)$sec);
62
}
63
64
//测试一下,curl
三个网址
65
$array = array(
66
"http://www.weibo.com/",
67
"http://www.renren.com/",
68
"http://www.qq.com/"
69
);
70
71
$data =
Curl_http($array,'10');//调用
72
var_dump($data);//输出
73
74
?>
1
关于do while的那段解释:
1
因为$active要等全部url数据接受完毕才变成false,所以这里用到了curl_multi_exec的返回值判断是否还有数据,
1
当有数
据的时候就不停调用curl_multi_exec,暂时没有数据就进入select阶段,新数据一来就可以被唤醒继续执行。
1
这个多线程的写法步骤:
第一步:调用curl_multi_init
第二步:循环调用curl_multi_add_handle
这一步需要注意的是,curl_multi_add_handle的第二个参数是由curl_init而来的子handle。
第三步:持续调用curl_multi_exec
第四步:根据需要循环调用curl_multi_getcontent获取结果
第五步:调用curl_multi_remove_handle,并为每个字handle调用curl_close
第六步:调用curl_multi_close
多线程的测试效果图:
总结:36个http请求,从执行的是时间顺序上来看,三个网站的ip交叉,说明是同时并发的!
curl安装:
xp下面的安装
:修改php.ini文件的设置,找到php_curl.dll
//取消下在的注释 extension=php_curl.dll
linux下面安装:
# wget http://curl.haxx.se/download/curl-7.17.1.tar.gz
# tar zxvf curl-7.17.1.tar.gz //解压
#cd curl-7.17.1
# ./configure --prefix=/usr/local/curl
# make
# make install
这是安装php之前安装的方法.
***************************phpinf查看是否加载成功!
使用curl的POST数据飞信接口
用curl 写了飞信接口吧,网上有很多,这里只是做个测试
01 |
$username =
13800138000; |
02 |
$password =
123456; |
03 |
$sendto =
13912345678; |
04 |
$message = "测试一个试试看!"; |
05 |
06 |
$curlPost = 'username='.urlencode($username).'&password='.urlencode($password).'&sendto='.urlencode($sendto).'&message='.urlencode($message).''; |
07 |
08 |
$ch =
curl_init();//初始化curl |
09 |
curl_setopt($ch,CURLOPT_URL,'http://sms.api.bz/fetion.php');//抓取指定网页 |
10 |
curl_setopt($ch,
CURLOPT_HEADER, 0);//设置header |
11 |
curl_setopt($ch,
CURLOPT_RETURNTRANSFER, 1);//要求结果为字符串且输出到屏幕上 |
12 |
curl_setopt($ch,
CURLOPT_POST, 1);//post提交方式 |
13 |
curl_setopt($ch,
CURLOPT_POSTFIELDS, $curlPost); |
14 |
$data =
curl_exec($ch);//运行curl |
15 |
curl_close($ch); |
16 |
print_r($data);//输出结果 |
返回的结果是:短信已提交到发送队列!
飞信接口的地址是http://sms.api.bz/
飞信接口模式:
http://sms.api.bz/fetion.php?username=您的移动飞信登录手机号
&password=您的移动飞信登录密码
&sendto=接收短信的飞信好友手机号
&message=短信内容
格式:http://sms.api.bz/fetion.php?username=13800138000&password=123456&sendto=13912345678&message=短信内容
注意要保持utf-8格式的,这点我犯错了
总结一下使用curl方法:
- 初始化curl
- 使用curl_setopt设置目标url,和其他选项,这些选项方法详细参考:http://cn2.php.net/manual/zh/ref.curl.php
- curl_exec,执行curl
- 执行后,关闭curl
- 最后一步就是输出
使用curl实现多线程
curl一般用来抓取网页,第二种就是get或者post数据,第三种应用就是实现PHP的多线程任务
下面来实现多线程的
01 |
<?php |
02 |
/* |
03 |
curl
多线程抓取 |
04 |
*/ |
05 |
06 |
/** |
07 |
*
curl 多线程 |
08 |
* |
09 |
*
@param array $array 并行网址 |
10 |
*
@param int $timeout 超时时间 |
11 |
*
@return array |
12 |
*/ |
13 |
function Curl_http($array,$timeout){ |
14 |
$res = array(); |
15 |
$mh =
curl_multi_init();//创建多个curl语柄 |
16 |
$startime =
getmicrotime(); |
17 |
foreach($array as $k=>$url){ |
18 |
$conn[$k]=curl_init($url); |
19 |
|
20 |
curl_setopt($conn[$k],
CURLOPT_TIMEOUT, $timeout);//设置超时时间 |
21 |
curl_setopt($conn[$k],
CURLOPT_USERAGENT, 'Mozilla/5.0
(compatible; MSIE 5.01; Windows NT 5.0)'); |
22 |
curl_setopt($conn[$k],
CURLOPT_MAXREDIRS, 7);//HTTp定向级别 |
23 |
curl_setopt($conn[$k],
CURLOPT_HEADER, 0);//这里不要header,加块效率 |
24 |
curl_setopt($conn[$k],
CURLOPT_FOLLOWLOCATION, 1); //
302 redirect |
25 |
curl_setopt($conn[$k],CURLOPT_RETURNTRANSFER,1); |
26 |
curl_multi_add_handle
($mh,$conn[$k]); |
27 |
} |
28 |
//防止死循环耗死cpu
这段是根据网上的写法 |
29 |
do { |
30 |
$mrc =
curl_multi_exec($mh,$active);//当无数据,active=true |
31 |
} while ($mrc ==
CURLM_CALL_MULTI_PERFORM);//当正在接受数据时 |
32 |
while ($active and $mrc ==
CURLM_OK) {//当无数据时或请求暂停时,active=true |
33 |
if (curl_multi_select($mh)
!= -1) { |
34 |
do { |
35 |
$mrc =
curl_multi_exec($mh, $active); |
36 |
} while ($mrc ==
CURLM_CALL_MULTI_PERFORM); |
37 |
} |
38 |
} |
39 |
|
40 |
foreach ($array as $k => $url)
{ |
41 |
curl_error($conn[$k]); |
42 |
$res[$k]=curl_multi_getcontent($conn[$k]);//获得返回信息 |
43 |
$header[$k]=curl_getinfo($conn[$k]);//返回头信息 |
44 |
curl_close($conn[$k]);//关闭语柄 |
45 |
curl_multi_remove_handle($mh , $conn[$k]); //释放资源 |
46 |
} |
47 |
|
48 |
curl_multi_close($mh); |
49 |
$endtime =
getmicrotime(); |
50 |
$diff_time = $endtime - $startime; |
51 |
|
52 |
return array('diff_time'=>$diff_time, |
53 |
'return'=>$res, |
54 |
'header'=>$header |
55 |
); |
56 |
|
57 |
} |
58 |
//计算当前时间 |
59 |
function getmicrotime()
{ |
60 |
list($usec, $sec)
= explode("
",microtime()); |
61 |
return ((float)$usec +
(float)$sec); |
62 |
} |
63 |
|
64 |
//测试一下,curl
三个网址 |
65 |
$array = array( |
66 |
"http://www.weibo.com/", |
67 |
"http://www.renren.com/", |
68 |
"http://www.qq.com/" |
69 |
); |
70 |
71 |
$data =
Curl_http($array,'10');//调用 |
72 |
var_dump($data);//输出 |
73 |
|
74 |
?> |
1 |
|
关于do while的那段解释:
1 |
因为$active要等全部url数据接受完毕才变成false,所以这里用到了curl_multi_exec的返回值判断是否还有数据, |
1 |
当有数
据的时候就不停调用curl_multi_exec,暂时没有数据就进入select阶段,新数据一来就可以被唤醒继续执行。 |
1 |
|
这个多线程的写法步骤:
第一步:调用curl_multi_init
第二步:循环调用curl_multi_add_handle
这一步需要注意的是,curl_multi_add_handle的第二个参数是由curl_init而来的子handle。
第三步:持续调用curl_multi_exec
第四步:根据需要循环调用curl_multi_getcontent获取结果
第五步:调用curl_multi_remove_handle,并为每个字handle调用curl_close
第六步:调用curl_multi_close
多线程的测试效果图:
总结:36个http请求,从执行的是时间顺序上来看,三个网站的ip交叉,说明是同时并发的!


浙公网安备 33010602011771号