PHP5.5 使用协同程序实现合作多任务

生成器

生成器最基本的思想也是一个函数,这个函数的返回值是依次输出,而不是只返回一个单独的值。或者,换句话说,生成器使你更方便的实现了迭代器接口。下面通过实现一个xrange函数来简单说明:

<?php

01 <?php
02  
03 function xrange($start, $end, $step = 1) {
04     for ($i = $start; $i <= $end; $i += $step) {
05         yield $i;
06     }
07 }
08  
09 foreach (xrange(1, 1000000) as $num) {
10     echo $num, "\n";
11 }

上面这个xrange()函数提供了和PHP的内建函数range()一样的功能。但是不同的是range()函数返回的是一个包含属组值从1到100万的数组(注:请查看手册)。而xrange()函数返回的是依次输出这些值的一个迭代器,而且并不会真正以数组形式计算。

这种方法的优点是显而易见的。它可以让你在处理大数据集合的时候不用一次性的加载到内存中。甚至你可以处理无限大的数据流。

当然,也可以不同通过生成器来实现这个功能,而是可以通过继承Iterator接口实现。通过使用生成器实现起来会更方便,而不用再去实现iterator接口中的5个方法了。

生成器为可中断的函数

要从生成器认识协同程序,理解它们内部是如何工作的非常重要:生成器是可中断的函数,在它里面,yield构成了中断点。

紧接着上面的例子,如果你调用xrange(1,1000000)的话,xrange()函数里代码没有真正地运行。相反,PHP只是返回了一个实现了迭代器接口的 生成器类实例:

1 <?php
2  
3 $range = xrange(1, 1000000);
4 var_dump($range); // object(Generator)#1
5 var_dump($range instanceof Iterator); // bool(true)

你对某个对象调用迭代器方法一次,其中的代码运行一次。例如,如果你调用$range->rewind(),那么xrange()里的代码运行到控制流 第一次出现yield的地方。在这种情况下,这就意味着当$i=$start时yield $i才运行。传递给yield语句的值是使用$range->current()获取的。   为了继续执行生成器中的代码,你必须调用$range->next()方法。这将再次启动生成器,直到yield语句出现。因此,连续调用next()和current()方法 你将能从生成器里获得所有的值,直到某个点没有再出现yield语句。对xrange()来说,这种情形出现在$i超过$end时。在这中情况下, 控制流将到达函数的终点,因此将不执行任何代码。一旦这种情况发生,vaild()方法将返回假,这时迭代结束。

协程

协程给上面功能添加的主要东西是回送数据给生成器的能力。这将把生成器到调用者的单向通信转变为两者之间的双向通信。

通过调用生成器的send()方法而不是其next()方法传递数据给协程。下面的logger()协程是这种通信如何运行的例子:

01 <?php
02  
03 function logger($fileName) {
04     $fileHandle = fopen($fileName, 'a');
05     while (true) {
06         fwrite($fileHandle, yield . "\n");
07     }
08 }
09  
10 $logger = logger(__DIR__ . '/log');
11 $logger->send('Foo');
12 $logger->send('Bar')

正如你能看到,这儿yield没有作为一个语句来使用,而是用作一个表达式。即它有一个返回值。yield的返回值是传递给send()方法的值。 在这个例子里,yield将首先返回"Foo",然后返回"Bar"。

上面的例子里yield仅作为接收者。混合两种用法是可能的,即既可接收也可发送。接收和发送通信如何进行的例子如下:

01 <?php
02  
03 function gen() {
04     $ret = (yield 'yield1');
05     var_dump($ret);
06     $ret = (yield 'yield2');
07     var_dump($ret);
08 }
09  
10 $gen = gen();
11 var_dump($gen->current());    // string(6) "yield1"
12 var_dump($gen->send('ret1')); // string(4) "ret1"   (the first var_dump in gen)
13                               // string(6) "yield2" (the var_dump of the ->send() return value)
14 var_dump($gen->send('ret2')); // string(4) "ret2"   (again from within gen)
15                               // NULL               (the return value of ->send())

马上理解输出的精确顺序有点困难,因此确定你知道为什按照这种方式输出。我愿意特别指出的有两点:第一点,yield表达式两边使用 圆括号不是偶然。由于技术原因(虽然我已经考虑为赋值增加一个异常,就像Python那样),圆括号是必须的。第二点,你可能已经注意到 调用current()之前没有调用rewind()。如果是这么做的,那么已经隐含地执行了rewind操作。转载请注明稳砜诚信在线http://www.wind-fixasia.com

posted on 2013-07-01 11:34  ergtbh  阅读(256)  评论(0)    收藏  举报

导航