Perl在线教程(10——14 课)

第十课、常规表达式(2)

三常规表达式(Regular Expresion)相关的运算符及函数

　　在perl程序写作中常会用到=~和!~这两个运算符及s和t这二个函数来和常规表达式/pattern/搭配而成一个运算式,如果能够活用这些指令的话,就可以很。轻易地来处理一些字符串,当然在CGI程序设计中了就更能得心应手了。现在就让作者来介绍这些运算符及函数的用法:

--------------------------------------------------------------------------------

指令:/pattern/文字运算

说明: 如果在文字运算中没有使用=~或是!~运算符指定一个字符串来做运算的话,就会使用内定的输出变量$_来做/pattern/文字运算。

范例一:

$string="chmod711cgi";
$string=~/(\W)\s+(\d+)/;

　　第一个(\W+)是代表找寻数个字母,并将的找到的字符串指派给$1这个变量,而\s+代表找寻多个空白的字符串,最后(\d+)代表找寻个数值,并将所找到的字符串指派给$2这个变量。所以$1="chmod";$2=711;但是$string还是等于原来的字符串,没有改变。

范例二:

$_="chmod711cgi";
/(\W)\s+(\d+)/;

　　因为是把字符串指定给$_这个变量,所以可以不用=~这个运算符就会得到

$1="chmod";$2=711;而且$_还是等于原来的字符串,没有改变。

范例三:

$string="chmod711cgi";
@list=split(/s+/,$string);

以上一个或是多个空白字符来分割$string这个字符串,这是一个很常用的语法。此时@list=("chmod","711","cgi");

--------------------------------------------------------------------------------

指令: =~相配运算符

说明:这是Perl语言中特有的语法,通常会和文字处理来作运算。

范例:

print"请输入一个字符串!\n";
$string=<STDIN>; #<STIDN>代表标准输入,会让使用者输入一字符串
chop($string); #将$string最后一个换行的字符\n删除掉
if($string=~/cgi/){

print("输入的字符串中有cgi这个字符串!\n";

}

如果输入的字符串含有cgi这个字符串的话,就会显示出这个信息。

--------------------------------------------------------------------------------

指令:!~不相配运算符

说明:这也是Perl语言中特有的语法,通常会和常规表达式来运算。

范例:

print"请输入一个字符串!\n";
$string=<STDIN>; #<STIDN>代表标准输入,会让使用者输入一字符串
chop($string); #将$string最后一个换行的字符\n删除掉
if($string!~/cgi/)
{

print("输入的字符串中有cgi这个字符串!\n";

}

如果输入的字符串中没有cgi这个字符串的话,就会显示出这个信息。

--------------------------------------------------------------------------------

指令:tr转换函数

语法:tr/SEARCHLIST/REPLACELIST/

其中SEARCHLIST是要转换的字符;REPLACELIST是转换成何种字符。

说明:tr(translate)就是转换的意思,会把符合转换的字符转换成要转换的字符。

范例一:

$string="testing";
$string=~tr/et/ET/"; #此时$string="TEsTing";
$string=~tr/a-z/A-Z/; #此时$stirng="TESTING";

范例二:

$string="CGI+Perl";
$string=~tr/+//; #此时$string="CGI Perl";

在传送CGI数据的时候会先将数据编码,其中会将空白的字符转成+这个字符。

--------------------------------------------------------------------------------

指令:s 取代函数

语法:s/PATTERN/REPLACE/eg

其中

PATTERN是文字处理(Regular Expresion)的模式;
REPLACE是代表取代成何种文字模式。
而g是这个函数最常用的参数,代表要把所有符合文字模式的字符串全部取代,如果省略这个参数的话,则只取代一个符合文字模式的字符串中;
而加上e这个参数代表要将REPLACE的部分当成一个运算式,如果没有这个需要的话,就不用加上这个参数了。
说明:将符合常规表达式的字符串取成为要取代的字符串

范例一:

$string="i:love:perl";
$string=~s/:/*/; #此时$string="i*love:perl";
$string=~s/:/*/g; #此时$string="i*love*perl";
$string=~s/*/+/g; #此时$string="i+love+perl";
$string=~s/+//g; #此时$string="i love perl";

上一行也可写成 $string=~tr/+//;效果都会一样哦!

$string=~s/perl/cgi; #此时$string="i love cgi";

范例二:

$string=~s/(love)/<$1>/;

第一个()内所找到的字符串变成$1,在这个范例中,会把变量love这个字符串变成<love>,此时$string="i<love>perl";

$string="i love perl";
$string=~s(i)(perl)/<$1><$2>/;

在这个范例中,会把i变成<i>;perl变成<perl>，此时$string="<perl> love <i>";

$string="i love perl";
$string=~s(\W+)/<$1>/g;

　　(/w+)代表找寻符合一个或是多个英文字符或是数值的字符串,之后再将找到的字符串设成$1。因为加上g这个参数,所以会找到字符串的这三个英文单字,然后再把这三个单字分加上<>这个符号,此时$string="<perl><love><i>";

范例三:

$string="www22cgi44";
$string=~s/(\d+)/$1*2/e;

(/d+)代表要找寻$string中一个或是多个数值的字符串,再将找到的字符串设成$1。加上参数e是代表要把$1*2当作是一个运算式,所以$string="www22cgi44";

$string="www22cgi44";
$string=~s/(\d+)/$1*2/eg;

加上参数e,所以会把$1*2当作是一个运算符式来看;加上参数g就会把全部符合数值的字符串经过运算式运算之后再把它取代,所以$string="www44cgi88";

范例四:

假设原本的字符串是$value="三八!",经CGI数据编码之后,这个字符串就会变成

$value="%A4T%A4K%21"。以下是一个解码的示范程序:

$value="%A4T%A4K%21";
$vlaue=~s/%([a-fA-F0-9][a-fA-F0-9]/pack("c",hex($1))/eg;

　　在传送CGI数据的时候会把数据编码,其中会将特殊字符或是中文字符编码以%开头的连续的两个十六进制数的字符串,所以要用s这个函数来找寻这个以%开头的字符串。为了要把找到的字符串再做解码的处理,所以要在%这个符号之后加上()这个符号,表示会把找到的字符串记忆起来并指定给$1这个变量,而且要在()中加上代表是连续两个十六进制数值的常规表达式(Regular Expression),也就是[a-fA-F0-9][a-fA-F0-9]。再用hex这个函数($1是代表符合的字符串)把十六进制数值转成十进制的码,之后再用pack这个函数(以C为参数,是代表unsigned char value的意思)把这个十进制码还原成原来的字符串。最后就会把这个字符串解码成$value="三八!"。值得一提的是也可以把这个解码的程序写成:

$value=~s/%(..)/pack("C",hex($1))/eg;

　　在此提供给读者参考。

　
第十一课、函数(1)－－用户自定义函数（子程序）

用户函数
系统函数
　　函数可分为系统函数和用户函数。

用户函数

　　用户函数又称子程序(Subroutine)，在Perl中用下面的结构来定义用户函数：

　　　　sub 子程序名{

　　　　　　语句块;
　　　　}

　　这里的子程序名与变量的取名规则类似。

　　以显示欢迎词的程序为例：

　　　　sub say_hello{

　　　　　　print "你好，欢迎光临网上学园";
　　　　}

　　用户函数的定义可以位于程序的任何位置，比如说放在文件的未尾。如果两个子程序使用了相同的程序名，后面的子程序将覆盖前面子程序。

　　用户函数中的变量默认为全局变量，与其他程序共享。

　　用户函数的调用：通过在子程序前加“&”调用，可在任一表达式内调用。子程序中可以再调用另外的子程序。

　　调用用户函数产生的结果称为返回值(return value)。返回值是每次调用函数中最后一个表达式的计算值。以加法函数为例：

　　　　sub add_a_b{

　　　　　　$a+$b;
　　　　}

　　函数最后一条表达式为$a+$b，故返回值为$a+$b。以下是调用情况：

　　　　$a=5;
　　　　$b=6;
　　　　$c=&add_a_b; #$c的值为11
　　　　$d=5*&add_a_b; #$d的值为5*11即55

　　上述的函数功能与传统直接写在程序中没什么两样，如果加上参数传递就可以实现全新的功能了。在Perl中，如果函数调用后面跟着一个用括号括起来的列表，则在函数调用期间该列表将被自动分配给以@_命名的特殊变量。函数可以访问该变量，从而确定参数的个数及赋值。

　　仍以加法函数为例：

　　　　sub add_a_b{
　　　　　　$_[0]+$_[1];
　　　　}
　　　　$c=&add_a_b(5,6); #$c的值为11
　　　　$d=5*&add_a_b(2,3); #d的值为5*5即25

　　如何改变参数的个数呢？我们可以用循环的方式来实现：

　　　　sub add_all{
　　　　　　$sum=0; #将sum初始化
　　　　　　foreach $_(@_) { #遍历参数列表
　　　　　　　$sum+=$_; #累加每个元素
　　　　　　}
　　　　　　$sum; #返回sum即总和的值
　　　　}
　　　　$a=&add_all(3,4,5); #$a的值为3+4+5即12
　　　　$d=2*&add_all(1,2,3,4,5); #d的值为2*15即30

　　既然函数中的变量全为全程变量，那么上述程序中若调用程序中含有$sum变量时将替换，这不是我们所要的。那么如何解决这一问题呢？

　　答案就是：使用局部变量, 使用local()操作符就可实现此功能。在上面的程序中，只需在第一行$sum=0;前加入：

　　　　local($sum);

　　当函数执行时，$sum的全程变量的值被保留起来，同时建立一个局部变量$sum，退出函数add_all后将全程变量$sum的值恢复。如：

　　　　sub add_all{
　　　　　　local($sum); #将$sum定义为局部变量
　　　　　　$sum=0; #将sum初始化
　　　　　　foreach $_(@_) { #遍历参数列表
　　　　　　　$sum+=$_; #累加每个元素
　　　　　　}
　　　　　　$sum; #返回sum即总和的值
　　　　}
　　　　$sum=88; #$sum的原始值为88
　　　　print $sum; #显示$sum的值即88
　　　　$a=&add_all(3,4,5); #$a的值为3+4+5即12
　　　　print $sum; #显示$sum的值仍为88

　　比较：若未加入local($sum);行，最后一行的执行结果将为12。

　　下面再举一例：计算十以内的加法，并以中文形式输出。当超过十时输出阿拉伯数字。如：输入两个数字，显示“一加二等于三”。程序如下：

　　　　#/! /usr/bin/perl
　　　　sub cnumber{
　　　　　　@chinese=("0","一","二","三","四","五","六","七","八","九");
　　　　　　　　　　　　#将@chinese定义为数组
　　　　　　local($number); #将number定义为局部变量
　　　　　　$chinese($number)||number; #想想为什么？
　　　　}
　　　　#主程序
　　　　print "请输入一个数："
　　　　chop($num1= );
　　　　print "请再输入一个数："
　　　　chop($num2= );
　　　　$msg=&chinese($num1)."加".&chinese($num2)."等于".
　　　　　　　　&chinese($num1+num2)."。\n"
　　　　print $msg; #打印$msg的值

　　其中$chinese($number)||number; 行的初级写法为：

　　　　if ($chinese(number) {
　　　　　　&chinese($number); #返回中文
　　　　} else {
　　　　　　&number; #返回阿拉伯数字
　　　　}

　　看看执行结果：输入2,3，显示："二加三等于五。"；输入3,12，显示："三加12等于15。"

。
第十二课、函数(2)－－常用系统函数

常用系统函数列表
指令：print
语法：print Filehandle LIST
说明：这个Filehandle可以看作在I(INPUT)/O(OUTPUT)之间的一个桥梁,可以利用FILEHANDLE来做出数据读入写出的动作.STDIN是代表从哪连输入数据,例如从电脑的键盘输入;STDOUT是代表从哪连输出数据;例如从电脑的屏幕输出;STDERR是代表从哪连输出错误的数据,例如从电脑的屏幕输出.而在PERL语言中有三个标准FILEHANDLE： 1.STDIN(标准输入)：是代表STDIN的FILEHANDLE
2.STDOUT(标准输出)：是代表STDOUT的FILEHANDLE
3.STDERR(标准错误输出)：是代表STDERR的FILEHANDLE如果要使用其他FILEHANDLE的时候,就要用OPEN这个函数来打开一个FILEHANDLE,我们可以用PRINT这个函数LIST的数据输出给FILEHANDLE.
在为大家介绍PRINT这个函数之前,先让我们来看看PRINT函数中特殊打印字符：

指令：#
说明：注释符号Remark宣告
示例：#这是一个注释说明

--------------------------------------------------------------------------------

指令：print
语法：print Filehandle LIST
说明：这个Filehandle可以看作在I(INPUT)/O(OUTPUT)之间的一个桥梁,可以利用FILEHANDLE来做出数据读入写出的动作.STDIN是代表从哪连输入数据,例如从电脑的键盘输入;STDOUT是代表从哪连输出数据;例如从电脑的屏幕输出;STDERR是代表从哪连输出错误的数据,例如从电脑的屏幕输出.而在PERL语言中有三个标准FILEHANDLE： 1.STDIN(标准输入)：是代表STDIN的FILEHANDLE
2.STDOUT(标准输出)：是代表STDOUT的FILEHANDLE
3.STDERR(标准错误输出)：是代表STDERR的FILEHANDLE如果要使用其他FILEHANDLE的时候,就要用OPEN这个函数来打开一个FILEHANDLE,我们可以用PRINT这个函数LIST的数据输出给FILEHANDLE.
在为大家介绍PRINT这个函数之前,先让我们来看看PRINT函数中特殊打印字符：

符号其作用
\n 换行 new line
\r 光标换行 return
\t tab键
\f 换页 form feed
\b 退回一格
\v 垂直tab键
\a 响铃Bell
\e escape键
\007 十进制ASC II码
\xff 十六进制码
\c[ 控制字符
示例： print STDOUT "网上学园\n"; 将"网上学园"加上换行显示在屏幕上.

语法： print LIST
说明：如果省略Filehandle的话,就会把Filehandle内定为STDOUT.也就是会将LIST的数据内容显示在屏幕上.
示例： $url="www.netease.net/~zmd";
print "网上学园$url\n";
在屏幕上将会出现"网上学园www.netease.net/~zmd",如果想要让双引号内的变量失效,可以在变量的前面加上"\"符号.例如： print"网上学园\$url"; 这样它就显示："网上学园$url"

语法： print
说明：同省略Filehandle和LIST的话,就会以STDOUT为Filehandle,并会输出$_这个内定输出变量的数据内容. 如果$_变量是一个空字符串的话,就会显示出一个空字符串.
示例： $_="网上学园\n"; print; 就会将"网上学园"加上换行显示在屏幕上

--------------------------------------------------------------------------------

指令： printf
语法： printf Filehandle LIST
说明：在perl语言中也提代C语言中printf的语法,用法和C语言中的用法一模一样.如果把Filehandle省略的话 ,也一样会把STDOUT当成是内定的Filehandle.在为大家介绍printf函数之前,先让我们来看看printf函数中变换符号的字符.

符号其作用
%c 字符
%s 字符串
%d 整数
%f 浮整数
%h 十六进制码
%o 八进制码
示例：printf("chomod%d%s\n","711""cgi"); 会将chmod 711 cgi加上换行显示于屏幕上。

--------------------------------------------------------------------------------

指令：chop 语法：chop($url)
说明：把最后一个字符删除。
示例：$url="www.nease.net/~zmd/";
chop($url); 这时$url="www.nease.net/~zmd" 而这两行也可以写成chop($url="www.nease.net/~zmd/");

--------------------------------------------------------------------------------

指令：split
语法：split(/pattern/,$text,limit) 其中/pattern/是文字处理的模式，而limit是代表要分割的个数，一般可以省略。
说明：用一个指定的文字处理模式来分割$text字符串。
示例：
$text="Michael,Gevin,Mike"; @name=split(/,/,$text); #这时@name=("Michael","Gevin","Mike");
($a,$b,$c)=split(/,/,$text); #这时$a="Michael";$b="Gevin";$c="Mike";
@name=split(/,/,$string,2); #这时@name=("Michael","Gevin");
在传送CGI应用程序数据的时候会先将数据编码，其中会将FORM中第个数据字段的数据内容用&这个符号隔开，所以在解码的时候就要以&这个符号为分割的字符，将每个数据字段分割出。例如： $text="Mike=A&Michael=B";
@name=split(/&/,$text); #这时@name=("Mike=A","Michael=B"); 而数据字段的名称和这个数据字段的值是用=这个符号来隔开，如果想取得数据字段的名称和所对应的值的话，就用要=这个符号来分割数据字段，例如： $name=""Mike=Michael""；
($name1,$name2)=split(/=/,$list); #这时$name1="Mike";$name2="Michael";

--------------------------------------------------------------------------------

指令：keys
语法：keys(%array)
说明：取出关联数组%ARRAY中全部的key。
示例：%NAME=(1,"mike",2,"michael"); @readkey=keys(%NAMES); #这时@readkey=(1,2);

--------------------------------------------------------------------------------

指令：values
语法：values(%array)
说明：取出关联数组%ARRAY中全部的value。
示例：%NAMES=(1,"mike",2,"michael"); @readval=values(%NAMES); #这时@readval=("mike","michael");

--------------------------------------------------------------------------------

指令：reverse
语法：reverse(@array)
说明：将数组@array中的元素由后到前重新排列。
示例：@back=("A","B","C","D","E"); @back=reverse(@back); #这时@back=("E","D","C","B","A");

--------------------------------------------------------------------------------

指令：sort
语法：sort(@array)
说明：将数组中的元素由小到大排序，如果要由大到小排序的话，要加上reverse这个函数。
示例：
@abc=("d","b","c","a"); @abc=sort(@abc); #这时@abc=("a","b","c","d");
@abc=(reverse sort@abc); #这时@abc=("d","c","b","a"); 这个语法也可以写成@abc=(reverse sort(@abc));
@number=(5,2,10); @number=sort(@number); 上面示例用sort函数来排序数值的时，会出差错，因此要用下面到下面这一句。 @number=(sort{$a<=>$b}@number); #这时@number=(2,5,10);

--------------------------------------------------------------------------------

指令：length
语法：length($string)
说明：求出字符串$string的字节(bytes)值。
示例：$string="Perl5"; $size=length($string); #这时$size=5;

--------------------------------------------------------------------------------

指令：substr
语法：substr($string,offset,length) offset代表起始字符的位置,length代表引用的字符串长度，如果省略length则代表从起始值到字符串的最后一个字符长度。而offset如果是负值的话，就会从字符串右边开始指定字符。
示例：
$s=substr("perl5",2,2); #这时$s="rl";
$s=substr("perl5",2); #这时$s="rl5";
$s=substr("perl5",-2,2); #这时$s="er";

--------------------------------------------------------------------------------

指令：index
语法：index($string,$substring,position) $substring是要寻找的字符；position代表从哪一个位置开始寻找，假如省略position就从头开始找起。
说明：返回所要找寻的字符在一字符串$string中的位置，如果在字符串中找不到字符的话，则会返回-1这个值。
示例：
$s=index("perl5","p"); #这时$s=0
$s=index("perl5","l",2); #这时$s=3
$s=index("perl5","perl"); #这时$s=-1

--------------------------------------------------------------------------------

指令：push
语法：push(@array,$string)
说明：在数组@array的最后附加新的元素 ($string)到数组@array中。
示例：@array=("one","two"); push(@array,"three"); #这时$@array=("one","two","three")

--------------------------------------------------------------------------------

指令：pop
语法：pop(@array)
说明：将数组(@array)的最后一个元素删除，并将删除的元素返回。
示例：@array=("one","two"); $rm=pop(@array); #这时@array=("one");而$rm="two";

--------------------------------------------------------------------------------

指令：unshift
语法：unshift(@array,$string) 说明：在数组@array的第一个元素前附加新的元素$string到数组@array中。示例： @array=("one","two"); unshift(@array,"three"); #这时@array=("three","one","two")

--------------------------------------------------------------------------------

指令：shift
语法：shift(@array)
说明：将数组@array的第一个元素删除，并将删除的元素返回。
示例：@array=("one","two"); @rm=shift(@array); #这时@array=("two");而$rm="one";

--------------------------------------------------------------------------------

指令：join
语法：join($string,@array)
说明：在一数组@array的元素之间加上一指定的字符$string,并将结果返回。
示例：
@array=("one","two","three");
$total=join("：",@array); 这时$total="one：two：three";

--------------------------------------------------------------------------------

指令：grep
语法：grep(/pattern/,@array)
说明：将合文字处理模式(regular expression)的数组元素找出来。
示例：
@array=("one","on","in");
$count=grep(/on/,@array); #这时$count=2
@result=grep(/on/,@array);#这时@result=("one","on");

--------------------------------------------------------------------------------

指令：hex
语法：hex($string)
说明：将十六进制的数值转成十进制。
示例： $decimal=hex("ff"); 这时$decimal=255;

--------------------------------------------------------------------------------

指令：rand
语法：rand($interger)
说明：常和函数srand搭配来取得一随机数，如果没有先宣告stand函数的话，则取出的常数值是一个固定值。这个语法会返回一个介于0和$interger之间的数值，如果$interger省略的话，则会返回一个介于0和1 的数值。
示例：
srand; #要先宣告srand函数，才能产生随机数的效果
$int=rand(10); #$int的值会大于0而且小于10如果希望产生的乱数是整数的话，就要再加上int #这个函数
$int=int(rand(10)); #$int的值是一个整数，且值在0和9之间

--------------------------------------------------------------------------------

指令：localtime
语法：localtime(time)
说明：可返回九个有关时间的元素，在写CGI应用程序的时候常会用到系统的时间，所以在此会详细介绍这个函数的用法。
示例：
($sec,$min,$hour,$mday,$mon,$year,$wday,$yday,$isdst)=localtime(time);
其中： $sec代表秒数[0,59] $min代表分数[0,59] $hour代表小时数[0,23] $mday代表是在这个月的第几天[1,31] $mon代表月数[0,11],要将$mon加1之后，才能符合实际情况。$year从1990年算起的年数 $wday从星期六算起，代表是在这周中的第几天[0-6] $yday从一月一日算起，代表是在这年中的第几天[0,365] $isdst只是一个flag 知道这些变量之后，就可以在CGI应用程序中拿来应用了。此外，也可以用下面这一行指令在UNIX系统下取得系统的时间。为了避免错误发生，最好用绝对路径的方法来取得系统时间，如果绝对路径不清楚的话可以用"which data"这个指令来得知。最后要提字符的话，就不能正确执行系统的程序了。 $data='/usr/bin/data'; 而在perl5版本中，也可以用下面这一行指令来取得系统时间。 $data=localtime(time);

--------------------------------------------------------------------------------

指令：die
语法：die LIST
说明：会把LIST字符串显示出来，并退出程序。常常和$!这个代表错误信息变量一起使用。
示例：open(FILE,"$filename")||die "不能打开文件$!\n; 如果打开文件失败的话，就会显示出错误的信息，之后再退出程序。

--------------------------------------------------------------------------------

指令：open
语法1：open(filehandle,"$filename") 其中$filename是一个指定打开的文件名。
说明：这是一个很常用的函数，可用于文件的打开(read only)。在CGI程序设计中常常会打开一个文件来读取数据，所以笔者会详加说明这一个函数相关用法。这个filehandle可把它看作在I(INPUT)/O(OUTPUT)之间的一个桥梁，可以利用FILEHANDLE来作出数据读入写出的动作。开始可用OPEN这个函数来打开一个指定的文件，接下来可以用&ltfilehandle>来读取所打开文件的数据内容，最后一定要用close这个函数来关闭这个之前打开的filehandle。要注意的是在CGI程序定作中，当用OPEN这个函数来打开一个文件时，一定要在打开文件前加上文件所在的绝对路径名称。
示例：
$filename="usr/abc.txt";
open(FILE,"$filename")||die"不能打开文件$filename\n; #将&ltfile>数据指定给纯变量$line(一行一行地)
while($line=&ltfile>)
{
print"$line";
}
close(file); 就会把abc.txt这个文件的内容显示出来。

语法2：open(filehandle,"<$filename")
说明：这个语法也可以打开一个存在的文件(read only)。
示例：
$filesname="usr/abc.txt";
open(file,"<$filename")||die"不能打开文件$filename\n";
@array=&ltfile> #将&ltfile>全部的数据内容都指定给数组@array close(file);
print "@array"; 也会把abc.TXT这个文件的内容显示出来。

语法3：open(filehandle,">$filename")
说明：建立一个新的文件(write only),如果已经存在这个文件了，就会把旧文件名覆盖掉。并可用print filehandle的方式将数据到所打开的文件中。
示例：
$filename="/usr/abc.txt";
open(file,">$filename")||die"不能打开文件$filename\n;
print file "this is a new line1\n; #\n是换行字符
print file "this is a new line2\n;
close(file); 会打数据存在一个新文件中。

语法4：open(filehandle,">>$filename")
说明：数据用附加的方式定入一文件(write only)，如果指定的文件名不存在的话就会建立一个新的文件。
示例：
$filename="/path/abc.txt";
open(file,">>$filename")||die"不能打开文件$filename\n";
print file "this is a new line1\n";
print file "this is a new line2\n";
close(file);
会打数据附加(append)到一个文件(abc.txt)中。

语法5：open(filehandle,"|unix command")
说明：就会把在filehandle的数据输入给unix的指令来作处理。
示例：
$mailprog="/usr/ucb/mail"; #unix系统上的寄信程序(一定要加绝对路径)
$who="mqingyi@126.com";
$open(file,"|$mailprog$who")||die"打开失败\n";
print file "I love you!\n";
print file "I want to see you.\n";
close(file);
就会通过unix系统mail的程序，将FILE这个FILEHANDLE的数据内容寄给$who这个变量所指定的收信人。我们可以利用open这个函数来设计一个来信批评CGI应用程序，在本书中的下一章中会有详细的介绍。

--------------------------------------------------------------------------------

指令：close
用法：close(filehandle)
说明：用open这个函数来打开一个filehandle之后，一定要用close批这个函数把所打开的filehandle关闭。
示例：
open(filehandle,"$filename");
close(filehandle);

--------------------------------------------------------------------------------

指令：pack
语法：pack("指定的格式",list)
说明：pack这个函数会将一个list变成所指定的二进制数据格式。在CGI程序分割解码过程中，会用到pack这个函数,所以笔者在此简单介绍这个函数的用法。
示例：$string=pack("c",65); #这时$string="a";将65这个ascii码转换成一个unsigned字符，其中c就是指定要转换成unsigned字符的意思。

--------------------------------------------------------------------------------

指令：read
语法：read(filehandle,$string,length) 其中length是代表读入字符串的长度(bytes)。
说明：用read这个函数把filehandle中的数据依指定的字符串长度读入之后指派给$string这个变量。在cgi程序分割解码过程中，如果FORM的传送方式是设定为POST的话，就会将传送的数据设定为标准输入，所以会将数据内容指定给STDIN这个标准输入的filehandle，而CGI环境变量$env{'content_length'}就是代表使用者送出数据内容的长度，因此我们要用read这个函数来取得使用者送出的数据内容。
示例：read(stdin,$buffer,$env{'content_length'}); 就会将stdin这个标准输入filehandle中的数据依指定的字符串长度读入，再指派给$buffer这个变量。

--------------------------------------------------------------------------------

指令：exit
语法：exit
说明：退出执行的程序。
示例： print"i love cgi\n"; exit; 显示完"i love cgi"以后，将退出这个程序。

--------------------------------------------------------------------------------

第十三课、文件及目录操作

　　大多数程序都不是孤立的,它们与它们的环境相互作用。很多的程序也需要通过文件操作实现数据的存贮和交换。文件句柄(file handle)是Perl程序中为程序和外部世界提供I/O连接的名称。建议全部使用大写字母以示与变量等的区别。特别地，也可以将STDIN/STDOUT/STDERR也认为是Perl的文件句柄，分别代表标准输入/标准输出/标准错误输出。

打开及关闭文件

　　Perl的文件操作与C语言极为相似。如：

open(FILENAME,"abc.txt");

　　该调用为读文件打开，若为写文件而打开，需在文件名前加上大于号：

open(FILENAME,">abc.txt");

　　若要追加至文件尾，可在文件名前加上两个大于号：

open(FILENAME,">>abc.txt");

　　以上三种open()格式在成功时返回真，失败时返回假。但程序中通常没有提示，出错时往往会被人们忽略。通常当需要给出出错提示时，可加入die()函数。例：

open(OUTFILE,">/tmp/outfile")||
die "出错，不能建立/tmp/outfile\n";

　　当只有open失败时，才会执行die给出出错提示。

　　对文件句柄的操作完成后，可以用close操作符关闭文件。如：

close(OUTFILE);

-x 文件测试

　　Perl的文件操作也可以先测试文件是否存在，是否可读写等。如：

$x="abc.txt";
if(-e $x) { #abc.txt是否存在？
# 存在操作
} else {
printf "文件不存在。\n";
}

-e操作符测试文件或目录是否存在。

　　以下为文件测试清单：

文件测试测试操作符提供的信息
-r 文件或目录可读
-w 文件或目录可写
-x 文件或目录执行
-o 文件或目录归用户所有
-R 文件或目录对真正用户可读
-W 文件或目录对真正用户可写
-X 文件或目录对真正用户执行
-O 文件或目录归真正用户所有
-e 文件或目录存在
-z 文件存在且大小为0
-s 文件或目录存在且不为0(返回字节数)
-f 文件为普通文件
-d 文件为目录
-l 文件为符号链接
-p 文件为命名管道(FIFO)
-S 文件为一个套口(socket)
-b 文件为块特殊文件
-c 文件为字符特殊文件
-t 打开tty控制台的文件句柄
-u 文件或目录是设置用户ID号
-g 文件或目录是设置用户组ID号
-k 文件或目录的sticky位置位
-T 文件是文本文件
-B 文件是二进制文件
-M 以天为单位的存在时间
-A 以天为单位访问时间
-C 以天为单位同代码更改时间

删除文件

　　Perl的unlink()操作符可实现删除文件。如：

unlink("abc.txt"); #删除abc.txt

文件重命名

　　Perl的rename()操作符可实现文件重命名。如：

rename("abc","zmd")||die "出错,不能更名";

　　此时将abc更名为zmd，成功返回真，否则给出出错提示。

目录操作

　　Perl中处理目录非常类似于处理文件。

　　打开目录句柄：

opendir(ETC,"/etc")||die "出错,不能打开目录";

　　关闭目录句柄：

closedir(ETC);

　　创建目录：

mkdir("zmd",0777)||die "不能创建zmd目录";

　　0777为内部权限格式。

　　删除目录：

rmdir("zmd")||die "不能删除zmd目录"。
　

第十四课、进程管理

　　当你向系统shell发送一个命令行时，shell创建一个进程来执行这个命令。这个新进程成为shell的子进程，它的执行不依赖于shell但又与shell相互协调。

　　同样，Perl程序也能启动新进程。

使用system()和exec()

　　生成新进程的最简单的方法就是用system操作符。如：

system("date");

　　若要将输出送至now_day文件，则可以：

system("date>now_day") ||die "不能建立now_day文件";

使用单引号

　　产生进程的另一方法是将shell命令置于两个单引号之间。如：

$nowday="现在时间：".'date'

$nowday的值为“现在时间：”和date命令的结果的连接。即："现在时间：Fri Feb 18 23:49:23 PDT 1998"

综合范例

　　举一个综合例子，要求从date的输入中分析，周未时打印"周未了，别太辛苦"，否则打印"好好工作"。简洁的写法为：

if('date'=~/^S/){
printf "网上学园欢迎您，周未了，别太辛苦";
} else {
printf "好好工作\n"
}

　　date的输出格式第一个字节为星期，英语中恰好只有周未为"S"打头，因此使用了常规表达式判断第一个字符是否为S，即可达到要求。
附一、在自己的电脑上调试CGI程序

　　在自己的平台上调试Perl CGI程序，需要做以下准备工作:

安装设置Web服务器
安装Perl for Win32
设置TCP/IP协议

安装Web服务器
在“网上邻居”的“属性”对话框“配置”中单击“添加”按钮。
在弹出的"选择网络组件类型"对话框中，在“厂商”栏中选择"Microsoft"，在"网络服务"栏中选择 "Personal Web Server"，然后单击"确定"按钮。这时Windows 95将自动安装Personal Web Server。安装完成后，“控制面板”中会出现“个人Web服务器”图标，双击图标可以对自己的个人Web服务器做设置，然后设置CGI程序的运行目录。在“控制面板”中双击“个人Web服务器”图标，选择"Aaministration"，这时Personal Web Server会自动启动你的浏览器，显示Internet服务管理页面。选择"WWW Administr ation"，选择"Directory"，在按"ADD"，在WWW服务中加入你的CGI-BIN目录，然后，一定不要忘了，要把它设为可执行。同时，建议你把它虚拟为"cgi-bin"目录，这样在你的HTML里面你就可以用"/cgi-bin/????.cgi"来调用CGI程序。全部设置好之后，可以在浏览器中打"http://你的机器名称"或者"http://你的机器的IP"来检验一下你的设置。
安装Windows 98 PWS(个人 Web 服务器)

　　Windows 98中，提供了一套独立的Personal Web Server，在add-ons\pws\目录中，大约19M，按提示安装就可以了。

安装其它的个人服务器

　　想在本地（local）尤其是在Win95/98/NT环境下调试CGI程序，在这里还向各位强力推荐Sambar 4.1。这是一套可以在win95/98/NT环境下安装运行的多工Web Server 软件，只要设定好你的IP，安装好之后，立刻就可以在你自己的电脑上建立起一个Web Site了。

Sambar 4.1有如下特点：

内建网页搜索器。
内建FTP服务器。
内含Perl 5，当你安装好之后就有了Perl可用了，不需另外安装Perl for win32。
具有HTML方式操作的管理及设定环境。
支持HTTP，SMTP，POP3，IMAP4，NNTP，Bridge的Proxy设定。
内含系统报告及LOG分析功能。
支持CGI/1.1，WINCGI，ISAPI，Mappings。
从本地下载Sambar 4.1(2M)，功能超强，绝对免费。

安装方法：

设置IP地址。
方法同上。
将Sambar 4.1的压缩文件解压，运行setup程序，安装过程很简单。只要你以前安装过windows 95/98就不会有问题。
注：frontPage 98不支持Sambar，Sambar称多次去信Microsoft，没有任何回音。使用FrontPage 98的网友在使用Sambar时，一定不要把Sambar的缺损目录定为FrontPage 98的网站目录。Sambar仅作为在本地Win95/98/NT环境下调试CGI程序之用。

--------------------------------------------------------------------------------

安装Perl for Win32

　　要在视窗系统上使用Perl来执行CGI程序，还要再安装Perl for Win32 系统点这里Perl for win32下载了109-i86.zip并把它解压然后运行Perl目录下的install.bat。

　　系统会分别提问：

Do you wish to proceed?　 Y
Modify search path?　 Y
continue to install perlIS.dll? Y
please choose a file extension to associate with PerlIS.dll?
Extension: 按你的情况，键入CGI程序后缀“pl”(pl is the default)或“cgi”
　　这时，按我们的经验，应该是已经可以运行CGI程序的了，可以用记事本写一个简单的CGI脚本试一试。

　　用记事本新建一个文件，然后把下面的代码Copy进去，再将它保存为CGI-BIN目录 test.pl或test.cgi(视安装过程中你对第四个问题的回答而定)(请注意下面例子中,"#!/usr/bin/perl"对于本章并不须要，因为安装Perl for win32时系统已将Perl解释器加入关联，但有点要注意，如果此程序在UNIX主机上运行，"#!/usr/bin/perl"指定Perl解释器位置,必不可少。)

#!/usr/bin/perl
print "Content-type:text/html\n\n";
print "成功了！";

　　把这个文件放在你自己的CGI-BIN目录中。然后新建一个名称为test.htm的HTML文件，放在你的某一个WWW目录中。其内容如下：

<a href="http://你的机器名称/cgi-bin/test.cgi">测试 CGI</a>

　　完成后运行测试。打开浏览器，在地址栏中键入"http://你的Web服务器名/test.htm"，如果出现"成功了"就表示你已经成功。

Windows NT Server 4.0中的Web服务器功能通过NT自带的IIS（Internet Information Server）来完成。
Windows 98 光盘中专门带有类似IIS的Personal Web Server(PWS),。
在Windows 98 和 Windows NT Server 4.0 中Perl for win32的安装方法与Windows 95基本一样。

--------------------------------------------------------------------------------

为计算机设置TCP/IP协议

　　从开始菜单选[设置]→[控制面板]→[网络]→[配置TCP/IP]→[属性]
　　填入你的IP地址，子网掩码设为255.255.255.0
　　如果你没有网卡，不必设置，用127.0.0.1就可以连接上。如果不知道IP地址，可以在下面的区段里选一个。这些区段里的IP地址是网络界公认的测试区段，不会真的连出去的。
192.168.0.0－192.168.255.255
172.16.0.0－172.31.255.255
10.0.0.0－10.255.255.255
在“DNS配置”中选择“使DNS 无效”。

　　当然，也可以不指定IP地址，那么在以后就只能通过机器名称来识别web服务器了，机器名称可以在[控制面板]→[网络]→[标识]中找出。

　

附二、CGI的环境变量

环境变量意义
SERVER_NAME CGI脚本运行时的主机名和IP地址.
SERVER_SOFTWARE 你的服务器的类型如： CERN/3.0 或 NCSA/1.3.
GATEWAY_INTERFACE 运行的CGI版本. 对于UNIX服务器, 这是CGI/1.1.
SERVER_PROTOCOL 服务器运行的HTTP协议. 这里当是HTTP/1.0.
SERVER_PORT 服务器运行的TCP口，通常Web服务器是80.
REQUEST_METHOD POST 或 GET, 取决于你的表单是怎样递交的.
HTTP_ACCEPT 浏览器能直接接收的Content-types, 可以有HTTP Accept header定义.
HTTP_USER_AGENT 递交表单的浏览器的名称、版本和其他平台性的附加信息。
HTTP_REFERER 递交表单的文本的 URL，不是所有的浏览器都发出这个信息，不要依赖它
PATH_INFO 附加的路径信息, 由浏览器通过GET方法发出.
PATH_TRANSLATED 在PATH_INFO中系统规定的路径信息.
SCRIPT_NAME 指向这个CGI脚本的路径, 是在URL中显示的(如, /cgi-bin/thescript).
QUERY_STRING 脚本参数或者表单输入项(如果是用GET递交). QUERY_STRING 包含URL中问号后面的参数.
REMOTE_HOST 递交脚本的主机名，这个值不能被设置.
REMOTE_ADDR 递交脚本的主机IP地址.
REMOTE_USER 递交脚本的用户名. 如果服务器的authentication被激活，这个值可以设置。
REMOTE_IDENT 如果Web服务器是在ident (一种确认用户连接你的协议)运行, 递交表单的系统也在运行ident, 这个变量就含有ident返回值.
CONTENT_TYPE 如果表单是用POST递交, 这个值将是 application/x-www-form-urlencoded. 在上载文件的表单中, content-type 是个 multipart/form-data.
CONTENT_LENGTH 对于用POST递交的表单, 标准输入口的字节数.

posted @ 2006-11-18 16:26 bigwhiteshark(云飞扬) 阅读(1619) 评论(0) 收藏举报

刷新页面返回顶部

Perl在线教程(10——14 课)

公告