Perl在线教程(10——14 课)

第十课、常规表达式(2)

三 常规表达式(Regular Expresion)相关的运算符及函数

  在perl程序写作中常会用到=~和!~这两个运算符及s和t这二个函数来和常规表达式/pattern/搭配而成一个运算式,如果能够活用这些指令的话,就可以很。轻易地来处理一些字符串,当然在CGI程序设计中了就更能得心应手了。现在就让作者来介绍这些运算符及函数的用法:


--------------------------------------------------------------------------------

指令:/pattern/文字运算

说明: 如果在文字运算中没有使用=~或是!~运算符指定一个字符串来做运算的话,就会使用内定的输出变量$_来做/pattern/文字运算。

范例一:

$string="chmod711cgi";
$string=~/(\W)\s+(\d+)/;

  第一个(\W+)是代表找寻数个字母,并将的找到的字符串指派给$1这个变量,而\s+代表找寻多个空白的字符串,最后(\d+)代表找寻个数值,并将所找到的字符串指派给$2这个变量。所以$1="chmod";$2=711;但是$string还是等于原来的字符串,没有改变。

范例二:

$_="chmod711cgi";
/(\W)\s+(\d+)/;

  因为是把字符串指定给$_这个变量,所以可以不用=~这个运算符就会得到

$1="chmod";$2=711;而且$_还是等于原来的字符串,没有改变。

范例三:

$string="chmod711cgi";
@list=split(/s+/,$string);

以上一个或是多个空白字符来分割$string这个字符串,这是一个很常用的语法。此时@list=("chmod","711","cgi");


--------------------------------------------------------------------------------

指令: =~相配运算符

说明:这是Perl语言中特有的语法,通常会和文字处理来作运算。

范例:

print"请输入一个字符串!\n";
$string=<STDIN>; #<STIDN>代表标准输入,会让使用者输入一字符串
chop($string); #将$string最后一个换行的字符\n删除掉
if($string=~/cgi/){

print("输入的字符串中有cgi这个字符串!\n";

}

如果输入的字符串含有cgi这个字符串的话,就会显示出这个信息。


--------------------------------------------------------------------------------

指令:!~不相配运算符

说明:这也是Perl语言中特有的语法,通常会和常规表达式来运算。

范例:

print"请输入一个字符串!\n";
$string=<STDIN>; #<STIDN>代表标准输入,会让使用者输入一字符串
chop($string); #将$string最后一个换行的字符\n删除掉
if($string!~/cgi/)
{

print("输入的字符串中有cgi这个字符串!\n";

}

如果输入的字符串中没有cgi这个字符串的话,就会显示出这个信息。


--------------------------------------------------------------------------------

指令:tr转换函数

语法:tr/SEARCHLIST/REPLACELIST/

其中SEARCHLIST是要转换的字符;REPLACELIST是转换成何种字符。

说明:tr(translate)就是转换的意思,会把符合转换的字符转换成要转换的字符。

范例一:

$string="testing";
$string=~tr/et/ET/"; #此时$string="TEsTing";
$string=~tr/a-z/A-Z/; #此时$stirng="TESTING";

范例二:

$string="CGI+Perl";
$string=~tr/+//; #此时$string="CGI Perl";

在传送CGI数据的时候会先将数据编码,其中会将空白的字符转成+这个字符。


--------------------------------------------------------------------------------

指令:s 取代函数

语法:s/PATTERN/REPLACE/eg

其中

PATTERN是文字处理(Regular Expresion)的模式;
REPLACE是代表取代成何种文字模式。
而g是这个函数最常用的参数,代表要把所有符合文字模式的字符串全部取代,如果省略这个参数的话,则只取代一个符合文字模式的字符串中;
而加上e这个参数代表要将REPLACE的部分当成一个运算式,如果没有这个需要的话,就不用加上这个参数了。
说明:将符合常规表达式的字符串取成为要取代的字符串

范例一:

$string="i:love:perl";
$string=~s/:/*/; #此时$string="i*love:perl";
$string=~s/:/*/g; #此时$string="i*love*perl";
$string=~s/*/+/g; #此时$string="i+love+perl";
$string=~s/+//g; #此时$string="i love perl";

上一行也可写成 $string=~tr/+//;效果都会一样哦!

$string=~s/perl/cgi; #此时$string="i love cgi";

范例二:

$string=~s/(love)/<$1>/;

第一个()内所找到的字符串变成$1,在这个范例中,会把变量love这个字符串变成<love>,此时$string="i<love>perl";

$string="i love perl";
$string=~s(i)(perl)/<$1><$2>/;

在这个范例中,会把i变成<i>;perl变成<perl>,此时$string="<perl> love <i>";

$string="i love perl";
$string=~s(\W+)/<$1>/g;

  (/w+)代表找寻符合一个或是多个英文字符或是数值的字符串,之后再将找到的字符串设成$1。因为加上g这个参数,所以会找到字符串的这三个英文单字,然后再把这三个单字分加上<>这个符号,此时$string="<perl><love><i>";

范例三:

$string="www22cgi44";
$string=~s/(\d+)/$1*2/e;

(/d+)代表要找寻$string中一个或是多个数值的字符串,再将找到的字符串设成$1。加上参数e是代表要把$1*2当作是一个运算式,所以$string="www22cgi44";

$string="www22cgi44";
$string=~s/(\d+)/$1*2/eg;

加上参数e,所以会把$1*2当作是一个运算符式来看;加上参数g就会把全部符合数值的字符串经过运算式运算之后再把它取代,所以$string="www44cgi88";

范例四:

假设原本的字符串是$value="三八!",经CGI数据编码之后,这个字符串就会变成

$value="%A4T%A4K%21"。以下是一个解码的示范程序:

$value="%A4T%A4K%21";
$vlaue=~s/%([a-fA-F0-9][a-fA-F0-9]/pack("c",hex($1))/eg;

  在传送CGI数据的时候会把数据编码,其中会将特殊字符或是中文字符编码以%开头的连续的两个十六进制数的字符串,所以要用s这个函数来找寻这个以%开头的字符串。为了要把找到的字符串再做解码的处理,所以要在%这个符号之后加上()这个符号,表示会把找到的字符串记忆起来并指定给$1这个变量,而且要在()中加上代表是连续两个十六进制数值的常规表达式(Regular Expression),也就是[a-fA-F0-9][a-fA-F0-9]。再用hex这个函数($1是代表符合的字符串)把十六进制数值转成十进制的码,之后再用pack这个函数(以C为参数,是代表unsigned char value的意思)把这个十进制码还原成原来的字符串。最后就会把这个字符串解码成$value="三八!"。值得一提的是也可以把这个解码的程序写成:

$value=~s/%(..)/pack("C",hex($1))/eg;

  在此提供给读者参考。

 
第十一课、函数(1)--用户自定义函数(子程序)

用户函数
系统函数
  函数可分为系统函数和用户函数。

用户函数

  用户函数又称子程序(Subroutine),在Perl中用下面的结构来定义用户函数:

    sub 子程序名{

      语句块;
    }

  这里的子程序名与变量的取名规则类似。

  以显示欢迎词的程序为例:

    sub say_hello{

      print "你好,欢迎光临网上学园";
    }

  用户函数的定义可以位于程序的任何位置,比如说放在文件的未尾。如果两个子程序使用了相同的程序名, 后面的子程序将覆盖前面子程序。

  用户函数中的变量默认为全局变量,与其他程序共享。

  用户函数的调用:通过在子程序前加“&”调用,可在任一表达式内调用。 子程序中可以再调用另外的子程序。

  调用用户函数产生的结果称为返回值(return value)。返回值是每次调用函数中最后一个表达式的计算值。 以加法函数为例:

    sub add_a_b{

      $a+$b;
    }

  函数最后一条表达式为$a+$b,故返回值为$a+$b。以下是调用情况:

    $a=5;
    $b=6;
    $c=&add_a_b; #$c的值为11
    $d=5*&add_a_b; #$d的值为5*11即55

  上述的函数功能与传统直接写在程序中没什么两样,如果加上参数传递就可以实现全新的功能了。 在Perl中,如果函数调用后面跟着一个用括号括起来的列表,则在函数调用期间该列表将被自动分配给以@_命名的特殊变量。 函数可以访问该变量,从而确定参数的个数及赋值。

  仍以加法函数为例:

    sub add_a_b{
      $_[0]+$_[1];
    }
    $c=&add_a_b(5,6); #$c的值为11
    $d=5*&add_a_b(2,3); #d的值为5*5即25

  如何改变参数的个数呢?我们可以用循环的方式来实现:

    sub add_all{
      $sum=0; #将sum初始化
      foreach $_(@_) { #遍历参数列表
       $sum+=$_; #累加每个元素
      }
      $sum; #返回sum即总和的值
    }
    $a=&add_all(3,4,5); #$a的值为3+4+5即12
    $d=2*&add_all(1,2,3,4,5); #d的值为2*15即30

  既然函数中的变量全为全程变量,那么上述程序中若调用程序中含有$sum变量时将替换,这不是我们所要的。 那么如何解决这一问题呢?

  答案就是:使用局部变量, 使用local()操作符就可实现此功能。在上面的程序中,只需在第一行$sum=0;前加入:

    local($sum);

  当函数执行时,$sum的全程变量的值被保留起来,同时建立一个局部变量$sum,退出函数add_all后将全程变量$sum的值恢复。如:

    sub add_all{
      local($sum); #将$sum定义为局部变量
      $sum=0; #将sum初始化
      foreach $_(@_) { #遍历参数列表
       $sum+=$_; #累加每个元素
      }
      $sum; #返回sum即总和的值
    }
    $sum=88; #$sum的原始值为88
    print $sum; #显示$sum的值即88
    $a=&add_all(3,4,5); #$a的值为3+4+5即12
    print $sum; #显示$sum的值仍为88

  比较:若未加入local($sum);行,最后一行的执行结果将为12。

  下面再举一例:计算十以内的加法,并以中文形式输出。当超过十时输出阿拉伯数字。如:输入两个数字,显示“一加二等于三”。程序如下:

    #/! /usr/bin/perl
    sub cnumber{
      @chinese=("0","一","二","三","四","五","六","七","八","九");
            #将@chinese定义为数组
      local($number); #将number定义为局部变量
      $chinese($number)||number; #想想为什么?
    }
    #主程序
    print "请输入一个数:"
    chop($num1= );
    print "请再输入一个数:"
    chop($num2= );
    $msg=&chinese($num1)."加".&chinese($num2)."等于".
        &chinese($num1+num2)."。\n"
    print $msg; #打印$msg的值

  其中$chinese($number)||number; 行的初级写法为:

    if ($chinese(number) {
      &chinese($number); #返回中文
    } else {
      &number; #返回阿拉伯数字
    }

  看看执行结果:输入2,3,显示:"二加三等于五。";输入3,12,显示:"三加12等于15。"


第十二课、函数(2)--常用系统函数

常用系统函数列表
指令:print
语法:print Filehandle LIST
说明:这个Filehandle可以看作在I(INPUT)/O(OUTPUT)之间的一个桥梁,可以利用FILEHANDLE来做出数据读入写 出的动作.STDIN是代表从哪连输入数据,例如从电脑的键盘输入;STDOUT是代表从哪连输出数据;例如从电脑的屏 幕输出;STDERR是代表从哪连输出错误的数据,例如从电脑的屏幕输出.而在PERL语言中有三个标准FILEHANDLE: 1.STDIN(标准输入):是代表STDIN的FILEHANDLE
2.STDOUT(标准输出):是代表STDOUT的FILEHANDLE
3.STDERR(标准错误输出):是代表STDERR的FILEHANDLE如果要使用其他FILEHANDLE的时候,就要用OPEN这个函数来打开一个FILEHANDLE,我们可以用PRINT这个函数LIST的数据输出给FILEHANDLE.
在为大家介绍PRINT这个函数之前,先让我们来看看PRINT函数中特殊打印字符:

指令:#
说明:注释符号Remark宣告
示例:#这是一个注释说明


--------------------------------------------------------------------------------

指令:print
语法:print Filehandle LIST
说明:这个Filehandle可以看作在I(INPUT)/O(OUTPUT)之间的一个桥梁,可以利用FILEHANDLE来做出数据读入写 出的动作.STDIN是代表从哪连输入数据,例如从电脑的键盘输入;STDOUT是代表从哪连输出数据;例如从电脑的屏 幕输出;STDERR是代表从哪连输出错误的数据,例如从电脑的屏幕输出.而在PERL语言中有三个标准FILEHANDLE: 1.STDIN(标准输入):是代表STDIN的FILEHANDLE
2.STDOUT(标准输出):是代表STDOUT的FILEHANDLE
3.STDERR(标准错误输出):是代表STDERR的FILEHANDLE如果要使用其他FILEHANDLE的时候,就要用OPEN这个函数来打开一个FILEHANDLE,我们可以用PRINT这个函数LIST的数据输出给FILEHANDLE.
在为大家介绍PRINT这个函数之前,先让我们来看看PRINT函数中特殊打印字符:

符号 其作用
\n 换行 new line
\r 光标换行 return
\t tab键
\f 换页 form feed
\b 退回一格
\v 垂直tab键
\a 响铃Bell
\e escape键
\007 十进制ASC II码
\xff 十六进制码
\c[ 控制字符
示例: print STDOUT "网上学园\n"; 将"网上学园"加上换行显示在屏幕上.

语法: print LIST
说明: 如果省略Filehandle的话,就会把Filehandle内定为STDOUT.也就是会将LIST的数据内容显示在屏幕上.
示例: $url="www.netease.net/~zmd";
print "网上学园$url\n";
在屏幕上将会出现"网上学园www.netease.net/~zmd",如果想要让双引号内的变量失效,可以在变量的前面加上"\"符号.例如: print"网上学园\$url"; 这样它就显示:"网上学园$url"

语法: print
说明: 同省略Filehandle和LIST的话,就会以STDOUT为Filehandle,并会输出$_这个内定输出变量的数据内容. 如果$_变量是一个空字符串的话,就会显示出一个空字符串.
示例: $_="网上学园\n"; print; 就会将"网上学园"加上换行显示在屏幕上


--------------------------------------------------------------------------------

指令: printf
语法: printf Filehandle LIST
说明: 在perl语言中也提代C语言中printf的语法,用法和C语言中的用法一模一样.如果把Filehandle省略的话 ,也一样会把STDOUT当成是内定的Filehandle.在为大家介绍printf函数之前,先让我们来看看printf函数中变换符号的字符.

符号 其作用
%c 字符
%s 字符串
%d 整数
%f 浮整数
%h 十六进制码
%o 八进制码
示例:printf("chomod%d%s\n","711""cgi"); 会将chmod 711 cgi加上换行显示于屏幕上。


--------------------------------------------------------------------------------

指令:chop 语法:chop($url)
说明:把最后一个字符删除。
示例:$url="www.nease.net/~zmd/";
chop($url); 这时$url="www.nease.net/~zmd" 而这两行也可以写成chop($url="www.nease.net/~zmd/");


--------------------------------------------------------------------------------

指令:split
语法:split(/pattern/,$text,limit) 其中/pattern/是文字处理的模式,而limit是代表要分割的个数,一般可以省略。
说明:用一个指定的文字处理模式来分割$text字符串。
示例:
$text="Michael,Gevin,Mike"; @name=split(/,/,$text); #这时@name=("Michael","Gevin","Mike");
($a,$b,$c)=split(/,/,$text); #这时$a="Michael";$b="Gevin";$c="Mike";
@name=split(/,/,$string,2); #这时@name=("Michael","Gevin");
在传送CGI应用程序数据的时候会先将数据编码,其中会将FORM中第个数据字段 的数据内容用&这个符号隔开,所以在解码的时候就要以&这个符号为分割的字符,将每个数据字段分割出。例如: $text="Mike=A&Michael=B";
@name=split(/&/,$text); #这时@name=("Mike=A","Michael=B"); 而数据字段的名称和这个数据字段的值是用=这个符号来隔开,如果想取得数据 字段的名称和所对应的值的话,就用要=这个符号来分割数据字段,例如: $name=""Mike=Michael"";
($name1,$name2)=split(/=/,$list); #这时$name1="Mike";$name2="Michael";


--------------------------------------------------------------------------------

指令:keys
语法:keys(%array)
说明:取出关联数组%ARRAY中全部的key。
示例:%NAME=(1,"mike",2,"michael"); @readkey=keys(%NAMES); #这时@readkey=(1,2);


--------------------------------------------------------------------------------

指令:values
语法:values(%array)
说明:取出关联数组%ARRAY中全部的value。
示例:%NAMES=(1,"mike",2,"michael"); @readval=values(%NAMES); #这时@readval=("mike","michael");


--------------------------------------------------------------------------------

指令:reverse
语法:reverse(@array)
说明:将数组@array中的元素由后到前重新排列。
示例:@back=("A","B","C","D","E"); @back=reverse(@back); #这时@back=("E","D","C","B","A");


--------------------------------------------------------------------------------

指令:sort
语法:sort(@array)
说明:将数组中的元素由小到大排序,如果要由大到小排序的话,要加上reverse这个函数。
示例:
@abc=("d","b","c","a"); @abc=sort(@abc); #这时@abc=("a","b","c","d");
@abc=(reverse sort@abc); #这时@abc=("d","c","b","a"); 这个语法也可以写成@abc=(reverse sort(@abc));
@number=(5,2,10); @number=sort(@number); 上面示例用sort函数来排序数值的时,会出差错,因此要用下面到下面这一句。 @number=(sort{$a<=>$b}@number); #这时@number=(2,5,10);


--------------------------------------------------------------------------------

指令:length
语法:length($string)
说明:求出字符串$string的字节(bytes)值。
示例:$string="Perl5"; $size=length($string); #这时$size=5;


--------------------------------------------------------------------------------

指令:substr
语法:substr($string,offset,length) offset代表起始字符的位置,length代表引用的字符串长度,如果省略length则代表从起始值到字符串的最后一个字符长度。而offset如果是负值的话,就会从字符串右边开始指定字符。
示例:
$s=substr("perl5",2,2); #这时$s="rl";
$s=substr("perl5",2); #这时$s="rl5";
$s=substr("perl5",-2,2); #这时$s="er";


--------------------------------------------------------------------------------

指令:index
语法:index($string,$substring,position) $substring是要寻找的字符;position代表从哪一个位置开始寻找,假如省略position就从头开始找起。
说明:返回所要找寻的字符在一字符串$string中的位置,如果在字符串中找不到字符的话,则会返回-1这个 值。
示例:
$s=index("perl5","p"); #这时$s=0
$s=index("perl5","l",2); #这时$s=3
$s=index("perl5","perl"); #这时$s=-1


--------------------------------------------------------------------------------

指令:push
语法:push(@array,$string)
说明:在数组@array的最后附加新的元素 ($string)到数组@array中。
示例:@array=("one","two"); push(@array,"three"); #这时$@array=("one","two","three")


--------------------------------------------------------------------------------

指令:pop
语法:pop(@array)
说明:将数组(@array)的最后一个元素删除,并将删除的元素返回。
示例:@array=("one","two"); $rm=pop(@array); #这时@array=("one");而$rm="two";


--------------------------------------------------------------------------------

指令:unshift
语法:unshift(@array,$string) 说明:在数组@array的第一个元素前附加新的元素$string到数组@array中。 示例: @array=("one","two"); unshift(@array,"three"); #这时@array=("three","one","two")


--------------------------------------------------------------------------------

指令:shift
语法:shift(@array)
说明:将数组@array的第一个元素删除,并将删除的元素返回。
示例:@array=("one","two"); @rm=shift(@array); #这时@array=("two");而$rm="one";


--------------------------------------------------------------------------------

指令:join
语法:join($string,@array)
说明:在一数组@array的元素之间加上一指定的字符$string,并将结果返回。
示例:
@array=("one","two","three");
$total=join(":",@array); 这时$total="one:two:three";


--------------------------------------------------------------------------------

指令:grep
语法:grep(/pattern/,@array)
说明:将合文字处理模式(regular expression)的数组元素找出来。
示例:
@array=("one","on","in");
$count=grep(/on/,@array); #这时$count=2
@result=grep(/on/,@array);#这时@result=("one","on");


--------------------------------------------------------------------------------

指令:hex
语法:hex($string)
说明:将十六进制的数值转成十进制。
示例: $decimal=hex("ff"); 这时$decimal=255;


--------------------------------------------------------------------------------

指令:rand
语法:rand($interger)
说明:常和函数srand搭配来取得一随机数,如果没有先宣告stand函数的话,则取出的常数值是一个固定值。这个语法会返回一个介于0和$interger之间的数值,如果$interger省略的话,则会返回一个介于0和1 的数值。
示例:
srand; #要先宣告srand函数,才能产生随机数的效果
$int=rand(10); #$int的值会大于0而且小于10如果希望产生的乱数是整数的话,就要再加上int #这个函数
$int=int(rand(10)); #$int的值是一个整数,且值在0和9之间


--------------------------------------------------------------------------------

指令:localtime
语法:localtime(time)
说明:可返回九个有关时间的元素,在写CGI应用程序的时候常会用到系统的时间,所以在此会详细介绍这个函 数的用法。
示例:
($sec,$min,$hour,$mday,$mon,$year,$wday,$yday,$isdst)=localtime(time);
其中: $sec代表秒数[0,59] $min代表分数[0,59] $hour代表小时数[0,23] $mday代表是在这个月的第几天[1,31] $mon代表月数[0,11],要将$mon加1之后,才能符合实际情况。$year从1990年算起的年数 $wday从星期六算起,代表是在这周中的第几天[0-6] $yday从一月一日算起,代表是在这年中的第几天[0,365] $isdst只是一个flag 知道这些变量之后,就可以在CGI应用程序中拿来应用了。此外,也可以用下面这一行指令在UNIX系统下取得系统的时间。为了避免错误发生,最好用绝对路径的方法来取得系统时间,如果绝对路径不清楚的话可以用"which data"这个指令来得知。最后要提字符的话,就不能正确执行系统的程序了。 $data='/usr/bin/data'; 而在perl5版本中,也可以用下面这一行指令来取得系统时间。 $data=localtime(time);


--------------------------------------------------------------------------------

指令:die
语法:die LIST
说明:会把LIST字符串显示出来,并退出程序。常常和$!这个代表错误信息变量一起使用。
示例:open(FILE,"$filename")||die "不能打开文件$!\n; 如果打开文件失败的话,就会显示出错误的信息,之后再退出程序。


--------------------------------------------------------------------------------

指令:open
语法1:open(filehandle,"$filename") 其中$filename是一个指定打开的文件名。
说明:这是一个很常用的函数,可用于文件的打开(read only)。在CGI程序设计中常常会打开一个文件来读取数据,所以笔者会详加说明这一个函数相关用法。这个filehandle可把它看作在I(INPUT)/O(OUTPUT)之间的一个桥梁,可以利用FILEHANDLE来作出数据读 入写出的动作。开始可用OPEN这个函数来打开一个指定的文件,接下来可以用&ltfilehandle>来读取所打开文件的数据内容,最后一定要用close这个函数来关闭这个之前打开的filehandle。要注意的是在CGI程序定作中,当用OPEN这个函数来打开一个文件时,一定要在打开文件前加上文件所在的绝对路径名称。
示例:
$filename="usr/abc.txt";
open(FILE,"$filename")||die"不能打开文件$filename\n; #将&ltfile>数据指定给纯变量$line(一行一行地)
while($line=&ltfile>)
{
print"$line";
}
close(file); 就会把abc.txt这个文件的内容显示出来。

语法2:open(filehandle,"<$filename")
说明:这个语法也可以打开一个存在的文件(read only)。
示例:
$filesname="usr/abc.txt";
open(file,"<$filename")||die"不能打开文件$filename\n";
@array=&ltfile> #将&ltfile>全部的数据内容都指定给数组@array close(file);
print "@array"; 也会把abc.TXT这个文件的内容显示出来。

语法3:open(filehandle,">$filename")
说明:建立一个新的文件(write only),如果已经存在这个文件了,就会把旧文件名覆盖掉。并可用print filehandle的方式将数据到所打开的文件中。
示例:
$filename="/usr/abc.txt";
open(file,">$filename")||die"不能打开文件$filename\n;
print file "this is a new line1\n; #\n是换行字符
print file "this is a new line2\n;
close(file); 会打数据存在一个新文件中。

语法4:open(filehandle,">>$filename")
说明:数据用附加的方式定入一文件(write only),如果指定的文件名不存在的话就会建立一个新的文件。
示例:
$filename="/path/abc.txt";
open(file,">>$filename")||die"不能打开文件$filename\n";
print file "this is a new line1\n";
print file "this is a new line2\n";
close(file);
会打数据附加(append)到一个文件(abc.txt)中。

语法5:open(filehandle,"|unix command")
说明:就会把在filehandle的数据输入给unix的指令来作处理。
示例:
$mailprog="/usr/ucb/mail"; #unix系统上的寄信程序(一定要加绝对路径)
$who="mqingyi@126.com";
$open(file,"|$mailprog$who")||die"打开失败\n";
print file "I love you!\n";
print file "I want to see you.\n";
close(file);
就会通过unix系统mail的程序,将FILE这个FILEHANDLE的数据内容寄给$who这个变量所指定的收信人。 我们可以利用open这个函数来设计一个来信批评CGI应用程序,在本书中的下一章中会有详细的介绍。


--------------------------------------------------------------------------------

指令:close
用法:close(filehandle)
说明:用open这个函数来打开一个filehandle之后,一定要用close批这个函数把所打开的filehandle关闭。
示例:
open(filehandle,"$filename");
close(filehandle);


--------------------------------------------------------------------------------

指令:pack
语法:pack("指定的格式",list)
说明:pack这个函数会将一个list变成所指定的二进制数据格式。在CGI程序分割解码过程中,会用到pack这 个函数,所以笔者在此简单介绍这个函数的用法。
示例:$string=pack("c",65); #这时$string="a";将65这个ascii码转换成一个unsigned字符,其中c就是指定要转换成unsigned字符的意思。


--------------------------------------------------------------------------------

指令:read
语法:read(filehandle,$string,length) 其中length是代表读入字符串的长度(bytes)。
说明:用read这个函数把filehandle中的数据依指定的字符串长度读入之后指派给$string这个变量。在cgi程序分割解码过程中,如果FORM的传送方式是设定为POST的话,就会将传送的数据设定为标准输入,所以会将数据内容指定给STDIN这个标准输入的filehandle,而CGI环境变量$env{'content_length'}就是代 表使用者送出数据内容的长度,因此我们要用read这个函数来取得使用者送出的数据内容。
示例:read(stdin,$buffer,$env{'content_length'}); 就会将stdin这个标准输入filehandle中的数据依指定的字符串长度读入,再指派给$buffer这个变量。


--------------------------------------------------------------------------------

指令:exit
语法:exit
说明:退出执行的程序。
示例: print"i love cgi\n"; exit; 显示完"i love cgi"以后,将退出这个程序。

--------------------------------------------------------------------------------

第十三课、文件及目录操作

  大多数程序都不是孤立的,它们与它们的环境相互作用。很多的程序也需要通过文件操作实现数据的存贮和交换。 文件句柄(file handle)是Perl程序中为程序和外部世界提供I/O连接的名称。建议全部使用大写字母以示与变量等的区别。特别地,也可以将STDIN/STDOUT/STDERR也认为 是Perl的文件句柄,分别代表标准输入/标准输出/标准错误输出。

打开及关闭文件

  Perl的文件操作与C语言极为相似。如:

open(FILENAME,"abc.txt");

  该调用为读文件打开,若为写文件而打开,需在文件名前加上大于号:

open(FILENAME,">abc.txt");

  若要追加至文件尾,可在文件名前加上两个大于号:

open(FILENAME,">>abc.txt");

  以上三种open()格式在成功时返回真,失败时返回假。但程序中通常没有提示,出错时往往会被人们忽略。 通常当需要给出出错提示时,可加入die()函数。例:

open(OUTFILE,">/tmp/outfile")||
die "出错,不能建立/tmp/outfile\n";

  当只有open失败时,才会执行die给出出错提示。

  对文件句柄的操作完成后,可以用close操作符关闭文件。如:

close(OUTFILE);

-x 文件测试

  Perl的文件操作也可以先测试文件是否存在,是否可读写等。如:

$x="abc.txt";
if(-e $x) { #abc.txt是否存在?
# 存在操作
} else {
printf "文件不存在。\n";
}

-e操作符测试文件或目录是否存在。

  以下为文件测试清单:



文件测试 测试操作符提供的信息
-r 文件或目录可读
-w 文件或目录可写
-x 文件或目录执行
-o 文件或目录归用户所有
-R 文件或目录对真正用户可读
-W 文件或目录对真正用户可写
-X 文件或目录对真正用户执行
-O 文件或目录归真正用户所有
-e 文件或目录存在
-z 文件存在且大小为0
-s 文件或目录存在且不为0(返回字节数)
-f 文件为普通文件
-d 文件为目录
-l 文件为符号链接
-p 文件为命名管道(FIFO)
-S 文件为一个套口(socket)
-b 文件为块特殊文件
-c 文件为字符特殊文件
-t 打开tty控制台的文件句柄
-u 文件或目录是设置用户ID号
-g 文件或目录是设置用户组ID号
-k 文件或目录的sticky位置位
-T 文件是文本文件
-B 文件是二进制文件
-M 以天为单位的存在时间
-A 以天为单位访问时间
-C 以天为单位同代码更改时间

删除文件

  Perl的unlink()操作符可实现删除文件。如:

unlink("abc.txt"); #删除abc.txt

文件重命名

  Perl的rename()操作符可实现文件重命名。如:

rename("abc","zmd")||die "出错,不能更名";

  此时将abc更名为zmd,成功返回真,否则给出出错提示。

目录操作

  Perl中处理目录非常类似于处理文件。

  打开目录句柄:

opendir(ETC,"/etc")||die "出错,不能打开目录";

  关闭目录句柄:

closedir(ETC);

  创建目录:

mkdir("zmd",0777)||die "不能创建zmd目录";

  0777为内部权限格式。

  删除目录:

rmdir("zmd")||die "不能删除zmd目录"。
 


第十四课、进程管理

  当你向系统shell发送一个命令行时,shell创建一个进程来执行这个命令。这个新进程成为shell的子进程,它的执行不依赖于shell但又与shell相互协调。

  同样,Perl程序也能启动新进程。

使用system()和exec()

  生成新进程的最简单的方法就是用system操作符。如:

system("date");

  若要将输出送至now_day文件,则可以:

system("date>now_day") ||die "不能建立now_day文件";

使用单引号

  产生进程的另一方法是将shell命令置于两个单引号之间。如:

$nowday="现在时间:".'date'

$nowday的值为“现在时间:”和date命令的结果的连接。即:"现在时间:Fri Feb 18 23:49:23 PDT 1998"

综合范例

  举一个综合例子,要求从date的输入中分析,周未时打印"周未了,别太辛苦",否则打印"好好工作"。简洁的写法为:

if('date'=~/^S/){
printf "网上学园欢迎您,周未了,别太辛苦";
} else {
printf "好好工作\n"
}

  date的输出格式第一个字节为星期,英语中恰好只有周未为"S"打头,因此使用了常规表达式判断第一个字符是否为S,即可达到要求。
附一、在自己的电脑上调试CGI程序


  在自己的平台上调试Perl CGI程序,需要做以下准备工作:

安装设置Web服务器
安装Perl for Win32
设置TCP/IP协议

安装Web服务器
在“网上邻居”的“属性”对话框“配置”中单击“添加”按钮。
在弹出的"选择网络组件类型"对话框中,在“厂商”栏中选择"Microsoft",在"网络服务"栏中选择 "Personal Web Server",然后单击"确定"按钮。这时Windows 95将自动安装Personal Web Server。安装完成后,“控制面板”中会出现“个人Web服务器”图标,双击图标可以对自己的个人Web服务器做设置,然后设置CGI程序的运行目录。在“控制面板”中双击“个人Web服务器”图标,选择"Aaministration",这时Personal Web Server会自动启动你的浏览器,显示Internet服务管理页面。选择"WWW Administr ation",选择"Directory",在按"ADD",在WWW服务中加入你的CGI-BIN目录,然后,一定不要忘了,要把它设为可执行。同时,建议你把它虚拟为"cgi-bin"目录,这样在你的HTML里面你就可以用"/cgi-bin/????.cgi"来调用CGI程序。全部设置好之后,可以在浏览器中打"http://你的机器名称"或者"http://你的机器的IP"来检验一下你的设置。
安装Windows 98 PWS(个人 Web 服务器)

  Windows 98中,提供了一套独立的Personal Web Server,在add-ons\pws\目录中,大约19M,按提示安装就可以了。

安装其它的个人服务器

  想在本地(local)尤其是在Win95/98/NT环境下调试CGI程序,在这里还向各位强力推荐Sambar 4.1。这是一套可以在win95/98/NT环境下安装运行的多工Web Server 软件,只要设定好你的IP,安装好之后,立刻就可以在你自己的电脑上建立起一个Web Site了。

Sambar 4.1有如下特点:

内建网页搜索器。
内建FTP服务器。
内含Perl 5,当你安装好之后就有了Perl可用了,不需另外安装Perl for win32。
具有HTML方式操作的管理及设定环境。
支持HTTP,SMTP,POP3,IMAP4,NNTP,Bridge的Proxy设定。
内含系统报告及LOG分析功能。
支持CGI/1.1,WINCGI,ISAPI,Mappings。
从本地下载Sambar 4.1(2M),功能超强,绝对免费。

安装方法:

设置IP地址。
方法同上。
将Sambar 4.1的压缩文件解压,运行setup程序,安装过程很简单。只要你以前安装过windows 95/98就不会有问题。
注:frontPage 98不支持Sambar,Sambar称多次去信Microsoft,没有任何回音。使用FrontPage 98的网友在使用Sambar时,一定不要把Sambar的缺损目录定为FrontPage 98的网站目录。Sambar仅作为在本地Win95/98/NT环境下调试CGI程序之用。


--------------------------------------------------------------------------------

安装Perl for Win32

  要在视窗系统上使用Perl来执行CGI程序,还要再安装Perl for Win32 系统点这里Perl for win32下载了109-i86.zip并把它解压然后运行Perl目录下的install.bat。

  系统会分别提问:

Do you wish to proceed?  Y
Modify search path?  Y
continue to install perlIS.dll? Y
please choose a file extension to associate with PerlIS.dll?
Extension: 按你的情况,键入CGI程序后缀“pl”(pl is the default)或“cgi”
  这时,按我们的经验,应该是已经可以运行CGI程序的了,可以用记事本写一个简单的CGI脚本试一试。

  用记事本新建一个文件,然后把下面的代码Copy进去,再将它保存为CGI-BIN目录 test.pl或test.cgi(视安装过程中你对第四个问题的回答而定)(请注意下面例子中,"#!/usr/bin/perl"对于本章并不须要,因为安装Perl for win32时系统已将Perl解释器加入关联,但有点要注意,如果此程序在UNIX主机上运行,"#!/usr/bin/perl"指定Perl解释器位置,必不可少。)

#!/usr/bin/perl
print "Content-type:text/html\n\n";
print "成功了!";

  把这个文件放在你自己的CGI-BIN目录中。然后新建一个名称为test.htm的HTML文 件,放在你的某一个WWW目录中。其内容如下:

<a href="http://你的机器名称/cgi-bin/test.cgi">测试 CGI</a>

  完成后运行测试。打开浏览器,在地址栏中键入"http://你的Web服务器名/test.htm",如果出现"成功了"就表示你已经成功。

Windows NT Server 4.0中的Web服务器功能通过NT自带的IIS(Internet Information Server)来完成。
Windows 98 光盘中专门带有类似IIS的Personal Web Server(PWS),。
在Windows 98 和 Windows NT Server 4.0 中Perl for win32的安装方法与Windows 95基本一样。


--------------------------------------------------------------------------------

为计算机设置TCP/IP协议

  从开始菜单选[设置]→[控制面板]→[网络]→[配置TCP/IP]→[属性]
  填入你的IP地址,子网掩码设为255.255.255.0
  如果你没有网卡,不必设置,用127.0.0.1就可以连接上。如果不知道IP地址,可以在下面的区段里选一个。这些区段里的IP地址是网络界公认的测试区段,不会真的连出去的。
192.168.0.0-192.168.255.255
172.16.0.0-172.31.255.255
10.0.0.0-10.255.255.255
在“DNS配置”中选择“使DNS 无效”。

  当然,也可以不指定IP地址,那么在以后就只能通过机器名称来识别web服务器了,机器名称可以在[控制面板]→[网络]→[标识]中找出。

 

附二、CGI的环境变量

环境变量 意义
SERVER_NAME CGI脚本运行时的主机名和IP地址.
SERVER_SOFTWARE 你的服务器的类型如: CERN/3.0 或 NCSA/1.3.
GATEWAY_INTERFACE 运行的CGI版本. 对于UNIX服务器, 这是CGI/1.1.
SERVER_PROTOCOL 服务器运行的HTTP协议. 这里当是HTTP/1.0.
SERVER_PORT 服务器运行的TCP口,通常Web服务器是80.
REQUEST_METHOD POST 或 GET, 取决于你的表单是怎样递交的.
HTTP_ACCEPT 浏览器能直接接收的Content-types, 可以有HTTP Accept header定义.
HTTP_USER_AGENT 递交表单的浏览器的名称、版本 和其他平台性的附加信息。
HTTP_REFERER 递交表单的文本的 URL,不是所有的浏览器都发出这个信息,不要依赖它
PATH_INFO 附加的路径信息, 由浏览器通过GET方法发出.
PATH_TRANSLATED 在PATH_INFO中系统规定的路径信息.
SCRIPT_NAME 指向这个CGI脚本的路径, 是在URL中显示的(如, /cgi-bin/thescript).
QUERY_STRING 脚本参数或者表单输入项(如果是用GET递交). QUERY_STRING 包含URL中问号后面的参数.
REMOTE_HOST 递交脚本的主机名,这个值不能被设置.
REMOTE_ADDR 递交脚本的主机IP地址.
REMOTE_USER 递交脚本的用户名. 如果服务器的authentication被激活,这个值可以设置。
REMOTE_IDENT 如果Web服务器是在ident (一种确认用户连接你的协议)运行, 递交表单的系统也在运行ident, 这个变量就含有ident返回值.
CONTENT_TYPE 如果表单是用POST递交, 这个值将是 application/x-www-form-urlencoded. 在上载文件的表单中, content-type 是个 multipart/form-data.
CONTENT_LENGTH 对于用POST递交的表单, 标准输入口的字节数.

posted @ 2006-11-18 16:26  bigwhiteshark(云飞扬)  阅读(1603)  评论(0编辑  收藏  举报