Perl 和 CGI 教程



什么是 CGI?

通用网关接口(CGI)是一套标准,定义了 Web 服务器和自定义脚本之间如何交换信息。

CGI 规范目前由 NCSA 维护,NCSA 将 CGI 定义如下:

通用网关接口(CGI)是外部网关程序与信息服务器(如 HTTP 服务器)接口的标准。

当前版本为 CGI/1.1,CGI/1.2 正在开发中。

网页浏览

为了理解 CGI 的概念,让我们看看当我们点击超链接浏览特定网页或 URL 时会发生什么。

  • 您的浏览器联系 HTTP Web 服务器并请求 URL,即文件名。

  • Web 服务器将解析 URL 并查找该文件,如果找到则发送回浏览器,否则发送错误消息,指示您请求的文件错误。

  • Web 浏览器接收 Web 服务器的响应,并显示接收到的文件或错误消息。

但是,可以设置 HTTP 服务器,以便每当请求某个目录中的文件时,该文件不会被发送回;相反,它将作为程序执行,并且该程序输出的任何内容都将发送回以供您的浏览器显示。此功能称为通用网关接口或 CGI,程序称为 CGI 脚本。这些 CGI 程序可以是 PERL 脚本、Shell 脚本、C 或 C++ 程序等。

CGI 架构图

CGI Architecture

Web 服务器支持和配置

在继续进行 CGI 编程之前,请确保您的 Web 服务器支持 CGI 并且已配置为处理 CGI 程序。所有由 HTTP 服务器执行的 CGI 程序都保存在预配置的目录中。此目录称为 CGI 目录,按照惯例,其名称为 /cgi-bin。按照惯例,PERL CGI 文件的扩展名为 .cgi

第一个 CGI 程序

#!/usr/bin/perl

print "Content-type:text/html\r\n\r\n";
print '<html>';
print '<head>';
print '<title>Hello Word - First CGI Program</title>';
print '</head>';
print '<body>';
print '<h2>Hello Word! This is my first CGI program</h2>';
print '</body>';
print '</html>';

1;

输出

Hello Word! This is my first CGI program

HTTP 头

Content-type:text/html\r\n\r\n 行是 HTTP 头的一部分,发送到浏览器以理解内容。所有 HTTP 头都将采用以下格式

HTTP Field Name: Field Content

例如

Content-typetext/html\r\n\r\n

在您的 CGI 编程中,您经常会使用一些其他重要的 HTTP 头。

序号 头和描述
1

Content-type: 字符串

定义返回文件的格式的 MIME 字符串。例如 Content-type:text/html

2

Expires: 日期字符串

信息失效的日期。浏览器应使用此信息来确定何时需要刷新页面。有效的日期字符串应采用 01 Jan 1998 12:00:00 GMT 的格式。

3

Location: URL 字符串

应返回的 URL,而不是请求的 URL。您可以使用此字段将请求重定向到任何文件。

4

Last-modified: 字符串

资源上次修改的日期。

5

Content-length: 字符串

返回数据的长度(以字节为单位)。浏览器使用此值报告文件的估计下载时间。

6

Set-Cookie: 字符串

设置通过字符串传递的 Cookie

CGI 环境变量

所有 CGI 程序都可以访问以下环境变量。这些变量在编写任何 CGI 程序时都起着重要作用。

序号 变量名和描述
1

CONTENT_TYPE

内容的数据类型。当客户端向服务器发送附加内容时使用。例如文件上传等。

2

CONTENT_LENGTH

查询信息的长度。仅在 POST 请求中可用。

3

HTTP_COOKIE

以键值对的形式返回设置的 Cookie。

4

HTTP_USER_AGENT

User-Agent 请求头字段包含有关发起请求的用户代理的信息。它是 Web 浏览器的名称。

5

PATH_INFO

CGI 脚本的路径。

6

QUERY_STRING

使用 GET 方法请求发送的 URL 编码信息。

7

REMOTE_ADDR

发出请求的远程主机的 IP 地址。这对于记录或身份验证很有用。

8

REMOTE_HOST

发出请求的主机的完全限定域名。如果此信息不可用,则可以使用 REMOTE_ADDR 获取 IR 地址。

9

REQUEST_METHOD

用于发出请求的方法。最常用的方法是 GET 和 POST。

10

SCRIPT_FILENAME

CGI 脚本的完整路径。

11

SCRIPT_NAME

CGI 脚本的名称。

12

SERVER_NAME

服务器的主机名或 IP 地址。

13

SERVER_SOFTWARE

服务器正在运行的软件的名称和版本。

#!/usr/bin/perl

print "Content-type: text/html\n\n";
print "<font size=+1>Environment</font>\n";

foreach (sort keys %ENV) {
   print "<b>$_</b>: $ENV{$_}<br>\n";
}

1;

输出

Environment CONTEXT_DOCUMENT_ROOT: 
CONTEXT_PREFIX: 
DOCUMENT_ROOT: 
GATEWAY_INTERFACE: 
GEOIP_ADDR: 
GEOIP_CONTINENT_CODE: 
GEOIP_COUNTRY_CODE: 
GEOIP_COUNTRY_NAME: 
HTTP_ACCEPT: 
HTTP_ACCEPT_ENCODING: 
HTTP_ACCEPT_LANGUAGE: 
HTTP_COOKIE: 
HTTP_HOST: 
HTTP_UPGRADE_INSECURE_REQUESTS: 
HTTP_USER_AGENT: 
HTTP_VIA: 
HTTP_X_FORWARDED_FOR: 
HTTP_X_FORWARDED_PROTO: 
HTTP_X_HOST: 
PATH: 
QUERY_STRING: 
REMOTE_ADDR: 
REMOTE_PORT: 
REQUEST_METHOD: 
REQUEST_SCHEME: 
REQUEST_URI: 
SCRIPT_FILENAME: 
SCRIPT_NAME: 
SCRIPT_URI: 
SCRIPT_URL: 
SERVER_ADDR: 
SERVER_ADMIN: 
SERVER_NAME: 
SERVER_PORT: 
SERVER_PROTOCOL: 
SERVER_SIGNATURE: 
SERVER_SOFTWARE: 
UNIQUE_ID: 

如何显示“文件下载”对话框?

有时您希望提供一个选项,用户单击链接后会弹出一个“文件下载”对话框,而不是显示实际内容。这非常简单,可以通过 HTTP 头实现。

此 HTTP 头将不同于上一节中提到的头。

例如,如果要使FileName 文件可从给定链接下载,则其语法如下。

#!/usr/bin/perl

# HTTP Header
print "Content-Type:application/octet-stream; name=\"FileName\"\r\n";
print "Content-Disposition: attachment; filename=\"FileName\"\r\n\n";

# Actual File Content will go hear.
open( FILE, "<FileName" );
while(read(FILE, $buffer, 100) ) {
   print("$buffer");
}

GET 和 POST 方法

您一定遇到过许多需要将一些信息从浏览器传递到 Web 服务器,最终传递到 CGI 程序的情况。浏览器最常使用两种方法将此信息传递到 Web 服务器。这些方法是 GET 方法和 POST 方法。

使用 GET 方法传递信息

GET 方法发送附加到页面请求的编码用户信息。页面和编码信息由 ? 字符分隔,如下所示:http://www.test.com/cgi-bin/hello.cgi?key1=value1&key2=value2

GET 方法是将信息从浏览器传递到 Web 服务器的默认方法,它会生成一个长字符串,显示在浏览器的 Location: 框中。如果要将密码或其他敏感信息传递到服务器,切勿使用 GET 方法。GET 方法有大小限制:请求字符串中只能有 1024 个字符。

此信息使用 QUERY_STRING 头传递,并且可以通过 QUERY_STRING 环境变量在 CGI 程序中访问。

您可以通过简单地连接键值对以及任何 URL 来传递信息,或者可以使用 HTML <FORM> 标记使用 GET 方法传递信息。

简单 URL 示例:GET 方法

这是一个简单的 URL,它将使用 GET 方法将两个值传递给 hello_get.cgi 程序。

以下是 hello_get.cgi 脚本,用于处理 Web 浏览器提供的输入。

#!/usr/bin/perl

local ($buffer, @pairs, $pair, $name, $value, %FORM);
# Read in text
$ENV{'REQUEST_METHOD'} =~ tr/a-z/A-Z/;

if ($ENV{'REQUEST_METHOD'} eq "GET") {
   $buffer = $ENV{'QUERY_STRING'};
}

# Split information into name/value pairs
@pairs = split(/&/, $buffer);

foreach $pair (@pairs) {
   ($name, $value) = split(/=/, $pair);
   $value =~ tr/+/ /;
   $value =~ s/%(..)/pack("C", hex($1))/eg;
   $FORM{$name} = $value;
}

$first_name = $FORM{first_name};
$last_name  = $FORM{last_name};

print "Content-type:text/html\r\n\r\n";
print "<html>";
print "<head>";
print "<title>Hello - Second CGI Program</title>";
print "</head>";
print "<body>";
print "<h2>Hello $first_name $last_name - Second CGI Program</h2>";
print "</body>";
print "</html>";

1;

输出

Hello ZARA ALI .....

简单表单示例:GET 方法

这是一个简单的示例,它使用 HTML 表单和提交按钮传递两个值。我们将使用相同的 CGI 脚本 hello_get.cgi 来处理此输入。

<FORM action = "/cgi-bin/hello_get.cgi" method = "GET">
   First Name: <input type = "text" name = "first_name">  <br>

   Last Name: <input type = "text" name = "last_name">
   <input type = "submit" value = "Submit">
</FORM>

以下是上述表单的实际输出,您输入姓氏和名字,然后单击提交按钮查看结果。

First Name:

Last Name:

使用 POST 方法传递信息

将信息传递到 CGI 程序的一种通常更可靠的方法是 POST 方法。此方法以与 GET 方法完全相同的方式打包信息,但它不是在 URL 中 ? 之后将其作为文本字符串发送,而是将其作为单独的消息发送。此消息以标准输入的形式进入 CGI 脚本。

以下是 hello_post.cgi 脚本,用于处理 Web 浏览器提供的输入。此脚本将处理 GET 和 POST 方法。

#!/usr/bin/perl

local ($buffer, @pairs, $pair, $name, $value, %FORM);
# Read in text
$ENV{'REQUEST_METHOD'} =~ tr/a-z/A-Z/;

if ($ENV{'REQUEST_METHOD'} eq "POST") {
   read(STDIN, $buffer, $ENV{'CONTENT_LENGTH'});
} else {
   $buffer = $ENV{'QUERY_STRING'};
}

# Split information into name/value pairs
@pairs = split(/&/, $buffer);

foreach $pair (@pairs) {
   ($name, $value) = split(/=/, $pair);
   $value =~ tr/+/ /;
   $value =~ s/%(..)/pack("C", hex($1))/eg;
   $FORM{$name} = $value;
}

$first_name = $FORM{first_name};
$last_name  = $FORM{last_name};

print "Content-type:text/html\r\n\r\n";
print "<html>";
print "<head>";
print "<title>Hello - Second CGI Program</title>";
print "</head>";
print "<body>";
print "<h2>Hello $first_name $last_name - Second CGI Program</h2>";
print "</body>";
print "</html>";

1;

让我们再次使用与上面相同的示例,该示例使用 HTML 表单和提交按钮传递两个值。我们将使用 CGI 脚本 hello_post.cgi 来处理此输入。

<FORM action = "/cgi-bin/hello_post.cgi" method="POST">
   First Name: <input type="text" name="first_name">  <br>

   Last Name: <input type="text" name="last_name">

   <input type="submit" value="Submit">
</FORM>

以下是上述表单的实际输出,您输入姓氏和名字,然后单击提交按钮查看结果。

First Name:

Last Name:

将复选框数据传递到 CGI 程序

当需要选择多个选项时,使用复选框。

以下是具有两个复选框的表单的 HTML 代码示例

<form action = "/cgi-bin/checkbox.cgi" method = "POST" target = "_blank">
   <input type = "checkbox" name = "maths" value = "on"> Maths
   <input type = "checkbox" name = "physics" value = "on"> Physics
   <input type = "submit" value = "Select Subject">
</form>

此代码的结果是以下表单

Maths Physics

以下是 checkbox.cgi 脚本,用于处理 Web 浏览器为单选按钮提供的输入。

#!/usr/bin/perl

local ($buffer, @pairs, $pair, $name, $value, %FORM);
# Read in text
$ENV{'REQUEST_METHOD'} =~ tr/a-z/A-Z/;

if ($ENV{'REQUEST_METHOD'} eq "POST") {
   read(STDIN, $buffer, $ENV{'CONTENT_LENGTH'});
} else {
   $buffer = $ENV{'QUERY_STRING'};
}

# Split information into name/value pairs
@pairs = split(/&/, $buffer);

foreach $pair (@pairs) {
   ($name, $value) = split(/=/, $pair);
   $value =~ tr/+/ /;
   $value =~ s/%(..)/pack("C", hex($1))/eg;
   $FORM{$name} = $value;
}

if( $FORM{maths} ) {
   $maths_flag ="ON";
} else {
   $maths_flag ="OFF";
}

if( $FORM{physics} ) {
   $physics_flag ="ON";
} else {
   $physics_flag ="OFF";
}

print "Content-type:text/html\r\n\r\n";
print "<html>";
print "<head>";
print "<title>Checkbox - Third CGI Program</title>";
print "</head>";
print "<body>";
print "<h2> CheckBox Maths is : $maths_flag</h2>";
print "<h2> CheckBox Physics is : $physics_flag</h2>";
print "</body>";
print "</html>";

1;

将单选按钮数据传递到 CGI 程序

当只需要选择一个选项时,使用单选按钮。

以下是具有两个单选按钮的表单的 HTML 代码示例:

<form action = "/cgi-bin/radiobutton.cgi" method = "POST" target = "_blank">
   <input type = "radio" name = "subject" value = "maths"> Maths
   <input type = "radio" name = "subject" value = "physics"> Physics
   <input type = "submit" value = "Select Subject">
</form>

此代码的结果是以下表单:

Maths Physics

以下是 radiobutton.cgi 脚本,用于处理 Web 浏览器为单选按钮提供的输入。

#!/usr/bin/perl

local ($buffer, @pairs, $pair, $name, $value, %FORM);
# Read in text
$ENV{'REQUEST_METHOD'} =~ tr/a-z/A-Z/;

if ($ENV{'REQUEST_METHOD'} eq "POST") {
   read(STDIN, $buffer, $ENV{'CONTENT_LENGTH'});
} else {
   $buffer = $ENV{'QUERY_STRING'};
}

# Split information into name/value pairs
@pairs = split(/&/, $buffer);

foreach $pair (@pairs) {
   ($name, $value) = split(/=/, $pair);
   $value =~ tr/+/ /;
   $value =~ s/%(..)/pack("C", hex($1))/eg;
   $FORM{$name} = $value;
}

$subject = $FORM{subject};

print "Content-type:text/html\r\n\r\n";
print "<html>";
print "<head>";
print "<title>Radio - Fourth CGI Program</title>";
print "</head>";
print "<body>";
print "<h2> Selected Subject is $subject</h2>";
print "</body>";
print "</html>";

1;

将文本区域数据传递到 CGI 程序

当需要将多行文本传递到 CGI 程序时,使用 TEXTAREA 元素。

以下是具有 TEXTAREA 框的表单的 HTML 代码示例:

<form action = "/cgi-bin/textarea.cgi" method = "POST" target = "_blank">
   <textarea name = "textcontent" cols = 40 rows = 4>
      Type your text here...
   </textarea>
   <input type = "submit" value = "Submit">
</form>

此代码的结果是以下表单:

以下是 textarea.cgi 脚本,用于处理 Web 浏览器提供的输入。

#!/usr/bin/perl

local ($buffer, @pairs, $pair, $name, $value, %FORM);
# Read in text
$ENV{'REQUEST_METHOD'} =~ tr/a-z/A-Z/;

if ($ENV{'REQUEST_METHOD'} eq "POST") {
   read(STDIN, $buffer, $ENV{'CONTENT_LENGTH'});
} else {
   $buffer = $ENV{'QUERY_STRING'};
}

# Split information into name/value pairs
@pairs = split(/&/, $buffer);

foreach $pair (@pairs) {
   ($name, $value) = split(/=/, $pair);
   $value =~ tr/+/ /;
   $value =~ s/%(..)/pack("C", hex($1))/eg;
   $FORM{$name} = $value;
}

$text_content = $FORM{textcontent};

print "Content-type:text/html\r\n\r\n";
print "<html>";
print "<head>";
print "<title>Text Area - Fifth CGI Program</title>";
print "</head>";
print "<body>";
print "<h2> Entered Text Content is $text_content</h2>";
print "</body>";
print "</html>";

1;

将下拉框数据传递到 CGI 程序

当有很多选项可用但仅选择一个或两个时,使用下拉框。

以下是具有一个下拉框的表单的 HTML 代码示例

<form action = "/cgi-bin/dropdown.cgi" method = "POST" target = "_blank">
   <select name = "dropdown">
      <option value = "Maths" selected>Maths</option>
      <option value = "Physics">Physics</option>
   </select>
   <input type = "submit" value = "Submit">
</form>

此代码的结果是以下表单:

以下是 dropdown.cgi 脚本,用于处理 Web 浏览器提供的输入。

#!/usr/bin/perl

local ($buffer, @pairs, $pair, $name, $value, %FORM);
# Read in text
$ENV{'REQUEST_METHOD'} =~ tr/a-z/A-Z/;

if ($ENV{'REQUEST_METHOD'} eq "POST") {
   read(STDIN, $buffer, $ENV{'CONTENT_LENGTH'});
} else {
   $buffer = $ENV{'QUERY_STRING'};
}

# Split information into name/value pairs
@pairs = split(/&/, $buffer);

foreach $pair (@pairs) {
   ($name, $value) = split(/=/, $pair);
   $value =~ tr/+/ /;
   $value =~ s/%(..)/pack("C", hex($1))/eg;
   $FORM{$name} = $value;
}

$subject = $FORM{dropdown};

print "Content-type:text/html\r\n\r\n";
print "<html>";
print "<head>";
print "<title>Dropdown Box - Sixth CGI Program</title>";
print "</head>";
print "<body>";
print "<h2> Selected Subject is $subject</h2>";
print "</body>";
print "</html>";

1;

在 CGI 中使用 Cookie

HTTP 协议是无状态协议。但是对于商业网站,需要在不同页面之间维护会话信息。例如,一个用户注册在完成许多页面后结束。但是如何在所有网页中维护用户的会话信息。

在许多情况下,使用 Cookie 是记住和跟踪偏好、购买、佣金和其他信息以获得更好的访客体验或网站统计的最有效方法。

工作原理

您的服务器以 Cookie 的形式向访问者的浏览器发送一些数据。浏览器可能会接受此 Cookie。如果接受,它将作为纯文本记录存储在访问者的硬盘驱动器上。现在,当访问者到达您网站上的另一个页面时,Cookie 可供检索。检索后,您的服务器就会知道/记住存储的内容。

Cookie 是一个包含 5 个可变长度字段的纯文本数据记录 -

  • Expires - Cookie 将过期的日期。如果为空,则 Cookie 将在访问者退出浏览器时过期。

  • Domain - 您网站的域名。

  • Path - 设置 Cookie 的目录或网页的路径。如果您想从任何目录或页面检索 Cookie,则此字段可以为空。

  • Secure - 如果此字段包含“secure”一词,则 Cookie 只能使用安全服务器检索。如果此字段为空,则不存在此类限制。

  • Name=Value - Cookie 以键值对的形式设置和检索。

设置 Cookie

将 Cookie 发送到浏览器非常简单。这些 Cookie 将与 HTTP 标头一起发送。假设您想将 UserID 和 Password 作为 Cookie 设置。因此,操作如下 -

#!/usr/bin/perl

print "Set-Cookie:UserID=XYZ;\n";
print "Set-Cookie:Password=XYZ123;\n";
print "Set-Cookie:Expires=Tuesday, 31-Dec-2007 23:12:40 GMT";\n";
print "Set-Cookie:Domain=www.tutorialspoint.com;\n";
print "Set-Cookie:Path=/perl;\n";
print "Content-type:text/html\r\n\r\n";
...........Rest of the HTML Content....

通过此示例,您必须已了解如何设置 Cookie。我们使用Set-Cookie HTTP 标头来设置 Cookie。

在此,可以选择设置 Cookie 属性,如 Expires、Domain 和 Path。值得注意的是,Cookie 在发送魔法行“Content-type:text/html\r\n\r\n”之前设置。

检索 Cookie

检索所有已设置的 Cookie 非常简单。Cookie 存储在 CGI 环境变量 HTTP_COOKIE 中,并且它们将具有以下形式。

key1=value1;key2=value2;key3=value3....

以下是如何检索 Cookie 的示例。

#!/usr/bin/perl
$rcvd_cookies = $ENV{'HTTP_COOKIE'};
@cookies = split /;/, $rcvd_cookies;

foreach $cookie ( @cookies ) {
   ($key, $val) = split(/=/, $cookie); # splits on the first =.
   $key =~ s/^\s+//;
   $val =~ s/^\s+//;
   $key =~ s/\s+$//;
   $val =~ s/\s+$//;
	
   if( $key eq "UserID" ) {
      $user_id = $val;
   } elsif($key eq "Password") {
      $password = $val;
   }
}

print "User ID  = $user_id\n";
print "Password = $password\n";

This will produce following result
User ID = XYZ
Password = XYZ123

CGI 模块和库

您将在互联网上找到许多内置模块,这些模块为您提供直接函数以在您的 CGI 程序中使用。以下是重要的模块。

广告