CGI编程(CGI Programming)
什么是CGI?
通用网关接口(CGI)是一组标准,用于定义如何在Web服务器和自定义脚本之间交换信息。
CGI规范目前由NCSA维护,NCSA定义CGI如下 -
The Common Gateway Interface, or CGI, is a standard for external gateway programs to interface with information servers such as HTTP servers.
目前的版本是CGI/1.1,CGI/1.2正在进行中。
网页浏览 (Web Browsing)
为了理解CGI的概念,让我们看看当我们点击网页上可用的超链接来浏览特定网页或URL时会发生什么。
您的浏览器使用HTTP协议联系Web服务器并要求URL,即网页文件名。
Web Server将检查URL并查找所请求的文件名。 如果Web服务器找到该文件,则它将文件发送回浏览器而不进一步执行,否则会发送一条错误消息,指示您已请求错误的文件。
Web浏览器从Web服务器获取响应,并在未找到文件的情况下显示接收的文件内容或错误消息。
但是,可以以这样的方式设置HTTP服务器,以便每当请求某个目录中的文件时不发回该文件; 相反,它作为一个程序执行,无论该程序输出什么结果,都会被发回给您的浏览器进行显示。 这可以通过使用Web服务器中可用的特殊功能来完成,它被称为Common Gateway Interface或CGI,并且由服务器执行以产生最终结果的此类程序称为CGI脚本。 这些CGI程序可以是PERL脚本,Shell脚本,C或C ++程序等。
CGI架构图 (CGI Architecture Diagram)
Web服务器支持和配置
在继续进行CGI编程之前,请确保您的Web服务器支持CGI功能,并配置为处理CGI程序。 Web服务器要执行的所有CGI程序都保存在预先配置的目录中。 该目录称为CGI目录,按照惯例,它被命名为/ cgi-bin。 按照惯例,Perl CGI文件将扩展为.cgi 。
第一个CGI程序 (First CGI Program)
这是一个链接到名为hello.cgi的CGI脚本的简单链接。 该文件保存在/cgi-bin/目录中,它具有以下内容。 在运行CGI程序之前,请确保使用chmod 755 hello.cgi UNIX命令更改文件模式。
#!/usr/bin/perl
print "Content-type:text/html\r\n\r\n";
print '<html>';
print '<head>';
print '<title>Hello Word - First CGI Program</title>';
print '</head>';
print '<body>';
print '<h2>Hello Word! This is my first CGI program</h2>';
print '</body>';
print '</html>';
1;
现在,如果单击hello.cgi链接,则请求转到在/ cgi-bin目录中搜索hello.cgi的Web服务器,执行它并生成任何结果,Web服务器将该结果发送回Web浏览器,如下所示 -
<h3>Hello Word! This is my first CGI program</h3>
这个hello.cgi脚本是一个简单的Perl脚本,它将输出写在STDOUT文件即屏幕上。 有一个重要的额外功能,第一行打印Content-type:text/html\r\n\r\n 。 该行被发送回浏览器并指定要在浏览器屏幕上显示的内容类型。 现在你必须掌握CGI的基本概念,你可以使用Perl编写许多复杂的CGI程序。 此脚本还可以与任何其他exertnal系统交互,以交换诸如数据库,Web服务或任何其他复杂接口之类的信息。
了解HTTP标头
第一行Content-type:text/html\r\n\r\n是HTTP标头的一部分,它被发送到浏览器,以便浏览器可以理解来自服务器端的传入内容。 所有HTTP标头将采用以下形式 -
HTTP Field Name: Field Content
例如 -
<font color="Red">Content-type:</font><font color="blue">text/html\r\n\r\n</font>
很少有其他重要的HTTP标头,您将在CGI编程中经常使用它们。
Sr.No. | 标题和说明 |
---|---|
1 | Content-type: String MIME字符串,用于定义要返回的内容的格式。 示例是Content-type:text/html |
2 | Expires: Date String 信息失效的日期。 浏览器应该使用它来决定何时需要刷新页面。 有效日期字符串的格式应为01 Jan 1998 12:00:00 GMT。 |
3 | Location: URL String 应返回的URL而不是请求的URL。 您可以使用此字段将请求重定向到任何其他位置。 |
4 | Last-modified: String 上次修改文件的日期。 |
5 | Content-length: String 返回数据的长度(以字节为单位)。 浏览器使用此值报告文件的估计下载时间。 |
6 | Set-Cookie: String 设置通过string传递的cookie |
CGI环境变量 (CGI Environment Variables)
所有CGI程序都可以访问以下环境变量。 在编写任何CGI程序时,这些变量都起着重要作用。
Sr.No. | 变量名称和描述 |
---|---|
1 | CONTENT_TYPE 内容的数据类型。 客户端将附加内容发送到服务器时使用。 例如文件上传等 |
2 | CONTENT_LENGTH 查询信息的长度。 它仅适用于POST请求 |
3 | HTTP_COOKIE 以键和值对的形式返回设置的cookie。 |
4 | HTTP_USER_AGENT User-Agent请求标头字段包含有关发起请求的用户代理的信息。 它的Web浏览器名称。 |
5 | PATH_INFO CGI脚本的路径。 |
6 | QUERY_STRING 使用GET方法请求发送的URL编码信息。 |
7 | REMOTE_ADDR 发出请求的远程主机的IP地址。 这对于日志记录或身份验证非常有用。 |
8 | REMOTE_HOST 发出请求的主机的完全限定名称。 如果此信息不可用,则可以使用REMOTE_ADDR获取IR地址。 |
9 | REQUEST_METHOD 用于发出请求的方法。 最常用的方法是GET和POST。 |
10 | SCRIPT_FILENAME CGI脚本的完整路径。 |
11 | SCRIPT_NAME CGI脚本的名称。 |
12 | SERVER_NAME 服务器的主机名或IP地址。 |
13 | SERVER_SOFTWARE 服务器正在运行的软件的名称和版本。 |
这是一个小型CGI程序,用于列出Web服务器支持的所有CGI变量。 单击此链接可查看结果获取环境
#!/usr/bin/perl
print "Content-type: text/html\n\n";
print "<font size=+1>Environment</font>\n";
foreach (sort keys %ENV) {
print "<b>$_</b>: $ENV{$_}<br>\n";
}
1;
提出“文件下载”对话框?
有时,您希望在用户单击链接的位置提供选项,它会向用户弹出“文件下载”对话框,而不是显示实际内容。 这非常简单,将通过HTTP标头获得。
此HTTP标头将与上一节中提到的标头不同。 例如,如果您想从给定链接下载FileName文件,那么它的语法如下 -
#!/usr/bin/perl
# HTTP Header
print "Content-Type:application/octet-stream; name = \"FileName\"\r\n";
print "Content-Disposition: attachment; filename = \"FileName\"\r\n\n";
# Actual File Content will go hear.
open( FILE, "<FileName" );
while(read(FILE, $buffer, 100) ) {
print("$buffer");
}
GET和POST方法 (GET and POST Methods)
当您需要将一些信息从浏览器传递到Web服务器并最终传递到处理请求的CGI程序时,您必须遇到很多情况。 最常见的浏览器使用两种方法将此信息传递给Web服务器。 这些方法是GET方法和POST方法。 我们一个一个地检查一下。
使用GET方法传递信息
GET方法将附加到页面URL本身的编码用户信息发送。 页面和编码信息由?分隔。 性格如下 -
http://www.test.com/cgi-bin/hello.cgi?key1=value1&key2=value2
GET方法是将信息从浏览器传递到Web服务器的defualt方法,它会生成一个长字符串,显示在浏览器的Location:框中。 如果您有密码或其他敏感信息要传递给服务器,则不应使用GET方法。 GET方法有大小限制:请求字符串中只能传递1024个字符。
此信息使用QUERY_STRING标头传递,并可通过QUERY_STRING环境变量在CGI程序中访问,您可以在CGI程序中解析和使用该环境变量。
您可以通过简单地将键和值对与任何URL连接来传递信息,也可以使用HTML
标记使用GET方法传递信息。简单URL示例:获取方法
这是一个简单的URL,它将使用GET方法将两个值传递给hello_get.cgi程序。
cgi-bin/hello_get.cgi?first_name=ZARA&last_name=ALI下面是hello_get.cgi脚本,用于处理Web浏览器提供的输入。
#!/usr/bin/perl
local ($buffer, @pairs, $pair, $name, $value, %FORM);
# Read in text
$ENV{'REQUEST_METHOD'} =~ tr/a-z/A-Z/;
if ($ENV{'REQUEST_METHOD'} eq "GET") {
$buffer = $ENV{'QUERY_STRING'};
}
# Split information into name/value pairs
@pairs = split(/&/, $buffer);
foreach $pair (@pairs) {
($name, $value) = split(/=/, $pair);
$value =~ tr/+/ /;
$value =~ s/%(..)/pack("C", hex($1))/eg;
$FORM{$name} = $value;
}
$first_name = $FORM{first_name};
$last_name = $FORM{last_name};
print "Content-type:text/html\r\n\r\n";
print "<html>";
print "<head>";
print "<title>Hello - Second CGI Program</title>";
print "</head>";
print "<body>";
print "<h2>Hello $first_name $last_name - Second CGI Program</h2>";
print "</body>";
print "</html>";
1;
简单形式示例:GET方法
这是一个简单的示例,它使用HTML FORM和提交按钮传递两个值。 我们将使用相同的CGI脚本hello_get.cgi来处理此输入。
<FORM action = "/cgi-bin/hello_get.cgi" method = "GET">
First Name: <input type = "text" name = "first_name"> <br>
Last Name: <input type = "text" name = "last_name">
<input type = "submit" value = "Submit">
</FORM>
以下是上述表格编码的实际输出。 现在,您可以输入名字和姓氏,然后单击“提交”按钮以查看结果。
名字: 姓:使用POST方法传递信息
将信息传递给CGI程序的更可靠的方法是POST方法。 这包装信息的方式与GET方法完全相同,但不是在文本字符串之后将其作为文本字符串发送? 在URL中,它将其作为单独的消息作为HTTP标头的一部分发送。 Web服务器以标准输入的形式将此消息提供给CGI脚本。
下面是修改后的hello_post.cgi脚本,用于处理Web浏览器提供的输入。 该脚本将处理GET以及POST方法。
#!/usr/bin/perl
local ($buffer, @pairs, $pair, $name, $value, %FORM);
# Read in text
$ENV{'REQUEST_METHOD'} =~ tr/a-z/A-Z/;
if ($ENV{'REQUEST_METHOD'} eq "POST") {
read(STDIN, $buffer, $ENV{'CONTENT_LENGTH'});
} else {
$buffer = $ENV{'QUERY_STRING'};
}
# Split information into name/value pairs
@pairs = split(/&/, $buffer);
foreach $pair (@pairs) {
($name, $value) = split(/=/, $pair);
$value =~ tr/+/ /;
$value =~ s/%(..)/pack("C", hex($1))/eg;
$FORM{$name} = $value;
}
$first_name = $FORM{first_name};
$last_name = $FORM{last_name};
print "Content-type:text/html\r\n\r\n";
print "<html>";
print "<head>";
print "<title>Hello - Second CGI Program</title>";
print "</head>";
print "<body>";
print "<h2>Hello $first_name $last_name - Second CGI Program</h2>";
print "</body>";
print "</html>";
1;
让我们再次采用与上面相同的例子,它使用HTML FORM和提交按钮传递两个值。 我们将使用CGI脚本hello_post.cgi来处理此输入。
<FORM action = "/cgi-bin/hello_post.cgi" method = "POST">
First Name: <input type = "text" name = "first_name"> <br>
Last Name: <input type = "text" name = "last_name">
<input type = "submit" value = "Submit">
</FORM>
以下是上述表单编码的实际输出,您输入名字和姓氏,然后单击提交按钮以查看结果。
名字: 姓:将复选框数据传递给CGI程序
如果需要选择多个选项,则使用复选框。 以下是包含两个复选框的表单的示例HTML代码。
<form action = "/cgi-bin/checkbox.cgi" method = "POST" target = "_blank">
<input type = "checkbox" name = "maths" value = "on"> Maths
<input type = "checkbox" name = "physics" value = "on"> Physics
<input type = "submit" value = "Select Subject">
</form>
此代码的结果如下:
数学 物理下面是checkbox.cgi脚本,用于处理Web浏览器为单选按钮提供的输入。
#!/usr/bin/perl
local ($buffer, @pairs, $pair, $name, $value, %FORM);
# Read in text
$ENV{'REQUEST_METHOD'} =~ tr/a-z/A-Z/;
if ($ENV{'REQUEST_METHOD'} eq "POST") {
read(STDIN, $buffer, $ENV{'CONTENT_LENGTH'});
} else {
$buffer = $ENV{'QUERY_STRING'};
}
# Split information into name/value pairs
@pairs = split(/&/, $buffer);
foreach $pair (@pairs) {
($name, $value) = split(/=/, $pair);
$value =~ tr/+/ /;
$value =~ s/%(..)/pack("C", hex($1))/eg;
$FORM{$name} = $value;
}
if( $FORM{maths} ) {
$maths_flag ="ON";
} else {
$maths_flag ="OFF";
}
if( $FORM{physics} ) {
$physics_flag ="ON";
} else {
$physics_flag ="OFF";
}
print "Content-type:text/html\r\n\r\n";
print "<html>";
print "<head>";
print "<title>Checkbox - Third CGI Program</title>";
print "</head>";
print "<body>";
print "<h2> CheckBox Maths is : $maths_flag</h2>";
print "<h2> CheckBox Physics is : $physics_flag</h2>";
print "</body>";
print "</html>";
1;
将单选按钮数据传递给CGI程序
当只需要选择一个选项时,使用单选按钮。 以下是带有两个单选按钮的表单的示例HTML代码 -
<form action = "/cgi-bin/radiobutton.cgi" method = "POST" target = "_blank">
<input type = "radio" name = "subject" value = "maths"> Maths
<input type = "radio" name = "subject" value = "physics"> Physics
<input type = "submit" value = "Select Subject">
</form>
此代码的结果如下:
数学 物理下面是radiobutton.cgi脚本,用于处理Web浏览器为单选按钮提供的输入。
#!/usr/bin/perl
local ($buffer, @pairs, $pair, $name, $value, %FORM);
# Read in text
$ENV{'REQUEST_METHOD'} =~ tr/a-z/A-Z/;
if ($ENV{'REQUEST_METHOD'} eq "POST") {
read(STDIN, $buffer, $ENV{'CONTENT_LENGTH'});
} else {
$buffer = $ENV{'QUERY_STRING'};
}
# Split information into name/value pairs
@pairs = split(/&/, $buffer);
foreach $pair (@pairs) {
($name, $value) = split(/=/, $pair);
$value =~ tr/+/ /;
$value =~ s/%(..)/pack("C", hex($1))/eg;
$FORM{$name} = $value;
}
$subject = $FORM{subject};
print "Content-type:text/html\r\n\r\n";
print "<html>";
print "<head>";
print "<title>Radio - Fourth CGI Program</title>";
print "</head>";
print "<body>";
print "<h2> Selected Subject is $subject</h2>";
print "</body>";
print "</html>";
1;
将文本区域数据传递给CGI程序
当多行文本必须传递给CGI程序时,使用textarea元素。 以下是带有TEXTAREA框的表单的示例HTML代码 -
<form action = "/cgi-bin/textarea.cgi" method = "POST" target = "_blank">
<textarea name = "textcontent" cols = 40 rows = 4>
Type your text here...
</textarea>
<input type = "submit" value = "Submit">
</form>
此代码的结果如下:
下面是textarea.cgi脚本,用于处理Web浏览器提供的输入。
#!/usr/bin/perl
local ($buffer, @pairs, $pair, $name, $value, %FORM);
# Read in text
$ENV{'REQUEST_METHOD'} =~ tr/a-z/A-Z/;
if ($ENV{'REQUEST_METHOD'} eq "POST") {
read(STDIN, $buffer, $ENV{'CONTENT_LENGTH'});
} else {
$buffer = $ENV{'QUERY_STRING'};
}
# Split information into name/value pairs
@pairs = split(/&/, $buffer);
foreach $pair (@pairs) {
($name, $value) = split(/=/, $pair);
$value =~ tr/+/ /;
$value =~ s/%(..)/pack("C", hex($1))/eg;
$FORM{$name} = $value;
}
$text_content = $FORM{textcontent};
print "Content-type:text/html\r\n\r\n";
print "<html>";
print "<head>";
print "<title>Text Area - Fifth CGI Program</title>";
print "</head>";
print "<body>";
print "<h2> Entered Text Content is $text_content</h2>";
print "</body>";
print "</html>";
1;
将下拉框数据传递给CGI程序
当我们有许多可用选项时,会使用下拉框,但只会选择一个或两个。 以下是带有一个下拉框的表单的示例HTML代码
<form action = "/cgi-bin/dropdown.cgi" method = "POST" target = "_blank">
<select name = "dropdown">
<option value = "Maths" selected>Maths</option>
<option value = "Physics">Physics</option>
</select>
<input type = "submit" value = "Submit">
</form>
此代码的结果如下:
数学物理下面是dropdown.cgi脚本,用于处理Web浏览器提供的输入。
#!/usr/bin/perl
local ($buffer, @pairs, $pair, $name, $value, %FORM);
# Read in text
$ENV{'REQUEST_METHOD'} =~ tr/a-z/A-Z/;
if ($ENV{'REQUEST_METHOD'} eq "POST") {
read(STDIN, $buffer, $ENV{'CONTENT_LENGTH'});
} else {
$buffer = $ENV{'QUERY_STRING'};
}
# Split information into name/value pairs
@pairs = split(/&/, $buffer);
foreach $pair (@pairs) {
($name, $value) = split(/=/, $pair);
$value =~ tr/+/ /;
$value =~ s/%(..)/pack("C", hex($1))/eg;
$FORM{$name} = $value;
}
$subject = $FORM{dropdown};
print "Content-type:text/html\r\n\r\n";
print "<html>";
print "<head>";
print "<title>Dropdown Box - Sixth CGI Program</title>";
print "</head>";
print "<body>";
print "<h2> Selected Subject is $subject</h2>";
print "</body>";
print "</html>";
1;
在CGI中使用cookie (Using Cookies in CGI)
HTTP协议是无状态协议。 但是对于商业网站,需要在不同页面之间维护会话信息。 例如,一个用户注册在跨越许多页面的事务之后结束。 但是如何在所有网页上维护用户的会话信息?
在许多情况下,使用Cookie是记住和跟踪偏好,购买,佣金以及更好的访问者体验或网站统计所需的其他信息的最有效方法。
它是如何运作的 (How It Works)
您的服务器以cookie的形式向访问者的浏览器发送一些数据。 浏览器可以接受cookie。 如果是,则将其作为纯文本记录存储在访问者的硬盘上。 现在,当访问者到达您网站上的另一个页面时,该Cookie可供检索。 检索后,您的服务器知道/记住存储的内容。
Cookie是5个可变长度字段的纯文本数据记录 -
Expires - Cookie过期的日期。 如果这是空白,则访问者退出浏览器时cookie将过期。
Domain - 您网站的域名。
Path - 设置cookie的目录或网页的路径。 如果要从任何目录或页面检索cookie,这可能为空。
Secure - 如果此字段包含单词“secure”,则只能使用安全服务器检索cookie。 如果此字段为空,则不存在此类限制。
Name = Value - 以键和值对的形式设置和回顾Cookie。
设置Cookies (Setting up Cookies)
将cookie发送到浏览器非常容易。 这些cookie将与HTTP标头一起发送。 假设您要将UserID和密码设置为cookie。 所以它将按如下方式完成 -
#!/usr/bin/perl
print "Set-Cookie:UserID = XYZ;\n";
print "Set-Cookie:Password = XYZ123;\n";
print "Set-Cookie:Expires = Tuesday, 31-Dec-2007 23:12:40 GMT";\n";
print "Set-Cookie:Domain = www.xnip.cn;\n";
print "Set-Cookie:Path = /perl;\n";
print "Content-type:text/html\r\n\r\n";
...........Rest of the HTML Content goes here....
这里我们使用Set-Cookie HTTP标头来设置cookie。 可以选择设置Expires,Domain和Path等Cookie属性。 重要的是要注意在发送魔术行之前设置cookie "Content-type:text/html\r\n\r\n 。
检索Cookies (Retrieving Cookies)
检索所有设置的cookie非常容易。 Cookie存储在CGI环境变量HTTP_COOKIE中,它们将具有以下形式。
key1 = value1;key2 = value2;key3 = value3....
以下是如何检索Cookie的示例。
#!/usr/bin/perl
$rcvd_cookies = $ENV{'HTTP_COOKIE'};
@cookies = split /;/, $rcvd_cookies;
foreach $cookie ( @cookies ) {
($key, $val) = split(/=/, $cookie); # splits on the first =.
$key =~ s/^\s+//;
$val =~ s/^\s+//;
$key =~ s/\s+$//;
$val =~ s/\s+$//;
if( $key eq "UserID" ) {
$user_id = $val;
} elsif($key eq "Password") {
$password = $val;
}
}
print "User ID = $user_id\n";
print "Password = $password\n";
这将产生以下结果,前提是在调用检索cookie脚本之前已设置cookie。
User ID = XYZ
Password = XYZ123
CGI模块和库
您可以在互联网上找到许多内置模块,它们为您提供在CGI程序中使用的直接功能。 以下是重要的一次。