1. 什麼是CGI?
CGI 是通用網關接口(Common Gateway Interface)的縮寫. 它主要用于伺服器端動态輸出用戶端的請求(如,HTML頁面/二進制檔案). 也就是說用戶端請求參數不同, 伺服器端會給出不同的應答結果..
CGI 标準将這個接口定義的非常簡單 (即: WEB 伺服器收到用戶端的請求後通過環境變量和标準輸入(stdin)将資料傳遞給CGI程式, CGI程式通過标準輸出(stdout) 将資料傳回給用戶端). 是以隻要能操作标準輸入/輸出的程式語言都可以CGI程式, Perl/C++/JAVA/VB等.
2. CSP/ASP/JSP/PHP/PERL 與CGI程式的關系?
嚴格來講, 它們全都是CGI的變種, 因為它們的操作原理都是CGI. 而在又在CGI的基礎上作了進一步的包裝, 屏蔽了CGI的與程式語言相關的接口. 如從環境變量和标準輸出中擷取參數被包裝成 getParameter(),将資料輸出到标準輸出被包裝成 “=”, print(), echo() 等. 萬變沒離其蹤.
3.為什麼要包裝?
如同将TCP/IP協定進行分層一樣, 目的都是簡化操作的難度. CSP/ASP/JSP/PHP/PERL等都提供了各自的操作接口, 另外CSP/ASP/JSP/PHP等直接将 C/C++ /VBS/JS/JAVA/PHP語句嵌入到HTML模闆檔案中, 還能很好地對輸出流程進行控制.
4. 為什麼還直接用CGI呢?.
目前說直接用CGI主要是指直接用 C/C++/PERL等編寫CGI源檔案, 它們共同的缺點就是沒用HTML模闆檔案進行流程控制, 輸出操作相對複雜些. 但直接用 C/C++編寫CGI還具有如下優勢和原因:
(1)高效率, C/C++ 不像PERL/VBS/JS等解釋執行語言運作時解釋執行源檔案中的語句. 同時這一點仍非JAVA/PHP等所能及. 是以C/C++仍是許多WEB應用的首選, 特點是大型WEB應用中.
(2)嵌入式裝置(如PDA/數位産品/通信産品)WEB應用的首選, 目前幾乎所有的嵌入式裝置都直接用C語言開發, 而CPU/記憶體/外存等的限制幾乎根本不可能安裝如PERL/ASP/JSP的運作環境, 是以嵌入式裝置上C開發CGI幾乎仍是唯一選擇.
5. 将 C 直接嵌入到HTML中叫CSP嗎?
是的, C 語言天然好的"移植性/高效性/靈活性", 一直以來都是最受程式員青睐的語言, 現在用CSP 技術我們就可以輕松地将 C 語句直接嵌入到 HTML 源檔案中了, 它程式設計過程跟ASP/JSP/PHP 幾乎一樣. 甚至有些時候, 就可以直接拿 JSP/PHP 的源檔案作為 CSP 的源檔案了, 因為它們都用 <% 和 %> 進行标記.
用C來寫CGI程式簡要指南
一、CGI概述
CGI(Common Gateway Interface: 公用網關接口)規定了Web伺服器調用其他可執行程式(CGI程 序)的接口協定标準。Web伺服器通過調用CGI程式實作和Web浏覽器的互動,也就是CGI程式接受Web浏覽器發送給Web伺服器的資訊,進行處理, 将響應結果再回送給Web伺服器及Web浏覽器。CGI程式一般完成Web網頁中表單(Form)資料的處理、資料庫查詢和實作與傳統應用系統的內建等工作。CGI程式可以用任何程式設計語言編寫,如Shell腳本語言、Perl、Fortran、Pascal、C語言等。但是用C語言編寫的CGI程式具有執行速度快、安全性高(因為C語言程式是編譯執行且不可被修改)等特點。
CGI接口标準包括标準輸入、環境變量、标準輸出三部分。
1.标準輸入
CGI程式像其他可執行程式一樣,可通過标準輸入(stdin)從Web伺服器得到輸入資訊,如Form中的資料,這就是所謂的向CGI程式傳遞資料的POST方法。這意味着在作業系統指令行狀态可執行CGI程式,對CGI程式進行調試。POST方法是常用的方法,本文将以此方法為例,分析CGI程式設計的方法、過程和技巧。
2.環境變量
作業系統提供了許多環境變量,它們定義了程式的執行環境,應用程式可以存取它們。Web伺服器和CGI接口又另外設定了自己的一些環境變量,用來向CGI程式傳遞一些重要的參數。CGI的GET方法還通過 環境變量QUERY-STRING向CGI程式傳遞Form中的資料。
3.标準輸出
CGI程式通過标準輸出(stdout)将輸出資訊傳送給Web伺服器。傳送給Web伺服器的資訊可以用各種格式,通常是以純文字或者HTML文本的形式,這樣我們就可以在指令行狀态調試CGI程式,并且得到它們的輸出。
下面是一個簡單的CGI程式,它将HTML中Form的資訊直接輸出到Web浏覽器。
#include <stdio.h>
#include <stdib.h>
main()
{
int i , n ;
printf ("Content type: text/plain/n/n");
n=0;
if(getenv("CONTENT-LENGTH"))
n=atoi(getenv("CONTENT-LENGTH"));
for (i=0;i<n;i++)
putchar(getchar());
putchar ('/n');
fflush(stdout);
}
下面對此程式作一下簡要的分析。
prinft (″Content type :text/plain/n/n″);
此行通過标準輸出将字元串″Content type :text/plain/n/n″傳送給Web伺服器。它是一個MIME頭資訊,它告訴Web伺服器随後的輸出是以純ASCII文本的形式。請注意在這個頭資訊中有兩個新行符,這是因為Web伺服器需要在實際的文本資訊開始之前先看見一個空行。
if (getenv(″CONTENT-LENGTH″))
n=atoi (getenv(″CONTENT-LENGTH″));
此行首先檢查環境變量CONTENT-LENGTH是否存在。Web伺服器在調用使用POST方法的CGI程式時設定此環境變量,它的文本值表示Web 伺服器傳送給CGI程式的輸入中的字元數目,是以我們使用函數atoi() 将此環境變量的值轉換成整數,并賦給變量n。請注意Web伺服器并不以檔案結束符來終止它的輸出,是以如果不檢查環境變量CONTENT- LENGTH,CGI程式就無法知道什麼時候輸入結束了。
for (i=0;i<n;i++)
putchar(getchar());
此行從0循環到(CONTENT-LENGTH-1)次将标準輸入中讀到的每一個字元直接拷貝到标準輸出,也就是将所有的輸入以ASCII的形式回送給Web伺服器。
通過此例,我們可将CGI程式的一般工作過程總結為如下幾點。
1.通過檢查環境變量CONTENT-LENGTH,确定有多少輸入;
2.循環使用getchar()或者其他檔案讀函數得到所有的輸入;
3.以相應的方法處理輸入;
4.通過″Contenttype:″頭資訊,将輸出資訊的格式告訴Web伺服器;
5.通過使用printf()或者putchar()或者其他的檔案寫函數,将輸出傳送給Web伺服器。
總之,CGI程式的主要任務就是從Web伺服器得到輸入資訊,進行處理,然後将輸出結果再送回給Web伺服器。
二、環境變量
環境變量是文本串(名字/值對),可以被OS Shell或其他程式設定 ,也可以被其他程式通路。它們是Web伺服器傳遞資料給CGI程式的簡單手段,之是以稱為環境變量是因為它們是全局變量,任何程式都可以存取它們。
下面是CGI程式設計中常常要用到的一些環境變量。
HTTP-REFERER:調用該CGI程式的網頁的URL。
REMOTE-HOST:調用該CGI程式的Web浏覽器的機器名和域名。
REQUEST-METHOD:指的是當Web伺服器傳遞資料給CGI程式時所采用的方法,分為GET和POST兩種方法。GET方法僅通過環境變量 (如QUERY-STRING)傳遞資料給CGI程式,而POST方法通過環境變量和标準輸入傳遞資料給CGI程式,是以POST方法可較友善地傳遞較多的資料給CGI程式。
SCRIPT-NAME:該CGI程式的名稱。
QUERY-STRING:當使用POST方法時,Form中的資料最後放在QUERY-STRING中,傳遞給CGI程式。
CONTENT-TYPE:傳遞給CGI程式資料的MIME類型,通常為″applica tion/x-www-form-url encodede″,它是從HTML Form中以POST方法傳遞資料給CGI程式的資料編碼類型,稱為URL編碼類型。
CONTENT-LENGTH:傳遞給CGI程式的資料字元數(位元組數)。
在C語言程式中,要訪向環境變量,可使用getenv()庫函數。例如:
if (getenv (″CONTENT-LENGTH″))
n=atoi(getenv (″CONTENT-LENGTH″));
請注意程式中最好調用兩次getenv():第一次檢查是否存在該環境變量,第二次再使用該環境變量。這是因為函數getenv()在給定的環境變量名不存在時,傳回一個NULL(空)指針,如果你不首先檢查而直接引用它,當該環境變量不存在時會引起CGI程式崩潰。
三、From輸入的分析和解碼
1.分析名字/值對
當使用者送出一個HTML Form時,Web浏覽器首先對Form中的資料以名字/值對的形式進行編碼,并發送給Web伺服器,然後由Web伺服器傳遞給CGI程式。其格式如下:
name1=value1&name2=value2&name3=value3&name4=value4&...
其中名字是Form中定義的INPUT、SELECT或TEXTAREA等标置(Tag)名字,值是使用者輸入或選擇的标置值。這種格式即為URL編碼, 程式中需要對其進行分析和解碼。要分析這種資料流,CGI程式必須首先将資料流分解成一組組的名字/值對。這可以通過在輸入流中查找下面的兩個字元來完成。
每當找到字元=,标志着一個Form變量名字的結束;每當找到字元& ,标志着一個Form變量值的結束。請注意輸入資料的最後一個變量的值不以&結束。
一旦名字/值對分解後,還必須将輸入中的一些特殊字元轉換成相應的ASCII字元。這些特殊字元是:
+:将+轉換成空格符;
%xx:用其十六進制ASCII碼值表示的特殊字元。根據值xx将其轉換成相應的ASCII字元。
對Form變量名和變量值都要進行這種轉換。下面是一個對Form資料進行分析并将結果回送給Web伺服器的CGI程式。
#include <stdlib.h>
#include <strings.h>
int htoi(char *);
int i,n;
char c;
printf ("Contenttype: text/plain/n/n");
if (getenv("CONTENT-LENGTH"))
n=atoi(getenv("CONTENT-LENGTH"));
for (i=0; i<n;i++)
{
int is-eq=0;
c=getchar();
switch (c)
{
case '&':
c='/n';
break;
case '+':
c=' ';
break;
case '%':
{
char s[3];
s[0]=getchar();
s[1]=getchar();
s[2]=0;
c=htoi(s);
i+=2;
}
break;
case '=':
c=':';
is-eq=1;
break;
};
putchar(c);
if (is-eq)
putchar(' ');
}
putchar ('/n');
fflush(stdout);
/* convert hex string to int */
int htoi(char *s)
{
char *digits="0123456789ABCDEF";
if (islower (s[0])) s[0]=toupper(s[0]);
if (islower (s[1])) s[1]=toupper(s[1]);
return 16 * (strchr(digits, s[0]) - strchr (digits,'0')) + (strchr(digits,s[1])-strchr(digits,'0'));
}
上面的程式首先輸出一個MIME頭資訊給Web伺服器,檢查輸入中的字元數,并循環檢查每一個字元。當發現字元為&時,意味着一個名字 /值對的結束,程式輸出一個空行;當發現字元為+時,将它轉換成空格; 當發現字元為%時,意味着一個兩字元的十六進制值的開始,調用htoi()函數将随後的兩個字元轉換為相應的ASCII字元;當發現字元為=時,意味着一個名字/值對的名字部分的結束,并将它轉換成字元:。最後将轉換後的字元輸出給Web伺服器。
四、産生HTML輸出
CGI程式産生的輸出由兩部分組成:MIME頭資訊和實際的資訊。兩部分之間以一個空行分開。我們已經看到怎樣使用MIME頭資訊″ Content type :text/plain/n/n″和printf()、put char()等函數調用來輸 出純ASCII文本給Web伺服器。實際上,我們也可以使用MIME頭資訊″Content type :text/html/n/n″來輸出HTML源代碼給Web伺服器。請注意任何MIME頭資訊後必須有一個空行。一旦發送這個MIME頭資訊給We b伺服器後,Web浏覽器将認為随後的文本輸出為HTML源代碼,在HTML源代碼中可以使用任何HTML結構,如超鍊、圖像、Form,及對其他CGI 程 序的調用。也就是說,我們可以在CGI程式中動态産生HTML源代碼輸出 ,下面是一個簡單的例子。
#include <stdio.h>
#include <string.h>
main()
{
printf(″Contenttype:text/html/n/n″);
printf(″<html>/n″);
printf(″<head><title>An HTML Page From a CGI</title></h ead>/n″);
printf(″<body><br>/n″);
printf(″<h2> This is an HTML page generated from with i n a CGI program.. .</h2>/n″);
printf(″<hr><p>/n″);
printf(″<a href="../output.html#two"><b> Go back to out put.html page <
/b></a>/n″);
printf(″</body>/n″);
printf(″</html>/n″);
fflush(stdout);
}
上面的CGI程式簡單地用printf()函數來産生HTML源代碼。請注意在輸出的字元串中如果有雙引号,在其前面必須有一個後斜字元/, 這是因為整個HTML代碼串已經在雙引号内,是以HTML代碼串中的雙引号符必須用一個後斜字元/來轉義。
五、結束語
本文詳細分析了用C語言進行CGI程式設計的方法、過程和技巧。C語言的CGI程式雖然執行速度快、可靠性高,但是相對于Perl語言來說,C語言缺乏強有力的字元串處理能力,是以在實際應用中,應根據需 要和個人愛好來選擇合适的CGI程式設計語言。