天天看點

CGI簡介 --用C來寫CGI程式簡要指南

1. 什麼是CGI?

CGI 是通用網關接口(Common Gateway Interface)的縮寫. 它主要用于伺服器端動态輸出用戶端的請求(如,HTML頁面/二進制檔案). 也就是說用戶端請求參數不同, 伺服器端會給出不同的應答結果..

CGI 标準将這個接口定義的非常簡單 (即: WEB 伺服器收到用戶端的請求後通過環境變量和标準輸入(stdin)将資料傳遞給CGI程式, CGI程式通過标準輸出(stdout) 将資料傳回給用戶端). 是以隻要能操作标準輸入/輸出的程式語言都可以CGI程式, Perl/C++/JAVA/VB等.

2. CSP/ASP/JSP/PHP/PERL 與CGI程式的關系?

嚴格來講, 它們全都是CGI的變種, 因為它們的操作原理都是CGI. 而在又在CGI的基礎上作了進一步的包裝, 屏蔽了CGI的與程式語言相關的接口. 如從環境變量和标準輸出中擷取參數被包裝成 getParameter(),将資料輸出到标準輸出被包裝成 “=”, print(), echo() 等. 萬變沒離其蹤.

3.為什麼要包裝?

如同将TCP/IP協定進行分層一樣, 目的都是簡化操作的難度. CSP/ASP/JSP/PHP/PERL等都提供了各自的操作接口, 另外CSP/ASP/JSP/PHP等直接将 C/C++ /VBS/JS/JAVA/PHP語句嵌入到HTML模闆檔案中, 還能很好地對輸出流程進行控制.

4. 為什麼還直接用CGI呢?.

目前說直接用CGI主要是指直接用 C/C++/PERL等編寫CGI源檔案, 它們共同的缺點就是沒用HTML模闆檔案進行流程控制, 輸出操作相對複雜些. 但直接用 C/C++編寫CGI還具有如下優勢和原因:

(1)高效率, C/C++ 不像PERL/VBS/JS等解釋執行語言運作時解釋執行源檔案中的語句. 同時這一點仍非JAVA/PHP等所能及. 是以C/C++仍是許多WEB應用的首選, 特點是大型WEB應用中.

(2)嵌入式裝置(如PDA/數位産品/通信産品)WEB應用的首選, 目前幾乎所有的嵌入式裝置都直接用C語言開發, 而CPU/記憶體/外存等的限制幾乎根本不可能安裝如PERL/ASP/JSP的運作環境, 是以嵌入式裝置上C開發CGI幾乎仍是唯一選擇.

5. 将 C 直接嵌入到HTML中叫CSP嗎?

是的, C 語言天然好的"移植性/高效性/靈活性", 一直以來都是最受程式員青睐的語言, 現在用CSP 技術我們就可以輕松地将 C 語句直接嵌入到 HTML 源檔案中了, 它程式設計過程跟ASP/JSP/PHP 幾乎一樣. 甚至有些時候, 就可以直接拿 JSP/PHP 的源檔案作為 CSP 的源檔案了, 因為它們都用 <% 和 %> 進行标記.

 用C來寫CGI程式簡要指南

一、CGI概述

  CGI(Common Gateway Interface: 公用網關接口)規定了Web伺服器調用其他可執行程式(CGI程 序)的接口協定标準。Web伺服器通過調用CGI程式實作和Web浏覽器的互動,也就是CGI程式接受Web浏覽器發送給Web伺服器的資訊,進行處理, 将響應結果再回送給Web伺服器及Web浏覽器。CGI程式一般完成Web網頁中表單(Form)資料的處理、資料庫查詢和實作與傳統應用系統的內建等工作。CGI程式可以用任何程式設計語言編寫,如Shell腳本語言、Perl、Fortran、Pascal、C語言等。但是用C語言編寫的CGI程式具有執行速度快、安全性高(因為C語言程式是編譯執行且不可被修改)等特點。

  CGI接口标準包括标準輸入、環境變量、标準輸出三部分。

  1.标準輸入

  CGI程式像其他可執行程式一樣,可通過标準輸入(stdin)從Web伺服器得到輸入資訊,如Form中的資料,這就是所謂的向CGI程式傳遞資料的POST方法。這意味着在作業系統指令行狀态可執行CGI程式,對CGI程式進行調試。POST方法是常用的方法,本文将以此方法為例,分析CGI程式設計的方法、過程和技巧。

  2.環境變量

作業系統提供了許多環境變量,它們定義了程式的執行環境,應用程式可以存取它們。Web伺服器和CGI接口又另外設定了自己的一些環境變量,用來向CGI程式傳遞一些重要的參數。CGI的GET方法還通過 環境變量QUERY-STRING向CGI程式傳遞Form中的資料。

  3.标準輸出

  CGI程式通過标準輸出(stdout)将輸出資訊傳送給Web伺服器。傳送給Web伺服器的資訊可以用各種格式,通常是以純文字或者HTML文本的形式,這樣我們就可以在指令行狀态調試CGI程式,并且得到它們的輸出。

  下面是一個簡單的CGI程式,它将HTML中Form的資訊直接輸出到Web浏覽器。

  

#include <stdio.h>

#include <stdib.h>

main()

{

    int i , n ;

    printf ("Content type: text/plain/n/n");

    n=0;

    if(getenv("CONTENT-LENGTH"))

         n=atoi(getenv("CONTENT-LENGTH"));

    for (i=0;i<n;i++)

        putchar(getchar());

     putchar ('/n');

     fflush(stdout);

}

  下面對此程式作一下簡要的分析。

  prinft (″Content type :text/plain/n/n″);

  此行通過标準輸出将字元串″Content type :text/plain/n/n″傳送給Web伺服器。它是一個MIME頭資訊,它告訴Web伺服器随後的輸出是以純ASCII文本的形式。請注意在這個頭資訊中有兩個新行符,這是因為Web伺服器需要在實際的文本資訊開始之前先看見一個空行。

  if (getenv(″CONTENT-LENGTH″))

  n=atoi (getenv(″CONTENT-LENGTH″));

  此行首先檢查環境變量CONTENT-LENGTH是否存在。Web伺服器在調用使用POST方法的CGI程式時設定此環境變量,它的文本值表示Web 伺服器傳送給CGI程式的輸入中的字元數目,是以我們使用函數atoi() 将此環境變量的值轉換成整數,并賦給變量n。請注意Web伺服器并不以檔案結束符來終止它的輸出,是以如果不檢查環境變量CONTENT- LENGTH,CGI程式就無法知道什麼時候輸入結束了。

  for (i=0;i<n;i++)

  putchar(getchar());

  此行從0循環到(CONTENT-LENGTH-1)次将标準輸入中讀到的每一個字元直接拷貝到标準輸出,也就是将所有的輸入以ASCII的形式回送給Web伺服器。

  通過此例,我們可将CGI程式的一般工作過程總結為如下幾點。

  1.通過檢查環境變量CONTENT-LENGTH,确定有多少輸入;

  2.循環使用getchar()或者其他檔案讀函數得到所有的輸入;

  3.以相應的方法處理輸入;

  4.通過″Contenttype:″頭資訊,将輸出資訊的格式告訴Web伺服器;

  5.通過使用printf()或者putchar()或者其他的檔案寫函數,将輸出傳送給Web伺服器。

  總之,CGI程式的主要任務就是從Web伺服器得到輸入資訊,進行處理,然後将輸出結果再送回給Web伺服器。

二、環境變量

  環境變量是文本串(名字/值對),可以被OS Shell或其他程式設定 ,也可以被其他程式通路。它們是Web伺服器傳遞資料給CGI程式的簡單手段,之是以稱為環境變量是因為它們是全局變量,任何程式都可以存取它們。

  下面是CGI程式設計中常常要用到的一些環境變量。

  HTTP-REFERER:調用該CGI程式的網頁的URL。

  REMOTE-HOST:調用該CGI程式的Web浏覽器的機器名和域名。

  REQUEST-METHOD:指的是當Web伺服器傳遞資料給CGI程式時所采用的方法,分為GET和POST兩種方法。GET方法僅通過環境變量 (如QUERY-STRING)傳遞資料給CGI程式,而POST方法通過環境變量和标準輸入傳遞資料給CGI程式,是以POST方法可較友善地傳遞較多的資料給CGI程式。

  SCRIPT-NAME:該CGI程式的名稱。

  QUERY-STRING:當使用POST方法時,Form中的資料最後放在QUERY-STRING中,傳遞給CGI程式。

  CONTENT-TYPE:傳遞給CGI程式資料的MIME類型,通常為″applica tion/x-www-form-url encodede″,它是從HTML Form中以POST方法傳遞資料給CGI程式的資料編碼類型,稱為URL編碼類型。

  CONTENT-LENGTH:傳遞給CGI程式的資料字元數(位元組數)。

  在C語言程式中,要訪向環境變量,可使用getenv()庫函數。例如:

  if (getenv (″CONTENT-LENGTH″))

   n=atoi(getenv (″CONTENT-LENGTH″));

  請注意程式中最好調用兩次getenv():第一次檢查是否存在該環境變量,第二次再使用該環境變量。這是因為函數getenv()在給定的環境變量名不存在時,傳回一個NULL(空)指針,如果你不首先檢查而直接引用它,當該環境變量不存在時會引起CGI程式崩潰。

三、From輸入的分析和解碼

  1.分析名字/值對

  當使用者送出一個HTML Form時,Web浏覽器首先對Form中的資料以名字/值對的形式進行編碼,并發送給Web伺服器,然後由Web伺服器傳遞給CGI程式。其格式如下:

  name1=value1&name2=value2&name3=value3&name4=value4&...

  其中名字是Form中定義的INPUT、SELECT或TEXTAREA等标置(Tag)名字,值是使用者輸入或選擇的标置值。這種格式即為URL編碼, 程式中需要對其進行分析和解碼。要分析這種資料流,CGI程式必須首先将資料流分解成一組組的名字/值對。這可以通過在輸入流中查找下面的兩個字元來完成。

  每當找到字元=,标志着一個Form變量名字的結束;每當找到字元& ,标志着一個Form變量值的結束。請注意輸入資料的最後一個變量的值不以&結束。

  一旦名字/值對分解後,還必須将輸入中的一些特殊字元轉換成相應的ASCII字元。這些特殊字元是:

  +:将+轉換成空格符;

  %xx:用其十六進制ASCII碼值表示的特殊字元。根據值xx将其轉換成相應的ASCII字元。

  對Form變量名和變量值都要進行這種轉換。下面是一個對Form資料進行分析并将結果回送給Web伺服器的CGI程式。

#include <stdlib.h>

#include <strings.h>

int htoi(char *);

    int i,n;

    char c;

    printf ("Contenttype: text/plain/n/n");

    if (getenv("CONTENT-LENGTH"))

        n=atoi(getenv("CONTENT-LENGTH"));

    for (i=0; i<n;i++)

    {

        int is-eq=0;

        c=getchar();

         switch (c)

         {

         case '&':

              c='/n';

               break;

         case '+':

              c=' ';

              break;

         case '%':

             {

                 char s[3]; 

                 s[0]=getchar();

                  s[1]=getchar();

                  s[2]=0;

                  c=htoi(s); 

                  i+=2;

             }

             break;

         case '=':

             c=':';

             is-eq=1;

             break; 

         };

           putchar(c);

           if (is-eq)

               putchar(' '); 

    }

      putchar ('/n');

        fflush(stdout);

  /* convert hex string to int */

  int htoi(char *s)

    {

        char *digits="0123456789ABCDEF";

        if (islower (s[0])) s[0]=toupper(s[0]);

         if (islower (s[1])) s[1]=toupper(s[1]);

          return 16 * (strchr(digits, s[0]) - strchr (digits,'0')) + (strchr(digits,s[1])-strchr(digits,'0'));

    }

 

  上面的程式首先輸出一個MIME頭資訊給Web伺服器,檢查輸入中的字元數,并循環檢查每一個字元。當發現字元為&時,意味着一個名字 /值對的結束,程式輸出一個空行;當發現字元為+時,将它轉換成空格; 當發現字元為%時,意味着一個兩字元的十六進制值的開始,調用htoi()函數将随後的兩個字元轉換為相應的ASCII字元;當發現字元為=時,意味着一個名字/值對的名字部分的結束,并将它轉換成字元:。最後将轉換後的字元輸出給Web伺服器。

四、産生HTML輸出

  CGI程式産生的輸出由兩部分組成:MIME頭資訊和實際的資訊。兩部分之間以一個空行分開。我們已經看到怎樣使用MIME頭資訊″ Content type :text/plain/n/n″和printf()、put char()等函數調用來輸 出純ASCII文本給Web伺服器。實際上,我們也可以使用MIME頭資訊″Content type :text/html/n/n″來輸出HTML源代碼給Web伺服器。請注意任何MIME頭資訊後必須有一個空行。一旦發送這個MIME頭資訊給We b伺服器後,Web浏覽器将認為随後的文本輸出為HTML源代碼,在HTML源代碼中可以使用任何HTML結構,如超鍊、圖像、Form,及對其他CGI 程 序的調用。也就是說,我們可以在CGI程式中動态産生HTML源代碼輸出 ,下面是一個簡單的例子。

  #include <stdio.h>

  #include <string.h>

  main()

  {

   printf(″Contenttype:text/html/n/n″);

  printf(″<html>/n″);

  printf(″<head><title>An HTML Page From a CGI</title></h ead>/n″);

  printf(″<body><br>/n″);

  printf(″<h2> This is an HTML page generated from with i n a CGI program..   .</h2>/n″);

  printf(″<hr><p>/n″);

  printf(″<a href="../output.html#two"><b> Go back to out put.html page <

  /b></a>/n″);

  printf(″</body>/n″);

  printf(″</html>/n″);

  fflush(stdout);

  }

  上面的CGI程式簡單地用printf()函數來産生HTML源代碼。請注意在輸出的字元串中如果有雙引号,在其前面必須有一個後斜字元/, 這是因為整個HTML代碼串已經在雙引号内,是以HTML代碼串中的雙引号符必須用一個後斜字元/來轉義。

五、結束語

  本文詳細分析了用C語言進行CGI程式設計的方法、過程和技巧。C語言的CGI程式雖然執行速度快、可靠性高,但是相對于Perl語言來說,C語言缺乏強有力的字元串處理能力,是以在實際應用中,應根據需 要和個人愛好來選擇合适的CGI程式設計語言。