今天整合apache和tomcat,結果發現整合過程中需要使用一個整合元件叫mod_jk.so,仔細研究了一下,這個.so檔案究竟為何方神聖能夠作為apache元件來使用,原來這個.so檔案就是Linux小的動态連結庫檔案,類似windows中的dll,而apache中大量使用了這種東東。
一、動态連結庫
通常情況下,對函數庫的連結是放在編譯時期(compile time)完成的。所有相關的對象檔案(object file)與牽涉到的函數庫(library)被連結合成一個可執行檔案(executable file)。程式在運作時,與函數庫再無瓜葛,因為所有需要的函數已拷貝到自己門下。是以這些函數庫被成為靜态庫(static libaray),通常檔案名為“libxxx.a”的形式。
其實,我們也可以把對一些庫函數的連結載入推遲到程式運作的時期(runtime)。這就是如雷貫耳的動态連結庫(dynamic link library)技術。
二、動态連結庫的特點與優勢
首先讓我們來看一下,把庫函數推遲到程式運作時期載入的好處:
1. 可以實作程序之間的資源共享。
什麼概念呢?就是說,某個程式的在運作中要調用某個動态連結庫函數的時候,作業系統首先會檢視所有正在運作的程式,看在記憶體裡是否已有此庫函數的拷 貝了。如果有,則讓其共享那一個拷貝;隻有沒有才連結載入。這樣的模式雖然會帶來一些“動态連結”額外的開銷,卻大大的節省了系統的記憶體資源。C的标準庫 就是動态連結庫,也就是說系統中所有運作的程式共享着同一個C标準庫的代碼段。
2. 将一些程式更新變得簡單。使用者隻需要更新動态連結庫,而無需重新編譯連結其他原有的代碼就可以完成整個程式的更新。Windows 就是一個很好的例子。
3. 甚至可以真正坐到連結載入完全由程式員在程式代碼中控制。
程式員在編寫程式的時候,可以明确的指明什麼時候或者什麼情況下,連結載入哪個動态連結庫函數。你可以有一個相當大的軟體,但每次運作的時候,由于 不同的操作需求,隻有一小部分程式被載入記憶體。所有的函數本着“有需求才調入”的原則,于是大大節省了系統資源。比如現在的軟體通常都能打開若幹種不同類 型的檔案,這些讀寫操作通常都用動态連結庫來實作。在一次運作當中,一般隻有一種類型的檔案将會被打開。是以直到程式知道檔案的類型以後再載入相應的讀寫 函數,而不是一開始就将所有的讀寫函數都載入,然後才發覺在整個程式中根本沒有用到它們。
三、動态連結庫的建立
由于動态連結庫函數的共享特性,它們不會被拷貝到可執行檔案中。在編譯的時候,編譯器隻會做一些函數名之類的檢查。在程式運作的時候,被調用的動态 連結庫函數被安置在記憶體的某個地方,所有調用它的程式将指向這個代碼段。是以,這些代碼必須實用相對位址,而不是絕對位址。在編譯的時候,我們需要告訴編 譯器,這些對象檔案是用來做動态連結庫的,是以要用位址不無關代碼(Position Independent Code (PIC))。
對gcc編譯器,隻需添加上 -fPIC 标簽,如:
gcc -fPIC -c file1.c
gcc -fPIC -c file2.c
gcc -shared libxxx.so file1.o file2.o
注意到最後一行,-shared 标簽告訴編譯器這是要建立動态連結庫。這與靜态連結庫的建立很不一樣,後者用的是 ar 指令。也注意到,動态連結庫的名字形式為 “libxxx.so” 字尾名為 “.so”
四、動态連結庫的使用
1.隐式調用 (靜态庫與此相同的方式)
使用動态連結庫,首先需要在編譯期間讓編譯器檢查一些文法與定義。
這與靜态庫的實用基本一樣,用的是 -Lpath 和 -lxxx 标簽。如:
gcc file1.o file2.o -Lpath -lxxx -o program.exe
編譯器會先在path檔案夾下搜尋libxxx.so檔案,如果沒有找到,繼續搜尋libxxx.a(靜态庫)。
在程式運作期間,也需要告訴系統去哪裡找你的動态連結庫檔案。在UNIX下是通過定義名為 LD_LIBRARY_PATH 的環境變量來實作的。隻需将path指派給此變量即可。csh 指令為:
setenv LD_LIBRARY_PATH your/full/path/to/dll
一切安排妥當後,你可以用 ldd 指令檢查是否連接配接正常。
ldd program.exe
動态連結庫*.so的編譯與使用
2.顯示調用
這種方式更加靈活。在代碼中需要調用的地方使用 #include <dlfcn.h>這個頭檔案中的以下函數來調用:
void *dlopen(const char *, int);
void *dlsym(void *, const char *);
int dlclose(void *);
char *dlerror(void);