PHP程序中的一般漏洞

正如我們前面討論的那樣，include()和require()主要是為了支持程式碼庫，因為我們一般是把一些經常使用的函數放到一個獨立的文件中，這個獨立的文件就是程式碼庫，當需要使用其中的函數時，我們只要把這個程式碼庫包含到現用的文件中就可以了。

最初，人們開發和發怖PHP程序的時候，為了區別程式碼庫和主程序程式碼，一般是為程式碼庫文件設定一個「.inc」的副檔名，但是他們很快發現這是一個錯誤，因為這樣的文件無法被PHP解釋器正確解析為PHP程式碼。如果我們直接請求伺服器上的這種文件時，我們就會得到該檔案的來源碼，這是因為當把 PHP作為Apache的模組使用時，PHP解釋器是根據文件的副檔名來決定是否解析為PHP程式碼的。副檔名是站點管理員指定的，一般是「.php」，「.php3」和「.php4」。如果重要的組態資料被包含在沒有合適的副檔名的PHP文件中，那麼遠端攻擊者很容易得到這些訊息。

最簡單的解決方法就是給每個文件都指定一個PHP文件的副檔名，這樣可以很好的防止洩露來源碼的問題，但是又產生了新的問題，通過請求這個文件，攻擊者可能使本該在上下文環境中執行的程式碼獨立執行，這可能導致前面討論的全部攻擊。

下面是一個很明顯的例子：

In main.php:
$libDir = "/libdir";
$langDir = "$libdir/languages";

...

include("$libdir/loadlanguage.php":
?>

In libdir/loadlanguage.php:
...

include("$langDir/$userLang");
?>

當「libdir/loadlanguage.php」被「main.php」使用時是相當安全的，但是因為「libdir/loadlanguage」具有「.php」的副檔名，因此遠端攻擊者可以直接請求這個文件，並且可以任意指定「$langDir」和「$userLang」的值。
[Session文件]
PHP 4或更新的版本提供了對sessions的支持，它的主要作用是在PHP程序中儲存頁與頁之間的狀態訊息。例如，當一個用戶登入進入網站，他登入了這個事實以及誰登入進入這個網站都被儲存在session中，當他在網站中到處瀏覽時，所有的PHP程式碼都可以獲得這些狀態訊息。

事實上，當一個session啟動時（實際上是在組態文件中設定為在第一次請求時自動啟動），就會產生一個隨機的「session id」，如果遠端瀏覽器總是在傳送請求時提交這個「session id」的話，session就會一直保持。這通過Cookie很容易實現，也可以通過在每頁提交一個表單變數（包含「session id」）來實現。PHP程序可以用session註冊一個特殊的變數，它的值會在每個PHP指令碼結束後存在session文件中，也會在每個PHP指令碼開始前載入到變數中。下面是一個簡單的例子：

session_destroy(); // Kill any data currently in the session
$session_auth = "shaun";
session_register("session_auth"); // Register $session_auth as a session variable
?>

新版本的PHP都會自動把「$session_auth」的值設定為「shaun」，如果它們被修改的話，以後的指令碼都會自動接受修改後的值，這對無狀態的Web來說的確是種很不錯的工具，但是我們也應該小心。

一個很明顯的問題就是確保變數的確來自session，例如，給定上面的程式碼，如果後續的指令碼是下面這樣的話：

if (!empty($session_auth))
// Grant access to site here
?>

上面的程式碼假定如果「$session_auth」被置位的話，就是從session，而不是從用戶輸入來置位的，如果攻擊者通過表單輸入來置位的話，他就可以獲得對站點的訪問權。注意攻擊者必須在session註冊該變數之前使用這種攻擊方法，一旦變數被放進了session，就會覆蓋任何表單輸入。

Session資料一般是儲存在文件中（位置是可組態的，一般是「/tmp」），檔案名一般是類似「sess_」的形式，這個文件包含變數名稱，變數檔案類型，變數值和一些其它的資料。在多主機系統中，因為文件是以執行Web伺服器的用戶身份（一般是 nobody）儲存的，因此惡意的站點擁有者就可以通過新增一個session文件來獲得對其它站點的訪問，甚至可以檢查session文件中的敏感訊息。

Session機制也為攻擊者把自己的輸入儲存在遠端系統的文件中提供了另一個方便的地方，對於上面的例子來說，攻擊者需要在遠端系統放置一個包含PHP 程式碼的文件，如果不能利用文件上載做到的話，他通常會利用session為一個變數按照自己的意願賦一個值，然後猜測session文件的位置，而他知道檔案名是「php」，所以只需猜測目錄，而目錄一般就是「/tmp」。

另外，攻擊者可以任意指定「session id」（例如「hello」），然後用這個「session id」新增一個session文件（例如「/tmp/sess_hello」），但是「session id」只能是字母和數位組合。

[資料檔案類型]
PHP具有比較鬆散的資料檔案類型，變數的檔案類型依賴於它們所處的上下文環境。例如：「$hello」開始是字串串變數，值為「」，但是在求值時，就變成了整形變數「0」，這有時可能會導致一些意想不到的結果。如果「$hello」的值為「000」還是為「0」是不同的，empty()返回的結果也不會為真。

PHP中的陣列是關聯陣列，也就是說，陣列的索引是字串串型的。這意味著「$hello["000"]」和「$hello[0]」也是不同的。

開發程序的時候應該仔細地考慮上面的問題，例如，我們不應該在一個地方測試某個變數是否為「0」，而在另外的地方使用empty()來驗證。

[容易出現錯誤的函數]
我們在分析PHP程序中的漏洞時，如果能夠拿到來源碼的話，那麼一份容易出現錯誤的函數列表則是我們非常需要的。如果我們能夠遠端改變這些函數的參數的話，那麼我們就很可能發現其中的漏洞。下面是一份比較詳細的容易出現錯誤的函數列表：

require()：讀取指定文件的內容並且作為PHP程式碼解釋
include()：同上
eval()：把給定的字串串作為PHP程式碼執行
preg_replace()：當與「/e」開關一起使用時，取代字串串將被解釋為PHP程式碼

<指令執行>
exec()：執行指定的指令，返回執行結果的最後一行
passthru()：執行指定指令，返回所有結果到客戶瀏覽器
``：執行指定指令，返回所有結果到一個陣列
system()：同passthru()，但是不處理二進制資料
popen()：執行指定的指令，把輸入或輸出連線到PHP文件描述符

<文件洩露>
fopen()：開啟文件，並對應一個PHP文件描述符
readfile()：讀取文件的內容，然後輸出到客戶瀏覽器
file()：把整個文件內容讀到一個陣列中

譯者註：其實這份列表還不是很全，比如「mail()」等指令也可能執行指令，所以需要自己補充一下。
[如何增強PHP的安全性]
我在上面介紹的所有攻擊對於預設安裝的PHP 4都可以很好的實現，但是我已經重複了很多次，PHP的組態非常靈活，通過組態一些PHP選項，我們完全可能抵抗其中的一些攻擊。下面我按照實現的難度對一些組態進行了分類：

*低難度
**中低難度
***中高難度
****高難度

上面的分類只是個人的看法，但是我可以保證，如果你使用了PHP提供的所有選項的話，那麼你的PHP將是很安全的，即使是第三方的程式碼也是如此，因為其中很多功能已經不能使用。

**** 設定「register_globals」為「off」
這個選項會禁止PHP為用戶輸入新增全局變數，也就是說，如果用戶提交表單變數「hello」，PHP不會新增「$ hello」，而只會新增「HTTP_GET/POST_VARS[』hello']」。這是PHP中一個極其重要的選項，關閉這個選項，會給編程帶來很大的不便。

*** 設定「safe_mode」為「on」
開啟這個選項，會增加如下限制：
1．限制哪個指令可以被執行
2．限制哪個函數可以被使用
3．關於指令碼所有權和目標文件所有權的文件訪問限制
4．禁止文件上載功能
這對於ISP來說是一個偉大的選項，同時它也能極大地改進PHP的安全性。

** 設定「open_basedir」
這個選項可以禁止指定目錄之外的文件操作，有效地消除了本機文件或者是遠端文件被include()的攻擊，但是仍需要注意文件上載和session文件的攻擊。

** 設定「display_errors」為「off」，設定「log_errors」為「on」
這個選項禁止把錯誤資訊顯示在網頁中，而是記錄到日誌文件中，這可以有效的抵制攻擊者對目標指令碼中函數的探測。

* 設定「allow_url_fopen」為「off」

PHP 程式學習筆記本

2007年10月5日星期五