2009年6月8日 星期一

[轉貼] php 使用技巧

PHP 5 引入了靜態成員的概念,作用和 PHP 4 的函數內部靜態變量一致,但前者是作為類的成員來使用。靜態變量和 Ruby 的類變量(class variable)差不多,所有類的實例共享同一個靜態變量。

<?php
class foo {
function bar() {
echo 'foobar';
}
}

$foo = new foo;
// instance way

$foo->bar();
// static way

foo::bar();
?>

靜態地調用非 static 成員,效率會比靜態地調用 static 成員慢 50-60%。主要是因為前者會產生 E_STRICT 警告,內部也需要做轉換。

使用類常量 (PHP5 ONLY)

貼士:PHP 5 新功能,類似於 C++ 的 const。

使用類常量的好處是:

- 編譯時解析,沒有額外開銷
- 雜湊表更小,所以內部查找更快
- 類常量僅存在於特定「命名空間」,所以雜湊名更短
- 代碼更乾淨,使除錯更方便

(暫時)不要使用 require/include_once

require/include_once 每次被調用的時候都會打開目標文件!

- 如果用絕對路徑的話,PHP 5.2/6.0 不存在這個問題
- 新版的 APC 緩存系統已經解決這個問題

文件 I/O 增加 => 效率降低

如果需要,可以自行檢查文件是否已被 require/include。

不要調用毫無意義的函數

有對應的常量的時候,不要使用函數。

<?php
php_uname('s') == PHP_OS;
php_version() == PHP_VERSION;
php_sapi_name() == PHP_SAPI;
?>
雖然使用不多,但是效率提升大概在 3500% 左右。

最快的 Win32 檢查

<?php
$is_win = DIRECTORY_SEPARATOR == '\\';
?>

- 不用函數
- Win98/NT/2000/XP/Vista/Longhorn/Shorthorn/Whistler...通用
- 一直可用

時間問題 (PHP>5.1.0 ONLY)

你如何在你的軟件中得知現在的時間?簡單,「time() time() again, you ask me...」。

不過總歸會調用函數,慢。

現在好了,用 $_SERVER['REQUEST_TIME'],不用調用函數,又省了。

加速 pcre

- 對於不用保存的結果,不用 (),一律用 (?:)

這樣 PHP 不用為符合的內容分配內存,省。效率提升 15% 左右。

- 能不用正則,就不用正則,在分析的時候仔細閱讀手冊「字符串函數」部分。有沒有你漏掉的好用的函數?

例如:

strpbrk()
strncasecmp()
strpos()/strrpos()/stripos()/strripos()

加速 strtr

如果需要轉換的全是單個字符的時候,用字符串而不是數組來做 strtr:


<?php
$addr = strtr($addr, "abcd", "efgh"); // good
$addr = strtr($addr, array('a' => 'e',
// ...
)); // bad
?>

效率提升:10 倍。

不要做無謂的替換

即使沒有替換,str_replace 也會為其參數分配內存。很慢!解決辦法:

- 用 strpos 先查找(非常快),看是否需要替換,如果需要,再替換

效率:

- 如果需要替換:效率幾乎相等,差別在 0.1% 左右。
- 如果不需要替換:用 strpos 快 200%。

邪惡的 @ 操作符

不要濫用 @ 操作符。雖然 @ 看上去很簡單,但是實際上後台有很多操作。用 @ 比起不用 @,效率差距:3 倍。

特別不要在循環中使用 @,在 5 次循環的測試中,即使是先用 error_reporting(0) 關掉錯誤,在循環完成後再打開,都比用 @ 快。

善用 strncmp

當需要對比「前 n 個字符」是否一樣的時候,用 strncmp/strncasecmp,而不是 substr/strtolower,更不是 PCRE,更千萬別提 ereg。strncmp/strncasecmp 效率最高(雖然高得不多)。

慎用 substr_compare (PHP5 ONLY)

按照上面的道理,substr_compare 應該比先 substr 再比較快咯。答案是否定的,除非:

- 無視大小寫的比較
- 比較較大的字符串

不要用常量代替字符串

為什麼:

- 需要查詢雜湊表兩次
- 需要把常量名轉換為小寫(進行第二次查詢的時候)
- 生成 E_NOTICE 警告
- 會建立臨時字符串

效率差別:700%。

不要把 count/strlen/sizeof 放到 for 循環的條件語句中

做法

<?php
for ($i = 0, $max = count($array);$i < $max; ++$i);
?>

效率提升相對於:

- count 50%
- strlen 75%

短的代碼不一定快

<?php
// longest
if ($a == $b) {
$str .= $a;
} else {
$str .= $b;
}

// longer
if ($a == $b) {
$str .= $a;
}
$str .= $b;

// short
$str .= ($a == $b ? $a : $b);
?>

你覺得哪個快?

效率比較:

- longest: 4.27
- longer: 4.43
- short: 4.76

不可思議?再來一個:

<?php
// original
$d = dir('.');
while (($entry = $d->read()) !== false) {
if ($entry == '.' || $entry == '..') {
continue;
}
}

// versus
glob('./*');

// versus (include . and ..)
scandir('.');
?>

哪個快?

效率比較:

- original: 3.37
- glob: 6.28
- scandir: 3.42
- original without OO: 3.14
- SPL (PHP5): 3.95

畫外音:從此也可以看出來 PHP5 的面向對象效率提高了很多,效率已經和純函數差得不太多了。

提高 PHP 文件訪問效率

需要包含其他 PHP 文件的時候,使用完整路徑,或者容易轉換的相對路徑。

<?php
include 'file.php'; // bad approach
incldue './file.php'; // good
include '/path/to/file.php'; // ideal
?>

物盡其用

PHP 有很多擴展和函數可用,在實現一個功能的之前,應該看看 PHP 是否有了這個功能?是否有更簡單的實現?

<?php
$filename = "./somepic.gif";
$handle = fopen($filename, "rb");
$contents = fread($handle, filesize($filename));
fclose($handle);

// vs. much simpler
file_get_contents('./somepic.gif');
?>

關於引用的技巧

引用可以:

- 簡化對複雜結構數據的訪問
- 優化內存使用


<?php
$a['b']['c'] = array();

// slow 2 extra hash lookups per access
for ($i = 0; $i < 5; ++$i)
$a['b']['c'][$i] = $i;

// much faster reference based approach
$ref =& $a['b']['c'];
for ($i = 0; $i < 5; ++$i)
$ref[$i] = $i;
?>


<?php
$a = 'large string';

// memory intensive approach
function a($str)
{
return $str.'something';
}

// more efficient solution
function a(&$str)
{
$str .= 'something';
}
?>

1.在可以用file_get_contents替代file、fopen、feof、fgets等系列方法的情況下,儘量用 file_get_contents,因為他的效率高得多!但是要注意file_get_contents在打開一個URL文件時候的PHP版本問題;

2.儘量的少進行文件操作,雖然PHP的文件操作效率也不低的;

3.優化Select SQL語句,在可能的情況下儘量少的進行Insert、Update操作(在update上,我被惡批過);

4.儘可能的使用PHP內部函數(但是我卻為了找個PHP裡面不存在的函數,浪費了本可以寫出一個自定義函數的時間,經驗問題啊!);

5.循環內部不要聲明變量,尤其是大變量:對象(這好像不只是PHP裡面要注意的問題吧?);

6.多維數組儘量不要循環嵌套賦值;

7.在可以用PHP內部字符串操作函數的情況下,不要用正則表達式;

8.foreach效率更高,儘量用foreach代替while和for循環;

9.用單引號替代雙引號引用字符串;

10.「用i+=1代替i=i+1。符合c/c++的習慣,效率還高」;

11.對global變量,應該用完就unset()掉;

以上的策略所涉及的問題,我都在實踐中遇到過,用了這些策略,效率提高了不少。試試吧。。。。

【下列文章您可能也有興趣】

沒有留言: