發新話題

[原創] prefork適合PHP網站拼速度,worker適合下載站

prefork適合PHP網站拼速度,worker適合下載站

worker MPM 對PHP的支持不好,請大家慎用。
建議支持超線程 或 Multi Processor - Multi Core 的 CPU 主機等,不需要用到PHP的服務器才選用,
特別是單純用APACHE做下載的服務器更理理想的選擇。
結論:
做下載站的伺服器(服務器)主機請用 worker
web網頁(動態、靜態)網站的伺服器(服務器)主機請用 服務器請用 prefork


apache官方參考文獻:
http://httpd.apache.org/docs-2.0/misc/perf-tuning.html#compiletime
引用:
Compile-Time Configuration Issues
Choosing an MPM
Apache 2.x supports pluggable concurrency models, called Multi-Processing Modules (MPMs). When building Apache, you must choose an MPM to use. There are platform-specific MPMs for some platforms: beos, mpm_netware, mpmt_os2, and mpm_winnt. For general Unix-type systems, there are several MPMs from which to choose. The choice of MPM can affect the speed and scalability of the httpd:

The worker MPM uses multiple child processes with many threads each. Each thread handles one connection at a time. Worker generally is a good choice for high-traffic servers because it has a smaller memory footprint than the prefork MPM.
The prefork MPM uses multiple child processes with one thread each. Each process handles one connection at a time. On many systems, prefork is comparable in speed to worker, but it uses more memory. Prefork's threadless design has advantages over worker in some situations: it can be used with non-thread-safe third-party modules, and it is easier to debug on platforms with poor thread debugging support.
For more information on these and other MPMs, please see the MPM documentation.
其實用apache2做下載站的話,./configure中應該用--with-mpm=worker參數,這樣才能發揮apache2的多線程機制。
vi ~apache_install_path/conf/httpd.conf

<IfModule prefork.c>
    StartServers 150
    MinSpareServers 10
    MaxSpareServers 20
    ServerLimit  20000
    MaxClients 20000
    MaxRequestsPerChild 10000
</IfModule>

MaxClients 乘以 ThreadsPerChild = 響應的請求數,可以根據自己的實際情況,更改ThreadsPerChild數目。

對於linux下,其實不能實現多線程模式,要加大MaxClients 的數目,solaris下,就非常優秀了。
apache2編譯的時候採用了默認的 --with-mpm=prefork模式,這種模式是兼容舊的軟件版本的,不能更好的發揮apache2的線成特性。
參考文獻:
LAMP 系統性能調優,第 2 部分: 優化 Apache 和 PHP
http://www.ibm.com/developerworks/cn/linux/l-tune-lamp-2.html
引用:
LAMP 系統性能調優,第 2 部分: 優化 Apache 和 PHP (是什麼降低了 Apache 的速度?如何使 PHP 發揮最大效力)作者:Sean A. Walberg, 高級網絡工程師

    如今,使用 LAMP(Linux®、Apache、MySQL 和 PHP/Perl)架構的應用程序不斷被開發和部署。但是,服務器管理員常常對應用程序本身幾乎沒有控制能力,因為應用程序是別人編寫的。這份 共三部分的系列文章 將討論許多服務器配置問題,這些配置會影響應用程序的性能。第二篇文章重點討論可為優化 Apache 和 PHP 而採取的措施。

Linux、 Apache、MySQL 和 PHP(或 Perl)是許多 Web 應用程序的 LAMP 架構的基礎。有很多基於 LAMP 組件的開源軟件包可用於解決各種各樣的問題。隨著應用程序負載的增加,底層基礎設施的瓶頸也會越來越明顯,其表現形式就是響應用戶請求的速度變慢。 上一篇文章 展示了調優 Linux 系統的方法,還介紹了 LAMP 和性能度量的基礎知識。本文重點關注 Web 服務器組件:Apache 和 PHP。

調優 Apache:
Apache 是一種高度可配置的軟件。它具有大量特性,但每一種都代價高昂。從某種程度上來說,調優 Apache 來說就是以恰當的方式分配資源,還涉及到將配置簡化為僅包含必要內容。

配置 MPM:
Apache 是模塊化的,因為可以輕鬆添加和移除特性。在 Apache 的核心,多處理模塊(Multi-Processing Module,MPM)提供了這種模塊化功能性 —— 管理網絡連接、調度請求。MPM 使您能夠使用線程,甚至能夠將 Apache 遷移到另外一個操作系統。

每次只能有一個 MPM 是活動的,必須使用 --with-mpm=(worker|prefork|event) 靜態編譯。

每個請求使用一個進程的傳統模型稱為 prefork。較新的線程化模型稱為 worker,它使用多個進程,每個進程又有多個線程,這樣就能以較低的開銷獲得更好的性能。最新的 event MPM 是一種實驗性的模型,為不同的任務使用單獨的線程池。要確定當前使用的是哪種 MPM,可執行 httpd -l。

選擇使用何種 MPM 取決於許多因素。在 event MPM 脫離實驗狀態之前,不應考慮這種模型,而是在使用線程和不使用線程之間作出選擇。表面上看來,如果所有底層模塊(包括 PHP 使用的所有庫)都是線程安全的,線程要優於分叉(forking)。而 Prefork 是較為安全的選擇;如果選擇了 worker,則應該謹慎測試。性能收益還取決於您的發布版所附帶的庫及硬件。

無論選擇了哪種 MPM,都必須恰當地配置它。一般而言,配置 MPM 包括告知 Apache 怎樣去控制有多少 worker 正在運行,它們是線程還是進程。prefork MPM 的重要配置選項如清單 1 所示。

清單 1. prefork MPM 的配置:

StartServers       50
MinSpareServers   15
MaxSpareServers   30
MaxClients       225
MaxRequestsPerChild  4000

       
編譯您自己的軟件:
最初使用 UNIX® 時,我堅持為加入系統的一切編譯軟件。最終,維護更新給我帶來了麻煩,所以我學會了如何構建包來簡化這一任務。後來我意識到,大多數時候我都在重複做發佈版做過的事情。現在,在很大程度上來說,我會儘可能堅持使用我所選擇的發布版提供的一切,僅在必要的時候使用自己的包。

類似地,您可能會發現,就可維護性而言,使用廠商提供的軟件包要優於使用最新、最棒的代碼。有些時候,性能調優和系統管理的目標會有所衝突。如果使用商業版的 Linux 或依賴於第三方支持,那麼可能不得不考慮廠商的支持。

如果您一意孤行,那麼請學會如何構建能與您的發布版協同工作的包,請學會如何將其集成到補丁系統之中。這將確保軟件,以及您作出的任何更改得到一致的構建,且能跨多個系統使用。還應訂閱恰當的郵件列表和 RSS 提要來及時獲得軟件更新。


prefork 模型會為每個請求創建一個新進程。多餘的進程保持空閒,以處理傳入的請求,這縮短了啟動延遲。只要 Web 服務器出現,預先完成的配置就會立即啟動 50 個進程,並盡力保持 10 到 20 個空閒服務器運行。進程數的硬性限制由 MaxClients 指定。儘管一個進程能夠處理許多相繼的請求,Apache 還是會取消連接數超過 4,000 以後的進程,這降低了內存洩漏的風險。

配置線程化 MPM 與之類似,不同之處只是必須確定使用多少線程和進程。Apache 文檔解釋了所有必要的參數和計算。

要經過幾次嘗試和出錯之後才能選好要使用的值。最重要的值是 MaxClients。目標在於允許足夠多的 workder 進程或線程運行,同時又不會導致服務器進行過度的交換。如果傳入的請求超出處理能力,那麼至少滿足此值的那些請求會得到服務,其他請求被阻塞。

如果 MaxClients 過高,那麼所有客戶機都將體驗到糟糕的服務,因為 Web 服務器會試圖換出一個進程,以使另一個進程能夠運行。而設得過低意味著可能會不必要地拒絕服務。查看高負載下運行的進程數量和所有 Apache 進程所導致的內存佔用情況對設置這個值很有幫助。如果 MaxClients 的值超過 256,必須將 ServerLimit 也設為同樣的數值,請仔細閱讀 MPM 的文檔,瞭解相關信息。

根據服務器的角色調優要啟動和保持空閒的服務器數量。如果服務器僅運行 Apache,那麼可以使用適中的值,如 清單 1 所示,因為這樣就能充分利用機器。如果系統中還有其他數據庫或服務器,那麼就應該限制運行中的空閒服務器的數量。

有效地使用選項和重寫:
Apache 處理的每個請求都要履行一套複雜的規則,這些規則指明了 Web 服務器必須遵循的約束或特殊指令。對文件夾的訪問可能按 IP 地址約束為某個特定文件夾,也可配置用戶名和密碼。這些選項還包含處理特定文件,例如,如果提供了一個目錄列表,該如何處理的文件,或輸出結果是否應壓縮。

這些配置以 httpd.conf 中容器的形式出現,例如 <Directory>,以便指定所用配置引用的是磁盤上的一個位置;再如 <Location>,表示引用是 URL 中的路徑。清單 2 展示了一個實際的 Directory 容器。

清單 2. 為根目錄應用的一個 Directory 容器:

<Directory />
    AllowOverride None
    Options FollowSymLinks
</Directory>

在清單 2 中,位於一對 Directory 和 /Directory 標記之間的配置應用於給定目錄和該目錄下的一切內容 —— 在本例中,這個給定目錄是根目錄。此處,AllowOverride 標記指出,用戶不允許重寫任何選項(稍後將進一步介紹)。FollowSymLinks 選項被啟用,它允許 Apache 查看之前的符號連接來為請求提供服務,即便文件位於包含 Web 文件的目錄之外。這就意味著,如果 Web 目錄中的一個文件是 /etc/passwd 的符號連接,Web 服務器將在請求時順利為該文件提供服務。如果使用了 -FollowSymLinks,該特性就會被禁用,同樣的請求將致使為客戶機返回錯誤。

最後這個場景正是導致兩方面關注的原因所在。第一個方面與性能有關。如果禁用了 FollowSymLinks,Apache 就必須檢查使用該文件名的所有組件(目錄和文件本身),以確保它們不是符號連接。這會帶來額外的開銷(磁盤操作)。另外一個稱為 FollowSymLinksIfOwnerMatch 的選項會在文件所有者與連接所有者相同時使用符號連接。為獲得最佳性能,請使用 清單 2 中的選項。

至此,有安全意識的讀者應該有了警惕的感覺。安全性永遠是功能性與風險之間的權衡。在我們的例子中,功能性是速度,而風險是允許對系統上的文件進行未經授權的訪問。緩解風險的措施之一是 LAMP 應用服務器通常專注於一種具體功能,用戶無法創建危險的符號連接。如果有必要啟用符號連接,那麼可以將其約束在文件系統的特定區域,如清單 3 所示。

清單 3. 將 FollowSymLinks 約束為一個用戶的目錄:

<Directory />
   Options FollowSymLinks
</Directory>

<Directory /home/*/public_html>
   Options -FollowSymLinks
</Directory>

在清單 3 中,一個用戶的主目錄中的任何 public_html 目錄及其所有子目錄都移除了 FollowSymLinks 選項。

如您所見,通過主服務器配置,可為每個目錄單獨配置選項。用戶可以自行重寫這種服務器配置(如果管理員通過 AllowOverrides 語句允許了這種操作),只需將一個 .htaccess 文件放入目錄即可。該文件包含額外的服務器指令,每次請求包含 .htaccess 文件的目錄時將加載並應用這些指令。儘管之前探討過系統沒有用戶的問題,但許多 LAMP 應用程序都利用這種功能性來控制訪問、實現 URL 重寫,因此有必要理解其工作原理。

即便 AllowOverrides 語句能阻止用戶去做您不希望他們做的事,Apache 也必須檢查 .htaccess 文件,看看是否有要完成的工作。父目錄可以指定由來自子目錄的請求處理的指令,這也就表示,Apache 必須搜索所請求文件的目錄樹的所有組件。可想而知,這會使每次請求都導致大量磁盤操作。

最簡單的解決方案是不允許重寫,這能消除 Apache 檢查 .htaccess 的需求。之後的任何特殊配置都將直接放在 httpd.conf 中。清單 4 顯示為對一個用戶的項目目錄進行密碼檢查向 httpd.conf 增加的代碼,而不是將其放入一個 .htaccess 文件並依賴於 AllowOverrides。

清單 4. 將 .htaccess 配置移入 httpd.conf

<Directory /home/user/public_html/project/>
  AuthUserFile /home/user/.htpasswd
  AuthName "uber secret project"
  AuthType basic
  Require valid-user
</Directory>

如果配置轉移到 httpd.conf 中,且 AllowOverrides 被禁用,磁盤的使用就能減少。一個用戶的項目可能不會吸引許多人來點擊,但設想一下,將這項技術應用於一個忙碌的站點時會有多麼強大。

有時不可能徹底消除 .htaccess 文件的使用。例如,在清單 5 中,一個選項被約束到文件系統的特定部分,重寫也可以是有作用域的。

清單 5. 限定 .htaccess 檢查的作用域:

<Directory />
  AllowOverrides None
</Directory>

<Directory /home/*/public_html>
  AllowOverrides AuthConfig
</Directory>

實現清單 5 之後,Apache 會在父目錄中查找 .htaccess 文件,但會在 public_html 目錄處停止,因為文件系統的其餘部分禁用了此功能。例如,如果請求的是一個映射到 /home/user/public_html/project/notes.html 的文件,那麼僅有 public_html 和 project 目錄被搜索。

關於每目錄單獨配置的最後一個提示就是:要按順序依次進行。任何介紹 Apache 調優的的文章都會告訴您,應通過 HostnameLookups off 指令禁用 DNS 查找,因為試圖反向解析連接到您的服務器的所有 IP 地址無疑是浪費資源。然而,基於主機名的任何約束都會迫使 Web 服務器對客戶機的 IP 地址執行反向查找,對其結果進行正向查找,以驗證該名稱的真實性。因此,避免使用基於客戶主機名的訪問控制,在必須使用時限定其作用域,這些都是明智的做法。

持久連接:
一個客戶機連接到 Web 服務器時,允許客戶機通過同一個 TCP 連接發出多個請求,這減少了與多個連接相關的延遲。在一個 Web 頁面引用了多幅圖片時,這就很有用:客戶機可以通過一個連接先請求頁面,再請求所有圖片。其缺點在於服務器上的 worker 進程必須等待客戶機要關閉的會話,之後才能轉到下一個請求。

Apache 使您能夠配置如何處理持久連接(稱為 keepalives)。httpd.conf 全局級的 KeepAlive 5 允許服務器在連接強制關閉之前處理一個連接上的 5 個請求。將此值設置為 0 將禁用持久連接。同樣位於全局級上的 KeepAliveTimeout 確定在會話關閉之前,Apache 將等待另外一個連接多久。

持久連接的處理並非 「一刀切」 式的配置。對於某些 Web 站點,禁用 keepalives 更合適(KeepAlive 0);而對於其他一些站點,啟用它會帶來巨大的收益。惟一的解決之道就是嘗試使用這兩種配置,自己觀察哪種更合適。但若啟用了 keepalives,使用較小的超時時間較為明智,例如 2,即 KeepAliveTimeout 2。這能確保希望發出另外一個請求的客戶機有充足的時間,還能確保 worker 進程不會一直空閒,等待可能永遠不會出現的下一個請求。

壓縮:
Web 服務器能夠在將輸出發回給客戶機之前壓縮它。這將使通過 Internet 發送的頁面更小,代價是 Web 服務器上的 CPU 週期。對於那些負擔得起 CPU 開銷的服務器來說,這是提高頁面下載速度的好辦法 —— 頁面壓縮後大小變為原來的三分之一這種事情並不罕見。

圖片通常已經是壓縮過的,因此壓縮應僅限於文本輸出。Apache 通過 mod_deflate 提供壓縮。儘管 mod_deflate 可輕鬆啟用,但它涉及到太多的複雜性,很多手冊都解釋了這些複雜的內容。本文不會介紹壓縮的配置,但提供了相應文檔的鏈接(參見 參考資料 部分)。

調優 PHP:
PHP 是運行應用程序代碼的引擎。應該僅安裝計劃使用的那些模塊,並配置您的 Web 服務器,使之僅為腳本文件(通常是以 .php 結尾的那些文件)使用 PHP,而非所有靜態文件。

操作碼緩存:
請求一個 PHP 腳本時,PHP 會讀取該腳本,並將其編譯為 Zend 操作碼,這是要執行的代碼的一種二進製表示形式。隨後,此操作碼由 PHP 執行並丟棄。操作碼緩存將保存這個編譯後的操作碼,並在下一次調用該頁面時重用它。這會節省很多時間。有多種緩存可用,我比較常用的是 eAccelerator。

要安裝 eAccelerator,您的計算機上需要有 PHP 開發庫。由於不同的 Linux 發佈版存放文件的位置不同,所以最好直接從 eAccelerator 的 Web 站點獲得安裝說明(參見 參考資料 部分獲得鏈接)。您的發布版也有可能已經包含了一個操作碼緩存,只需安裝即可。

無論如何在系統上安裝 eAccelerator,都有一些配置選項需要注意。配置文件通常是 /etc/php.d/eaccelerator.ini。eaccelerator.shm_size 定義共享高速緩存的大小,編譯後的腳本就存儲在這裡。該值的單位是兆字節(MB)。根據您的應用程序確定恰當的大小。eAccelerator 提供了一個腳本來顯示緩存的狀態,其中包含內存佔用,64MB 是個不錯的選擇(eaccelerator.shm_size="64")。如果您選擇的值未被接受,那麼必須修改內核的最大共享內存的大小。向 /etc/sysctl.conf 添加 kernel.shmmax=67108864,運行 sysctl -p 來使設置生效。kernel.shmmax 值的單位是字節。

如果共享內存的分配超出極限,eAccelerator 必須將舊腳本從內存中清除。默認情況下,這是被禁用的;eaccelerator.shm_ttl = "60" 指定:當 eAccelerator 用完共享內存時,60 秒內未被訪問的所有腳本都將被清除。

另一種流行的 eAccelerator 替代工具是 Alternative PHP Cache(APC)。Zend 的廠商也提供了一種商業操作碼緩存,包括一個進一步提高效率的優化器。

php.ini

PHP 的配置是在 php.ini 中完成的。四個重要的設置控制 PHP 可使用多少系統資源,如表 1 所列。

表 1. php.ini 中與資源相關的設置
設置        描述        建議值
max_execution_time        一個腳本可使用多少 CPU 秒         30
max_input_time        一個腳本等待輸入數據的時間有多長(秒)        60
memory_limit        在被取消之前,一個腳本可使用多少內存(字節)        32M
output_buffering        數據發送給客戶機之前,有多少數據(字節)需要緩存        4096

具體數字主要取決於您的應用程序。如果要從用戶處接收大文件,那麼 max_input_time 可能必須增加,可以在 php.ini 中修改,也可以通過代碼重寫它。與之類似,CPU 或內存佔用較多的程序也可能需要更大的設置值。目標就是緩解超標程序的影響,因此不建議全局禁用這些設置。關於 max_execution_time,還有一點需要注意:它表示進程的 CPU 時間,而不是絕對時間。因此一個進行大量 I/O 和少量計算的程序的運行時間可能遠遠超過 max_execution_time。這也是 max_input_time 可以大於 max_execution_time 的原因所在。

PHP 可執行的日誌記錄數是可配置的。在生產環境中,禁用除最重要的日誌以外的一切日誌記錄能夠減少磁盤寫操作。如果需要使用日誌來排除問題,那麼可以按需啟用日誌記錄。error_reporting = E_COMPILE_ERROR|E_ERROR|E_CORE_ERROR 將啟用足夠的日誌記錄,使您發現問題,同時從腳本中消除大量無用的內容。

結束語:
本文重點探討 Web 服務器的調優,包括 Apache 和 PHP。對於 Apache,總體的想法是消除 Web 服務器必須執行的多餘檢查,例如處理 .htaccess 文件。還必須調優所用的多處理模塊,以便在使用的系統資源和可供傳入請求使用的空閒 worker 之間找到平衡。對於 PHP,最好的事情就是安裝一個操作碼緩存。密切注意幾個資源設置也能確保腳本不會浪費系統資源,不會減慢系統處理其他任務的速度。

TOP

發新話題

本站所有圖文均屬網友發表,僅代表作者的觀點與本站無關,如有侵權請通知版主會盡快刪除。