NODEJS——HTTP實現分析

1、前言

目前,HTTP協議是互聯網上應用最為廣泛的一種網路協議,也是前端er接觸最多的一種協議。通過閱讀http模塊在nodejs中的實現,能夠更深入的了解HTTP協議。HTTP協議是基於TCP協議之上的應用層協議,它的實現離不開TCP/IP協議族。而具體到代碼實現,http模塊依賴於net模塊。

如下圖所示:在nodejs中,http通過net模塊傳輸數據,得到數據之後依靠HTTP_PARSER對數據進行解析。

2、源碼

啟動一個HTTP服務

nodejs中啟動一個HTTP服務很簡單,就是實例化一個Server對象,並且監聽某個埠:

SERVER類

Server類繼承於net.Server,並監聽』connection『事件。

Advertisements

在Server類中,主要做了兩件事:

  1. 初始化NET模塊並建立TCP網路監聽

  2. 監聽自身的request事件。

當客戶端請求到來的時候,Server實例會首先監聽到 'connection' 事件,建立起TCP連接並在connectionListener中暴露出socket對象。接下來,HTTP模塊就通過socket對象與客戶端進行數據交互。

當一個請求到來后,Server會觸發自身的 request 事件,調用 requestListener 方法,即創建Server實例時傳入的回調函數。

socket對象類似於TCP協議的一個實現,可以通過它與客戶端進行數據交互;

在 connectionListener 函數中,還初始化了parser實例,並給它綁定了一個 onIncoming 函數 HTTP Parser;

Advertisements

整個解析流程在 connectionListener 中進行,socket 通過 'data' 事件獲取TCP推入的數據。

當socket獲取到數據之後,會先對數據進行解析,即:parser.excute(),解析工具是parser。值得說明的是,作者為了實現對 parser 的重用, parser是從一個'FreeList池'中獲取的。

Parser(common.js) 繼承自 HTTPParser(node_http_parser.cc),並綁定了4個解析周期回調函數:parserOnHeaders、parserOnHeadersComplete、parserOnBody、parserOnMessageComplete。

在執行 parser.execute 過程中,HTTPParser 會在解析周期內回調這些函數。

解析的具體流程

1、TCP數據到達時, 先執行execute()

2、順藤摸瓜,我們發現parser.excute 就是 Excute(node_http_parser.cc)。而Excute也只是一個外包而已,具體工作是http_parser_excute(http_parser.c)搞定的。

node_http_parser.cc 只是對 http_parser.c 的一層包裝,http_parser.c依靠對外暴露的7個回調周期函數與 node_http_parser.cc 進行數據交互。

想了解更多,請查看http_parser.c文檔(https://github.com/nodejs/http-parser)

3、http_parser.c只有兩類回調:HTTP_CB、HTTP_DATA_CB。通過重載的方式,在這兩類函數中註冊了8個周期函數,如下圖:

4、雖然http_parser註冊有8個回調函數,但 node_http_parser.cc 對外只暴露出四個周期函數:

  • parserOnHeaders

  • parserOnHeadersComplete

  • parserOnBody

  • parserOnMessageComplete

5、當 http_parser.c 解析到 on_headers_complete 時,執行HTTP_CB(on_headers_complete)回調函數,如圖:

函數內會執行 kOnHeadersComplete 回調函數,即:parserOnHeadersComplete 函數(common.js)

6、此時請求頭解析基本完成,接下來創建一個IncomingMessage的實例,然後把請求頭數據包裝到該實例上。

執行 onIncoming 回調函數,並把得到的IncomingMessage實例作為參數傳遞進去。

7、 在 parserOnIncoming 中,創建一個ServerResponse實例。

具備了req、res兩個實例,接下來觸發Server監聽的 request 事件。

在 Server 實例化時的,requestListener是作為函數參數對 request 事件進行監聽的。

8、回到Server創建時:

綜上所述,http_parser 解析完 header 之後,就會觸發 request 事件。

那body數據放到哪裡呢,其實body數據會一直放到流裡面,直到用戶使用data事件接收數據。也就是說,觸發request的時候,body並不會被解析。

3、流程梳理

完整的http請求是這樣的:

  • 客戶端發起HTTP請求,首先觸發Server端的connection事件,建立TCP鏈接。

  • Server接收到connection事件后,建立TCP連接,並暴露出套接字,通過套接字監聽'data'事件;初始化http-parser,為後續解析數據備用。

  • HTTP請求數據到達Server端,parser執行execute方法進行解析,請求頭解析成功后,通過回調觸發request事件。

  • 至此,我們在Server回調函數中,就接收到了此次http請求的request

4、結語

由於nodejs不少底層庫都是C++/C編寫的,在閱讀、調試的過程中非常不便。我自己在讀源碼的時候,也只是著重看的JS部分源碼。比如,TCP的三次握手、四次揮手,就沒深究它的實現細節啦。 以上分析沒有涉及到http-body的解析,對於有body的網路請求,實際情況要更加複雜一些,還有一些細節沒有完全搞清。等下次總結、分享,我會盡量把漏掉細節都補上。

Advertisements

你可能會喜歡