Node.js 101 — 單執行緒、非同步、非阻塞 I/O 與事件迴圈

用事件驅動、非阻塞的 Node.js 去開發快速、可擴展的 I/O 密集型的應用程式吧！

Wenchin

Published in

Wenchin Rolls Around

13 min readMar 18, 2020

用了 Node.js 寫應用程式幾個月了，今天來認真理解一下什麼是事件驅動、非阻塞、非同步輸入輸出……，為什麼要有它們，還有這些東西跟 Node.js 執行環境特性的關聯。

什麼是 Node.js?

維基百科跟我們說：

Node.js 是能夠在伺服器端運行 JavaScript 的開放原始碼、跨平台 JavaScript 執行環境。Node.js採用Google開發的V8執行程式碼，使用事件驅動、非阻塞和非同步輸入輸出模型等技術來提高效能，可最佳化應用程式的傳輸量和規模。這些技術通常用於資料密集的即時應用程式。

以下會由 Node.js 的特性切入，從非同步輸入 / 輸出，談到非阻塞 I/O 處理，再談事件驅動，最後總結 Node.js 適用的應用程式類型。

什麼是輸入 / 輸出 (I/O)？

I/O 就是 input / output 的簡稱，是程式跟系統記憶體或網路的互動，如讀取、寫入檔案、發送 HTTP 請求、對資料庫 CRUD 操作等等。

I/O 密集 vs. CPU 密集

一個應用程式花較多時間在 CPU 計算還是等待 I/O，決定了它屬於計算密集型 (CPU-bound)，或是 I/O 密集型 (I/O-bound)。

當 CPU 快到一定的程度之後，許多的程式之所以效率不彰，主要是卡在 I/O 的處理上，所以現在很多設計關鍵就是要改善 I/O 效率、避免程序卡在 I/O 太久，這會比去升級記憶體和擴展 CPU 更經濟實惠。

以一個網頁開發者的角度來看，因為大部分的網頁應用程式都不太需要太多的 CPU 計算，反而是花時間慢慢等大量的 I/O 處理完畢（動不動就要打 HTTP 請求啊、跟資料庫要資料啊、讀取或更新檔案啊……等等），所以處理 I/O 的速度會是網頁應用程式效能的關鍵。

要怎樣才能讓等待 I/O 時不要卡住後續程式碼？

可以讓程式一邊慢慢等、一邊繼續執行其他部分程式碼（所以使用者不會因為啥都點不動、得不到網頁回覆，怒而離開網頁）的方法主要有兩種：

多執行緒 (multi-threaded)：使用阻塞 (blocking) I/O 的設計
單執行緒 (single-threaded)：使用非阻塞 (non-blocking) I/O 設計 + 提供非同步 (asynchronous) 處理

阻塞 I/O 是怎樣？非阻塞又是怎樣？

阻塞就是 I/O 的處理阻擋了其他後續程式碼的執行。

給個生動的例子：

阻塞後續程式碼的執行，就好像我去家裡附近的滷味攤買滷味，點好了交給老闆之後就要站在旁邊等，哪裡也不能去，因為我想吃到熱騰騰的滷味。如果我回家了然後每隔十分鐘再過來，可能滷味已經冷掉了，我不想這樣，我買的又不是冰滷味。所以我只能站在旁邊癡癡等，癡癡冷，才能在第一時間就拿到剛起鍋的滷味。
阻塞（blocking）的對照就叫做非阻塞（non-blocking），意思就是不會阻擋後續程式碼的執行，就好像我去百貨公司美食街點餐一樣，點完以後店家會給我一個呼叫器（本體是紅茶的那間速食店也有），我拿到呼叫器以後就可以回位子上等，或我想先去逛個街也可以。等到餐點準備好的時候，呼叫器就會響，我就可以去店家領取餐點，不用在原地傻傻地等。

所以都是些誰在塞？Node.js 塞不塞？

Java, Python, Ruby… 語言：多執行緒 (multi-threaded) ，本身就懂阻塞 I/O

程序會乖乖等待網路或記憶體作業完成才會繼續往下，等待期間跑這個作業的執行緒不能做其他事。如果要達到上面提到的「讓等待 I/O 時不要卡住其他程式碼」，在 Java 的解法就是開一個新的執行緒，直到任務完成，再告訴你的主執行緒「我做完囉！」

* 其實現在 Java 跟 Python 也都有了非同步的 interface，可是在使用上比 Node.js 這種本來就沒阻塞式的語言來的麻煩。

Node.js：單執行緒 (single-threaded)，非阻塞 I/O + 提供非同步函式

單執行緒聽起來很潮。但如果 Node.js 是非阻塞式設計，那要怎麼等那些讀取檔案、操作資料庫、HTTP 請求的 I/O 完成呢？總不能還沒等到東西就隨便給個回覆或直接不等它，讓接下來的程式碼繼續運行吧？

所以「非同步 (asynchronous)」的出現就變得非常關鍵。

Node.js 如何實現非同步？

非同步（或是異步）函式的作用就是讓程序不用被阻擋等著 I/O 處理完，可以先跑下一行程式碼，等函式中的 callback 被呼叫的時候再執行要接著做的事。

JavaScript 實現非同步的方法不斷演進著：從 callback 函式、promises 到最新的 async-await 函式。

同步 vs. 非同步

拿 Node.js 的 File System 模組作為一個簡單的例子，以下是同步的寫法（程序會停止前進，直到跑完 readFileSync）：

const fs = require('fs');   
const data = fs.readFileSync('/file.md'); // blocks here until file is read

以下是非同步的寫法（程序會繼續往下處理後續程式碼，等readFile跑完再回來對資料doSomething）：

const fs = require('fs');   
fs.readFile('/file.md', (err, data) => {
     if (err) throw err; 
     doSomething(data);
});

為什麼 Node.js 有了非同步函式、非阻塞 I/O，就可以實現單執行緒設計？

雖然 Google V8 JavaScript 引擎是單執行緒設計，它底層的 C++ API 並不是。這代表當我們呼叫一些非同步的程式碼 (如 file system 和 child processes) 時，Node 會請它底層的 Libuv 去跑這些程式碼，跑完執行 callback 或拋出錯誤。

Libuv 在面對非同步作業時，會開啟執行緒池 (thread pool / worker pool)，預設共有四個執行緒（也就是 worker threads），運算這些 I/O 用的方式是事件迴圈 (event loop)，我們接下來會討論。

所以就算 V8 處理程式碼時只有一個執行緒，一旦進到了 Libuv 手上，它還是會幫你把會阻塞的 I/O 分工到執行緒池中交給不同的執行緒處理，直到 callback 發生才丟回應用程式讓你知道。

* 你可以創造或管理自己的執行緒池，其中一個直接的方法就是透過子程序 (Child Process)，但使用子程序上應該特別小心，避免幫每個 client 都建一個新的子程序，因為一旦收到客戶端請求的速度比創造、管理子程序來得快的情況發生時，很容易讓伺服器變成一個 fork bomb（程序遞迴式衍生、不斷自我複製，以使系統拒絕服務甚至崩潰）。

Libuv 如何透過事件迴圈有效處理非同步 I/O?

首先讓我們再次認識 JavaScript 裡的事件。

事件 (event)

事件指的是用戶或者系統做出的動作，例如按鈕的點擊、檔案讀取完成、某種錯誤產生……等等。

事件驅動 (event-driven)

事件驅動是一種程式執行模型，表示程式的進行是依據事件的發生而定，監聽到事件就處理、處理完就執行 callback，透過不斷的監聽跟回應事件執行程式。

而事件驅動在不同的地方有不同的實現。瀏覽器（前端）和 Node.js （後端）基於不同的技術實現了各自的事件迴圈。就 Node.js 而言，事件是交給 Libuv 去處理；至於瀏覽器的事件迴圈模型在 HTML 5 的規範中有定義。

事件迴圈 (event loop)

因為 Node.js 只有單一執行緒，所以當 Libuv 把非同步事件處理完成後，callback 要被丟回應用程式之前需要排隊，等待主執行緒的 stack 是空的時候才能開始執行。這個排隊的地方就是事件佇列 (event queue)。

Libuv 會不斷檢查有沒有 callback 需要被執行，有的話分配到主執行緒結束手邊的程序時處理，因此這整個過程稱之為「事件迴圈」。

獨角獸就是 Libuv 的精華，也就是可能阻塞 I/O 的部分，我們下面會討論。

Bert Belder 講解 Node.js 事件迴圈的完整影片可以參考這裡：

下面這個影片雖然是以瀏覽器為討論，但如果把 web APIs 換成 C++ APIs，其實就跟在 Node.js 的事件迴圈邏輯很類似了。

Libuv 事件迴圈有哪些階段？

Libuv 的事件迴圈共有六個階段，每個階段的作用如下：

Timers：執行 setTimeout() 和 setInterval() 中到期的 callback，函式裡的時間值是個門檻（也就是如果設定 1000，最快可以一秒後馬上執行，但可能超過一秒才會執行），這還要看 OS 如何排序所有的 callback。
Pending callbacks：上一輪迴圈中有少數的 I/O callback 會被延遲到這一輪的這一階段執行。
Idle, prepare：Idle handle callback 會被執行、Prepare handles 會在迴圈被 I/O 阻塞前執行 callback。
Poll：最重要的一個階段，它會尋找新的 I/O 事件，可能的話會馬上執行 I/O callback，如果無法馬上執行，它會延遲執行並把它註冊為一個 pending callback 在下一輪執行。這個階段有兩個主要的責任：計算應該阻塞多久、還有找遍所有在 polling 佇列中的事件並執行 callback，直到佇列清空或執行的 callback 數到達系統上限。這個階段會阻塞執行緒。
Check：跟 prepare 相反，會在迴圈被 I/O 阻塞後執行 callback，還有執行 setImmediate() 的 callback。
Close callbacks：執行 close 事件的 callback，例如 socket.destroy()。

事件迴圈就是不斷重複以上階段。每個階段都有自己的 callback 佇列，在進入某個階段時，都會從所屬的佇列中取出 callback 來執行，當佇列為空或者被執行 callback 的數量達到系統的最大數量時，就會進入下一階段。

Node.js 適合拿來寫哪種應用程式？

對單一執行緒設計的 Node.js 來說，併發性 (concurrency) 指的是事件迴圈在進行完其他任務，執行 JavaScript callback 函式的能力。

舉例來說，我們想像有個網頁每次打到伺服器的請求都需要 50 毫秒來處理，其中的 45 毫秒都是在等資料庫的 I/O。如果這時候使用 Node.js 非阻塞的非同步操作，那麼每個請求就能釋放出 45 毫秒，讓伺服器拿這些時間去處理其他請求。

因為這個特性，Node.js 很適合用來處理大量併發 (concurrent) 的運算，也就是說 Node.js 可以支援很高的吞吐量 (throughput: requests/second)。

而使用阻塞模型如 Java 等的語言會因為同步帶來佔用資源（如記憶體）的問題：因為是「來一個請求就用一個執行緒跑 (one thread per request)」的模型，所以要不斷切換執行緒，比較不利於開發大量 I/O 併發計算的應用程式。

根據以上提到事件驅動、單執行緒和非同步、非阻塞的 I/O 處理特性，Node.js 很適合拿來開發 I/O 密集型應用程式，如影音串流、即時互動、在線聊天、遊戲、協作工具、股票行情等軟體；相反的，如果需要密集的 CPU 計算，使用傳統的多執行緒設計的語言會表現較佳。

另外，如果你想只學一套語言就能同時寫好前後端，那 Node.js 也會是個不錯的選擇。

Reference

The Node.js Event Loop, Timers, and process.nextTick() | Node.js

Edit on GitHub The event loop is what allows Node.js to perform non-blocking I/O operations - despite the fact that…

nodejs.org

Overview of Blocking vs Non-Blocking | Node.js

Node.js® is a JavaScript runtime built on Chrome's V8 JavaScript engine.

nodejs.org

Understanding the Node.js Event Loop | @RisingStack

This article helps you to understand how the Node.js event loop works, and how you can leverage it to build fast…

blog.risingstack.com

Node.js: what it is, when and how to use it, and why you should

by Pablo Regen You've probably read these sentences before... > Node.js is a JavaScript runtime built on Chrome's V8…

www.freecodecamp.org

JavaScript 中的同步與非同步（上）：先成為 callback 大師吧！

如果要舉出一個在 JavaScript 裡面很重要也很常用，但新手常常搞混的概念，那「非同步（Asynchronous）」當仁不讓，絕對是第一名。跟其他那些 this、 closure、 prototype 或是 hoisting…

blog.techbridge.cc

I/O bound

In computer science, I/O bound refers to a condition in which the time it takes to complete a computation is determined…

en.wikipedia.org

Behind Node.js - The Event Loop - nexocode blog

Node.js is a JavaScript runtime built on Chrome's V8 JavaScript Engine. That you can read at the home page of…

www.nexocode.com

2016 Node Interactive.pdf

Edit description

drive.google.com