webpack 5 之持久化緩存

Opt-in

首先，要注意的是預設情況下不會啟用持久化緩存。你可以自行選擇啟用。

為何如此？webpack 旨在注重建構安全而非性能。我們沒有打算預設啟用這一功能，主要原因在于此功能雖然有 95% 幾率提升性能，但仍有 5% 的幾率中斷你的應用程式/工作流/建構。

這可能聽起來很糟，但相信我它并非如此。隻不過需要開發人員進行額外的操作來配置它。

序列化與反序列化功能具有無需配置的開箱即用體驗，但開箱即用的部分可能緻使緩存失效。

什麼是緩存失效？webpack 需要确認 entry 的緩存何時會失效，并在失效時不再将其用于建構。是以，當你應用程式修改檔案時，就會發生此情況。

示例：修改 <code>magic.js</code>。webpack 必須讓 entry 為 <code>magic.js</code> 的緩存失效。建構将重新處理該檔案，即運作 babel，typescript 諸如此類工具，重新解析檔案并運作代碼生成。webpack 可能還會緻使 entry 為 <code>bundle.js</code> 的緩存失效。然後根據原子產品重新建構此檔案。

為此，webpack 追蹤了每個子產品的 <code>fileDependencies</code> <code>contextDependencies</code> 以及 <code>missingDependencies</code>，并建立了檔案系統快照。此快照會與真實檔案系統進行比較，當檢測到差異時，将觸發對應子產品的重新建構。

webpack 給 <code>bundle.js</code> 的緩存 entry 設定了一個 <code>etag</code>，它為所有貢獻者的 hash 值。比較這個 <code>etag</code>，隻有當它與緩存 entry 比對時才能使用。

webpack 4 中的記憶體緩存也依賴上述這些。從開發人員角度來說，這些都能夠開箱即用，無需額外配置。但對于 webpack 5 的持久化緩存來說，卻充滿着挑戰。

以下操作均會讓 webpack 使 entry 緩存失效：

當 npm 更新 loader 或 plugin 時

當更改配置時

當更改在配置中讀取的檔案時

當 npm 更新配置中使用的 dependencies 時

當不同指令行參數傳遞給 build 腳本時

當有自定義建構腳本并進行更改時

這變得非常棘手。開箱即用的情況下，webpack 無法處理所有這些情況。這就是我們為什麼選擇安全的方式，并将持久化緩存變為可選特性的原因。我們希望讀者可以學習如何啟用持久化緩存，以為你提供正确的提示。我們希望你知道需要使用哪種配置來處理你自定義的建構腳本。

建構依賴（dependencies），緩存版本（version）和緩存名（name）

為了處理建構過程中的依賴關系，webpack 提供了三個新工具：

此為全新的配置項 <code>cache.buildDependencies</code>，它可以指定建構過程中的代碼依賴。為了使它更簡易，webpack 負責解析并遵循配置值的依賴。

值類型有兩種：檔案和目錄。目錄類型必須以斜杠（<code>/</code>）結尾。其他所有内容都解析為檔案類型。

對于目錄類型來說，會解析其最近的 <code>package.json</code> 中的 dependencies。對于檔案類型來說，我們将檢視 node.js 子產品緩存以尋找其依賴。

示例：建構通常取決于 webpack 本身的 lib 檔案夾：你可以這樣配置：

當 <code>webpack/lib</code> 或 webpack 依賴的庫（如，<code>watchpack</code>，<code>enhanced-resolved</code> 等）發生任何變化時，其緩存将失效。<code>webpack/lib</code> 已是預設值，預設情況下無需配置。

另一個示例：建構依舊取決于你的配置檔案。具體配置如下：

<code>__filename</code> 變量指向 node.js 中的目前檔案。

當配置檔案或配置檔案中通過 <code>require</code> 依賴的任何内容發生更改時，也會使得持久化緩存失效。當配置檔案通過 <code>require()</code> 引用了所有使用過的插件時，它們也會成為建構依賴項。

如果配置檔案通過 <code>fs.readFile</code> 讀取檔案，則将不會成為建構依賴項，因為 webpack 僅遵循 <code>require()</code>。你需要手動将此類檔案添加到 <code>buildDependencies</code> 中。

建構的某些依賴項不能單純的依靠對檔案的引用，如，從資料庫讀取的值，環境變量或指令行上傳遞的值。對于這些值，我們給出了新的配置項 <code>cache.version</code>。

<code>cache.version</code> 類型為 string。傳遞不同的字元串将使持久化緩存失效。

示例：你的配置中可能會讀取環境變量中的 <code>GIT_REV</code> 并将其與 <code>DefinePlugin</code> 一起使用以将其嵌入到 bundle 中。這使得 <code>GIT_REV</code> 成為你建構的依賴項。具體配置如下：

在某些情況下，依賴關系會在多個不同的值間切換，并且對于每個值更改都會使得持久化緩存失效，這顯然是浪費資源的。對于這類值，我們給出了新的配置項 <code>cache.name</code>。

<code>cache.name</code> 類型為 string。傳遞值将建立一個隔離且獨立的持久化緩存。

<code>cache.name</code> 被用于對檔案名進行持久化緩存。確定僅傳遞短小且 fs-safe 的名稱。

示例：你的配置可以使用 <code>--env.target mobile|desktop</code> 參數為移動端或 PC 使用者建立不同的建構。具體配置如下：

性能優化

對大部分 node_modules 進行哈希處理并加蓋時間戳以生存建構和正常依賴項，其代價非常昂貴，并且還會大大降低 webpack 的執行速度。為避免這種情況出現，webpack 引入了相關的性能優化，預設情況下會跳過 <code>node_modules</code>，并使用 <code>package.json</code> 中的 <code>version</code> 和 <code>name</code> 作為資料源。

此優化将用于配置項 <code>cache.managedPaths</code> 中的所有 path。它預設為 webpack 安裝了 <code>node_modules</code> 目錄。

啟用此優化後，請勿手動編輯 <code>node_modules</code>。你可以使用 <code>cache.managedPaths: []</code> 禁用它。

當使用 Yarn PnP 時，将啟用另一個優化。由于緩存内容不可變，yarn 緩存中的所有檔案都将完全跳過哈希和時間戳的操作（甚至不會追蹤 <code>version</code> 和 <code>name</code>）。

此操作由配置項 <code>cache.immutablePaths</code> 控制。啟用 Yarn PnP 時，預設為安裝了 webpack 的 yarn 緩存。

不要手動編輯 yarn 緩存，因為這根本不可行。

使用持久化緩存

確定你已閱讀并了解以上資訊！

此為啟用持久化緩存的典型配置：

持久化緩存可用于單獨建構和連續建構（watch）。

當設定 <code>cache.type: "filesystem"</code> 時，webpack 會在内部以分層方式啟用檔案系統緩存和記憶體緩存。從緩存讀取時，會先檢視記憶體緩存，如果記憶體緩存未找到，則降級到檔案系統緩存。寫入緩存将同時寫入記憶體緩存和檔案系統緩存。

檔案系統緩存不會直接将對磁盤寫入的請求進行序列化。它将等到編譯過程完成且編譯器處于空閑狀态才會執行。如此處理的原因是序列化和磁盤寫入會占用資源，并且我們不想額外延遲編譯過程。

針對單一建構，其工作流為：

Loading cache

Building

Emitting

Display results (stats)

Persisting cache (if changed)

Process exits

針對連續建構（watch），其工作流為：

Attach filesystem watchers

Wait <code>cache.idleTimeoutForInitialStore</code>

On change:

Wait <code>cache.idleTimeout</code>

你會發現兩個新的配置項 <code>cache.idleTimeout</code> 和 <code>cache.idleTimeoutForInitialStore</code>，它們控制着持久化緩存之前編譯器必須空閑的時長。<code>cache.idleTimeout</code> 預設為 60s，<code>cache.idleTimeoutForInitialStore</code> 預設為 0s。由于序列化阻止了事件循環，是以在序列化緩存時不進行緩存檢測。此延遲嘗試避免由于快速編輯檔案，而在 watch 模式下導緻重新編譯造成的延遲，同時嘗試為下一次冷啟動保持持久化緩存的最新狀态。這是一個折中的解決方案，可以設定适合你工作流的值。較小的值會縮短冷啟動時間，但會增加延遲重新建構的風險。

發生錯誤要恢複持久化緩存的方式，可以通過删除整個緩存并進行全新的建構，或者通過删除有問題的緩存 entry 并使得該項目保持未緩存狀态來進行。

在這種情況下，webpack 的 logger 會發出警告。欲了解更多，請參閱 <code>infrastructureLogging</code> 的配置項。

Details

正常使用不需要以下資訊。

封裝 webpack 的工具可以選擇其他預設值。當不允許使用自定義擴充的 webpack 時，由于可以完全控制所有建構的依賴項，是以可以預設打開持久化存儲。

預設情況下，使用 webpack 的 CLI 可能會添加一些建構依賴關系，而 webpack 本身不會。

預設情況下，CLI 會将 <code>cache.buildDependencies.defaultConfig</code> 設定為所用的配置檔案

CLI 會将指令行參數附加到 <code>cache.version</code>

使用指令行參數時，CLI 可能會在 <code>cache.name</code> 中添加注釋。

使用如下配置，将輸出額外的調試資訊：

webpack 讀取緩存檔案。

沒有緩存檔案 -> 未建構緩存

緩存檔案中的 <code>version</code> 與 <code>cache.version</code> 不比對 -> 沒有建構緩存

webpack 将解析快照（<code>resolve snapshot</code>）與檔案系統進行對比

比對到 -> 繼續後續流程

沒有比對到：

再次解析所有解析結果（<code>resolve results</code>）

沒有比對到 -> 未建構緩存

webpack 将建構依賴快照（<code>build dependencies snapshot</code>）與檔案系統進行對比

對緩存 entry 進行反序列化（在建構過程中對較大的緩存 entry 進行延遲反序列化）

建構運作（有緩存或沒有緩存）

追蹤建構依賴關系

追蹤 <code>cache.buildDependencies</code>

追蹤已使用的 loader

新的建構依賴關系已解析完成

解析依賴關系已追蹤

解析結果已追蹤

建立來自所有新解析依賴項的快照

建立來自所有新建構依賴項的快照

持久化緩存檔案序列化到磁盤

所有支援序列化的 class 都需要注冊一個序列化器：

<code>Constructor</code> 應為一個 class 或構造器函數。對于任何需要序列化的對象的 <code>object.constructor</code> 将被用于查找序列化器（serializer）。

<code>request</code> 将被用于加載調用 <code>register</code> 子產品。它應指向目前子產品。它将以這種方式使用：<code>require(request)</code>。

<code>name</code> 被用于區分具有相同 <code>request</code> 的多個 <code>register</code> 調用。

<code>serializer</code> 是至少擁有 <code>serialize</code> 和 <code>deserialize</code> 兩個方法的對象。

當需序列化對象時，請調用 <code>serializer.serialize(object, context)</code>。<code>context</code> 是至少擁有一個 <code>write(anything)</code> 方法的對象此方法将内容寫入輸出流。傳遞的值也會被序列化。

當需要反序列化對象時，請調用 <code>serializer.deserialize(context)</code>。<code>context</code> 是至少擁有一個 <code>read(): anything</code> 方法的對象。此方法會反序列化輸入流中的某些内容。<code>deserialize</code> 必須傳回反序列化後的對象。

<code>serialize</code> 和 <code>deserialize</code> 應以相同的順序讀取和寫入相同的對象。

示例：

基本資料類型和引用資料類型的序列化器都已被注冊，即 string，number，Array，Set，Map，RegExp，plain objects，Error。

webpack 5 之持久化緩存

繼續閱讀

Linux的Sysfs檔案系統簡要說明

linux下檔案系統的制作

SpringBoot交友APP項目實戰（詳細介紹+案例源碼） - 9.小視訊（SpringCache緩存）系列文章目錄一、訪客功能二、分布式存儲FastDFS三、視訊功能四、通用緩存SpringCache

redis延遲雙删的政策

自定義SDWebImage圖檔緩沖區自清理機制

分布式緩存的基本原理

redis主從複制讀寫分離總結

redis的選擇和定位redis的選擇和定位

Ubuntu下挂載分區

Redis單線程模型和IO多路複用

Linux 下 SD 卡隻讀檔案系統

vue-loader-v16/package.json報錯

ZooKeeper ： Curator架構之資料緩存與監聽CuratorCache

Protobuf 和 Thrift對比（轉）

signal 6 (SIGABRT), code -6 name: RenderThread問題記錄

功能強大的Gson部分功能用法