HTML 與遠端 PDF 文件處理 - n8n 工作流程

利用這個強大的 n8n 工作流,使用專用的 n8n 節點和 CustomJS API,將 HTML 內容轉換為 PDF,並能精確地從本機和遠端 PDF 文件中擷取文字。

工作流預覽

準備好自動化了嗎?

下載此 n8n 工作流程範本並立即開始使用。

適用對象

需要處理文件生成和文字擷取的自動化專家。
正在尋找進階 PDF 處理 n8n 範本的開發人員。
希望查看特定 n8n 節點使用範例的 CustomJS API 使用者。
任何想在 n8n 自動化流程中,針對複雜 PDF 文件抓取靜態資訊的用戶。

總覽

在企業自動化中處理 PDF 文件是項常見需求,但這通常需要專門的工具。這個全面的 n8n 工作流解決了兩個常見的挑戰:將任意的 HTML 內容轉換成可攜帶的 PDF 文件,然後從新生成的 PDF 和外部託管的現有檔案(透過 URL)中擷取有價值的文字資料。此 n8n 範本運用了專用的 n8n 節點功能(CustomJS PDF Toolkit)來達成流暢的文件處理。透過使用這個 n8n 工作流,您可以簡化文件歸檔、擷取網頁內容以及從複雜 PDF 格式導入資料等流程。

運作方式

這個 n8n 工作流以一個簡單的手動觸發器開始,允許使用者點擊「測試工作流」來輕鬆啟動流程。核心邏輯會立即分支出兩個不同的平行路徑,以展示專用 PDF n8n 節點的不同使用案例:


  1. 路徑 1:動態 HTML 轉換與擷取

流程會進入「HTML 轉 PDF」n8n 節點,該節點會接收靜態 HTML 輸入(

Hello World

)並將其轉換成 PDF 二進位物件。這需要使用 CustomJS API 憑證。
產生的 PDF 二進位檔案會被傳遞到第一個「將 PDF 轉換為文字」n8n 節點。此節點會直接處理檔案二進位並擷取出文字,確認 HTML 已成功轉換並可供 n8n 工作流讀取。


  1. 路徑 2:遠端 PDF URL 擷取

平行路徑從一個「程式碼 (Code)」n8n 節點開始。此節點用於定義遠端 PDF 的 URL 輸入,模擬 n8n 工作流所需的外部 PDF 資料來源。
接著,該資料(URL 路徑)會被傳送到「將 PDF 轉換為文字1」n8n 節點。這個強大的 n8n 節點設定為從提供的 URL 抓取 PDF,省去了手動下載檔案的麻煩。它會直接從遠端文件執行文字擷取。

安裝指南

若要安裝此 n8n 工作流範本並發揮其全部潛力,請遵循以下步驟:


  1. 安裝 Custom N8N 節點:此 n8n 工作流依賴第三方套件。您必須先在您的 n8n 實例中安裝 @custom-js/n8n-nodes-pdf-toolkit 套件。

  2. 匯入 n8n 工作流:複製提供的 JSON 資料。在您的 n8n 介面中,前往「工作流 (Workflows)」,點擊「新增 (New)」,然後選擇「從 JSON 匯入 (Import from JSON)」。

  3. 設定憑證:無論是「HTML 轉 PDF」還是「將 PDF 轉換為文字」的 n8n 節點實例,都需要「CustomJS API」憑證。請確保您已使用正確的 API 金鑰和服務細節設定好連線。如果沒有這些憑證,n8n 工作流將會失敗。

  4. 測試 n8n 觸發器:點擊「當點擊 ‘測試工作流’ (When clicking ‘Test workflow’)」的 n8n 觸發器節點,並執行一次工作流,以驗證兩個平行的擷取路徑都能成功執行並回傳擷取到的文字資料。

節點詳情

當點擊 ‘測試工作流’ (Manual Trigger):此 n8n 工作流的初始 n8n 觸發點。它會同時啟動兩個文件處理路徑。
HTML 轉 PDF:一個專用的 n8n 節點,它使用 CustomJS API 將一串 HTML 代碼(

Hello World

)轉換成 PDF 檔案的二進位格式,隨後可供後續的 n8n 節點使用。
將 PDF 轉換為文字:此版本的 PdfToText n8n 節點設定為接收前一步「HTML 轉 PDF」的二進位輸出,並擷取出所有純文字內容。它處理的是在此 n8n 工作流內部產生的資料。
程式碼 (Code):此 n8n 節點作為一個動態輸入產生器,專門建立一個包含外部 PDF 文件 URL 路徑的 JSON Payload,為後續的 n8n 節點準備所需的輸入。

  • 將 PDF 轉換為文字1:此第二個版本的 PdfToText n8n 節點設定為使用「URL」資源。它會動態抓取位於指定路徑(={{ $json.path }})的 PDF 檔案,並直接從遠端來源擷取文字資訊。這展示了您在 n8n 工作流設計上的彈性。

相關 n8n 工作流程

免費

節點: 4 節點
更新时间: 2025年12月26日
建立者

精選*