Processamento de HTML e Documentos PDF Remotos - Fluxo de trabalho n8n

Tire partido deste poderoso fluxo de trabalho n8n para converter conteúdo HTML em PDF e extrair texto com precisão de documentos PDF locais e remotos, utilizando nós n8n especializados e a API CustomJS.

Prévia do Workflow

Pronto para automatizar?

Baixe este modelo de fluxo de trabalho n8n e comece a usá-lo instantaneamente.

Para quem é indicado?

Especialistas em automação que necessitam de gerir a geração de documentos e a extração de texto.
Desenvolvedores à procura de modelos n8n avançados para processamento de PDF.
Utilizadores da API CustomJS que pretendem ver exemplos da utilização específica dos seus nós n8n.
Qualquer pessoa que procure um método fiável para analisar informações estáticas de documentos PDF dentro de uma automação n8n.

Visão Geral

O manuseamento de documentos PDF é um requisito frequente na automação empresarial, mas muitas vezes exige ferramentas especializadas. Este fluxo de trabalho n8n abrangente resolve dois desafios comuns: converter conteúdo HTML arbitrário num documento PDF portátil e, em seguida, extrair dados de texto valiosos tanto dos PDFs recém-gerados como dos ficheiros existentes alojados externamente (via URL). Este modelo n8n em particular utiliza funcionalidades de nós n8n especializados (CustomJS PDF Toolkit) para alcançar um processamento de documentos sem falhas. Ao utilizar este fluxo de trabalho n8n, ganha a capacidade de otimizar processos como o arquivo de documentação, a captura de conteúdo web e a ingestão de dados a partir de formatos PDF complexos.

Como funciona

Este fluxo de trabalho n8n começa com um acionador Manual simples, permitindo ao utilizador iniciar o processo facilmente ao clicar em 'Test workflow'. A lógica central ramifica-se imediatamente em dois caminhos paralelos distintos para demonstrar diferentes casos de utilização para o nó n8n PDF especializado:


  1. Caminho 1: Conversão Dinâmica de HTML e Extração

O fluxo avança para o nó n8n 'HTML to PDF', que aceita uma entrada HTML estática (

Hello World

) e a converte num objeto binário PDF. Isto utiliza as credenciais da API CustomJS.
O binário PDF resultante é passado para o primeiro nó n8n 'Convert PDF into Text'. Este nó processa o binário do ficheiro diretamente e extrai o texto, confirmando que o HTML foi convertido com sucesso e tornado legível pelo fluxo de trabalho n8n.


  1. Caminho 2: Extração de URL PDF Remota

O caminho paralelo começa com um nó n8n 'Code'. Este nó é utilizado para definir uma entrada de URL PDF remota, simulando uma fonte externa de dados PDF necessária ao fluxo de trabalho n8n.
Os dados (o caminho da URL) são então enviados para o nó n8n 'Convert PDF into Text1'. Este poderoso nó n8n está configurado para obter o PDF a partir da URL fornecida, eliminando a necessidade de descarregar o ficheiro manualmente. Em seguida, realiza a extração de texto diretamente do documento remoto.

Guia de Instalação

Para instalar este modelo de fluxo de trabalho n8n e utilizar todo o seu potencial, siga estes passos:


  1. Instalar Nó N8N Personalizado: Este fluxo de trabalho n8n depende de um pacote de terceiros. Deve primeiro instalar o pacote @custom-js/n8n-nodes-pdf-toolkit na sua instância n8n.

  2. Importar o Fluxo de Trabalho n8n: Copie os dados JSON fornecidos. Na sua interface n8n, navegue até 'Workflows', clique em 'New' e selecione 'Import from JSON'.

  3. Configurar Credenciais: Tanto as instâncias dos nós n8n 'HTML to PDF' como 'Convert PDF into Text' requerem credenciais da 'CustomJS API'. Certifique-se de que configurou uma ligação com a chave API e os detalhes do serviço apropriados. O fluxo de trabalho n8n falhará sem estas credenciais.

  4. Testar o Acionador n8n: Clique no nó acionador n8n 'When clicking ‘Test workflow’' e execute o fluxo de trabalho uma vez para verificar se ambos os caminhos de extração paralelos são executados com sucesso e devolvem os dados de texto extraídos.

Detalhes do Nó

When clicking ‘Test workflow’ (Manual Trigger): O ponto de acionamento n8n inicial para este fluxo de trabalho n8n de demonstração. Inicia ambos os caminhos de processamento de documentos simultaneamente.
HTML to PDF: Um nó n8n especializado que utiliza a API CustomJS para transformar uma string de código HTML (

Hello World

) num binário de ficheiro PDF, que fica então disponível para nós n8n a jusante.
Convert PDF into Text: Esta instância do nó n8n PdfToText está configurada para aceitar a saída binária da etapa anterior 'HTML to PDF' e extrair todo o conteúdo de texto simples. Processa os dados internos gerados dentro deste fluxo de trabalho n8n.
Code: Este nó n8n serve como um gerador de entrada dinâmico, criando especificamente uma carga útil JSON que contém o caminho da URL para um documento PDF externo. Isto prepara a entrada necessária para o nó n8n subsequente.

  • Convert PDF into Text1: Esta segunda instância do nó n8n PdfToText está configurada para utilizar um recurso 'url'. Obtém dinamicamente o ficheiro PDF localizado no caminho especificado (={{ $json.path }}) e extrai as informações textuais diretamente da fonte remota. Isto demonstra a flexibilidade no design do seu fluxo de trabalho n8n.

Fluxos de trabalho n8n relacionados

Grátis

Nós: 4 Nós
Atualizado: Dezembro 26 2025
Ver tudo
Criado por

Apresentou*