Procesamiento de HTML y Documentos PDF Remotos - Flujo de trabajo de n8n

Aprovecha este potente flujo de trabajo de n8n para convertir contenido HTML a PDF y extraer texto con precisión de documentos PDF tanto locales como remotos, utilizando nodos especializados de n8n y la API de CustomJS.

Vista previa del flujo

¿Listo para automatizar?

Descarga esta plantilla de flujo de trabajo de n8n y comienza a usarla al instante.

¿Para quién es ideal?

Especialistas en automatización que necesiten gestionar la generación de documentos y la extracción de texto.
Desarrolladores que busquen plantillas avanzadas de n8n para el procesamiento de PDF.
Usuarios de la API de CustomJS que quieran ver ejemplos del uso específico de su nodo en n8n.
Cualquier persona que busque un método fiable para analizar información estática de documentos PDF dentro de una automatización de n8n.

Descripción general

La gestión de documentos PDF es un requisito habitual en la automatización empresarial, pero a menudo requiere herramientas especializadas. Este completo flujo de trabajo de n8n resuelve dos desafíos comunes: convertir contenido HTML arbitrario en un documento PDF portátil y, a continuación, extraer datos de texto valiosos tanto de los PDF recién generados como de ficheros existentes alojados externamente (vía URL). Esta plantilla específica de n8n utiliza la funcionalidad de nodos especializados de n8n (CustomJS PDF Toolkit) para lograr un procesamiento de documentos fluido. Al utilizar este flujo de trabajo de n8n, obtienes la capacidad de optimizar procesos como el archivo de documentación, la captura de contenido web y la ingesta de datos desde formatos PDF complejos.

Cómo funciona

Este flujo de trabajo de n8n comienza con un sencillo Disparador Manual (Manual Trigger), que permite al usuario iniciar el proceso fácilmente haciendo clic en 'Probar flujo de trabajo' (Test workflow). La lógica principal se bifurca inmediatamente en dos rutas paralelas distintas para demostrar diferentes casos de uso del nodo especializado de PDF de n8n:


  1. Ruta 1: Conversión dinámica de HTML y Extracción

El flujo pasa al nodo de n8n 'HTML a PDF' (HTML to PDF), que toma una entrada HTML estática (

Hello World

) y la convierte en un objeto binario PDF. Esto utiliza las credenciales de la API de CustomJS.
El binario PDF resultante se pasa al primer nodo de n8n 'Convertir PDF a Texto' (Convert PDF into Text). Este nodo procesa directamente el binario del fichero y extrae el texto, confirmando que el HTML se ha convertido correctamente y se ha hecho legible para el flujo de trabajo de n8n.


  1. Ruta 2: Extracción desde URL de PDF Remoto

La ruta paralela comienza con un nodo de n8n de 'Código' (Code). Este nodo se utiliza para definir una entrada de URL de PDF remota, simulando una fuente externa de datos PDF requerida por el flujo de trabajo de n8n.
Los datos (la ruta de la URL) se envían luego al nodo de n8n 'Convertir PDF a Texto1' (Convert PDF into Text1). Este potente nodo de n8n está configurado para obtener el PDF desde la URL proporcionada, eliminando la necesidad de descargar el fichero manualmente. A continuación, realiza la extracción de texto directamente desde el documento remoto.

Guía de instalación

Para instalar esta plantilla de flujo de trabajo de n8n y aprovechar todo su potencial, sigue estos pasos:


  1. Instalar el Nodo de n8n Personalizado (Custom N8N Node): Este flujo de trabajo de n8n depende de un paquete de terceros. Primero debes instalar el paquete @custom-js/n8n-nodes-pdf-toolkit en tu instancia de n8n.

  2. Importar el Flujo de Trabajo de n8n: Copia los datos JSON proporcionados. En tu interfaz de n8n, navega a 'Flujos de trabajo' (Workflows), haz clic en 'Nuevo' (New) y selecciona 'Importar desde JSON' (Import from JSON).

  3. Configurar las Credenciales: Tanto las instancias de los nodos de n8n 'HTML a PDF' como 'Convertir PDF a Texto' requieren credenciales de 'API de CustomJS' (CustomJS API). Asegúrate de haber configurado una conexión con la clave de API y los detalles del servicio apropiados. El flujo de trabajo de n8n fallará sin estas credenciales.

  4. Probar el Disparador de n8n: Haz clic en el nodo disparador de n8n 'Al hacer clic en ‘Probar flujo de trabajo’' (When clicking ‘Test workflow’) y ejecuta el flujo de trabajo una vez para verificar que ambas rutas de extracción paralelas se ejecutan correctamente y devuelven los datos de texto extraídos.

Detalles del nodo

Al hacer clic en ‘Probar flujo de trabajo’ (Disparador Manual): El punto de activación inicial de este flujo de trabajo de demostración de n8n. Inicia ambas rutas de procesamiento de documentos de forma concurrente.
HTML a PDF: Un nodo especializado de n8n que utiliza la API de CustomJS para transformar una cadena de código HTML (

Hello World

) en un fichero binario PDF, que luego está disponible para los nodos posteriores de n8n.
Convertir PDF a Texto: Esta instancia del nodo PdfToText de n8n está configurada para tomar la salida binaria del paso anterior 'HTML a PDF' y extraer todo el contenido de texto plano. Procesa los datos internos generados dentro de este flujo de trabajo de n8n.
Código: Este nodo de n8n sirve como generador de entrada dinámico, creando específicamente una carga útil JSON que contiene la ruta de la URL a un documento PDF externo. Esto prepara la entrada necesaria para el nodo subsiguiente de n8n.

  • Convertir PDF a Texto1: Esta segunda instancia del nodo PdfToText de n8n está configurada para usar un recurso de 'url'. Descarga dinámicamente el fichero PDF ubicado en la ruta especificada (={{ $json.path }}) y extrae la información textual directamente de la fuente remota. Esto demuestra la flexibilidad en el diseño de tu flujo de trabajo de n8n.

Flujos de trabajo de n8n relacionados

Gratis

Nodos: 4 Nodos
Actualizado: Diciembre 26 2025
Ver todo
Creado por

Presentado*