Chức năng chính của nút PDF To Text (CustomJS) là gì?
Nút này được thiết kế để trích xuất nội dung văn bản từ các tệp PDF. Nó sử dụng logic JavaScript tùy chỉnh do người dùng chỉ định để xử lý quá trình trích xuất, làm cho nó trở thành một nút xử lý linh hoạt trong bất kỳ luồng công việc n8n nào.
Nút này có hoạt động như một trình kích hoạt (trigger) cho một luồng công việc không?
Không, nút PDF To Text (CustomJS) là một nút thực thi, không phải là trình kích hoạt. Nó phải được đặt sau một nút hoặc trình kích hoạt trước đó cung cấp dữ liệu tệp PDF nhị phân cần thiết cho việc trích xuất văn bản.
Làm thế nào để đưa dữ liệu PDF vào nút xử lý này?
Đầu vào cho nút này phải là một mục chứa dữ liệu nhị phân của tệp PDF, thường được lấy từ các thao tác hệ thống tệp, các Tích hợp (Integrations) lưu trữ đám mây hoặc yêu cầu HTTP.
Việc sử dụng CustomJS mang lại lợi thế gì trong nút trích xuất PDF này?
Sử dụng CustomJS cho phép người dùng nâng cao xác định các tham số trích xuất rất cụ thể, xử lý lỗi hoặc các bước tiền xử lý phù hợp với các tài liệu phức tạp, cung cấp khả năng kiểm soát nhiều hơn so với các Tích hợp PDF tiêu chuẩn.
Tôi có thể sử dụng nút này kết hợp với các Tích hợp lưu trữ đám mây không?
Hoàn toàn có thể. Nút này thường được sử dụng ở hạ nguồn của các Tích hợp (Integrations) như Google Drive hoặc AWS S3. Ví dụ, một luồng công việc có thể được kích hoạt (trigger) khi tải lên một tệp mới, và nút này sau đó sẽ xử lý tệp PDF đã nhận.