Phân tích Hiệu suất Xử lý Tài liệu Google Drive - Quy trình làm việc n8n

Mẫu quy trình làm việc n8n mạnh mẽ để xử lý tài liệu (PDF, Word, Hình ảnh) từ Google Drive, tạo ra các phân tích hiệu suất chi tiết và điểm chất lượng bằng cách sử dụng node PDF Vector n8n.

Xem trước Workflow

Sẵn sàng tự động hóa chưa?

Tải xuống mẫu quy trình làm việc n8n này và bắt đầu sử dụng ngay lập tức.

Đối tượng phù hợp


  • Các tổ chức cần kiểm toán thông lượng xử lý tài liệu khối lượng lớn.

  • Người dùng tận dụng node PDF Vector n8n để OCR và trích xuất dữ liệu quy mô lớn.

  • Các kỹ sư dữ liệu yêu cầu phân tích hiệu suất và chi phí theo thời gian thực cho quy trình làm việc n8n nạp dữ liệu tài liệu của họ.

  • Các nhóm tìm kiếm bảng điều khiển phân tích tùy chỉnh, tinh vi được tạo hoàn toàn bên trong một quy trình làm việc n8n.

Tổng quan

Mẫu quy trình làm việc n8n nâng cao này giải quyết thách thức trong việc theo dõi các chỉ số hiệu suất và chất lượng trong quá trình xử lý tài liệu quy mô lớn. Thay vì chỉ ghi nhật ký thành công hay thất bại, quy trình làm việc n8n này cung cấp những hiểu biết sâu sắc, bao gồm thời gian xử lý cho mỗi tệp, mức tiêu thụ tín dụng, tỷ lệ thành công được phân loại theo loại tệp (PDF, Word, Hình ảnh) và 'Điểm Chất lượng' được suy ra. Nó sử dụng node Google Drive n8n để liệt kê các tệp và node PDF Vector n8n để xử lý cốt lõi, gói toàn bộ hoạt động trong một lớp logic tùy chỉnh mạnh mẽ để tạo ra một báo cáo phân tích có thể hành động, mang lại khả năng hiển thị về hiệu quả của đường ống tự động hóa của bạn. Việc theo dõi chi tiết này làm cho nó trở thành một trong những mẫu n8n có giá trị nhất để giám sát hoạt động.

Cách thức hoạt động


  1. Quy trình làm việc n8n bắt đầu thực thi thông qua trigger n8n 'Manual Trigger' (Kích hoạt Thủ công).

  2. Node n8n Google Drive 'List Documents' (Liệt kê Tài liệu) truy xuất tối đa 100 tài liệu từ một thư mục Google Drive được chỉ định.

  3. Node Code n8n 'Validate & Queue Files' (Xác thực & Xếp hàng Tệp) kiểm tra các tài liệu, xếp hàng các định dạng được hỗ trợ (PDF, Word, Hình ảnh), lọc các tệp quá khổ (>50MB), tính toán tín dụng ước tính và gán mức ưu tiên xử lý dựa trên kích thước.

  4. Danh sách đã được xác thực được đưa vào node n8n 'Process in Batches' (Xử lý theo Lô), node này chia công việc thành các lô có thể quản lý được là năm (5).

  5. Từng mục trong lô được tách riêng bằng node n8n 'Split Items' (Tách Mục).

  6. Node n8n 'PDF Vector - Process Document/Image' (Xử lý Tài liệu/Hình ảnh) cố gắng trích xuất nội dung (OCR/Phân tích) từ URL tài liệu. Node n8n này được cấu hình để tiếp tục ngay cả khi có lỗi (continue on failure).

  7. Node Code n8n 'Track Processing Results' (Theo dõi Kết quả Xử lý) thu thập dữ liệu hiệu suất cho từng lần cố gắng xử lý riêng lẻ (trạng thái thành công, thông báo lỗi, thời gian thực thi, số lượng từ và điểm chất lượng được tính toán).

  8. Node tổng hợp n8n 'Collect Batch Results' (Thu thập Kết quả Lô) hợp nhất các số liệu hiệu suất cho tất cả các tệp đã được xử lý.

  9. Cuối cùng, node Code n8n 'Generate Analytics Report' (Tạo Báo cáo Phân tích) nhận tất cả các số liệu đã thu thập và số liệu thống kê tệp ban đầu để tạo ra một báo cáo Markdown toàn diện, có cấu trúc, chi tiết về tỷ lệ thành công, các điểm nghẽn hiệu suất (tệp nhanh nhất/chậm nhất), tần suất lỗi và các đề xuất. Node n8n cuối cùng này cung cấp đầu ra quan trọng của quy trình làm việc n8n chi tiết này.

Hướng dẫn cài đặt


  1. Nhập quy trình làm việc n8n: Sao chép JSON được cung cấp và nhập trực tiếp vào phiên bản n8n của bạn.

  2. Thông tin xác thực Google Drive: Tạo hoặc chọn thông tin xác thực OAuth2 Google Drive của bạn. Đảm bảo rằng tài khoản dịch vụ (nếu được sử dụng) có quyền đọc đối với thư mục đích.

  3. Thông tin xác thực PDF Vector: Thiết lập thông tin xác thực cho node PDF Vector n8n, thường liên quan đến khóa API.

  4. Cấu hình Thư mục Google Drive: Trong node n8n 'List Documents', cập nhật tham số queryString bằng cách thay thế 'FOLDERIDHERE' bằng ID thực tế của thư mục Google Drive bạn muốn xử lý.

  5. Bắt đầu: Khởi động quy trình làm việc n8n bằng cách sử dụng trigger n8n 'Manual Trigger' để bắt đầu xử lý hàng loạt và tạo phân tích.

Chi tiết Node

Trigger n8n Manual Trigger: Khởi động quá trình xử lý hàng loạt tài liệu.
Node Google Drive (List Documents) n8n: Liệt kê tối đa 100 tệp từ một thư mục được chỉ định. Cấu hình chính yêu cầu thay thế ID thư mục giữ chỗ trong queryString.
Node Code n8n (Validate & Queue Files): Thực hiện logic tiền xử lý phức tạp, xác thực các loại tệp được hỗ trợ (PDF, Word, Hình ảnh), lọc dựa trên giới hạn kích thước 50MB và ưu tiên hàng đợi để xử lý tối ưu. Là thành phần cốt lõi của mẫu quy trình làm việc n8n này.
Node Split In Batches n8n: Kiểm soát luồng bằng cách gửi tài liệu theo các lô cố định (kích thước 5) để quản lý tải API.
Node Split Out n8n: Tách siêu dữ liệu (metadata) của từng tệp trong một lô để node n8n tiếp theo xử lý.
Node PDF Vector - Process Document/Image n8n: Node hành động trung tâm của n8n, thực hiện OCR và phân tích nội dung dựa trên webViewLink của tài liệu. Điều quan trọng là nó sử dụng continueOnFail: true.
Node Code n8n (Track Processing Results): Tính toán các chỉ số chi tiết cho từng tệp, bao gồm thời gian thực thi, suy ra điểm chất lượng và theo dõi tín dụng.
Node Aggregate n8n (Collect Batch Results): Hợp nhất các kết quả của từng mục trở lại thành một danh sách tổng hợp sau khi xử lý.


  • Node Code n8n (Generate Analytics Report): Node n8n cuối cùng, mạnh mẽ, tổng hợp số liệu thống kê trên toàn bộ lần chạy lô để tạo ra một báo cáo phân tích Markdown toàn diện với các đề xuất về hiệu suất. Node n8n cuối cùng này cung cấp đầu ra quan trọng của quy trình làm việc n8n chi tiết này.

Các quy trình n8n liên quan

miễn phí

Node: 9 Node
Đã cập nhật: Tháng 12 26 2025
Xem tất cả
Tạo bởi

A fully featured PDF APIs for developers - Parse any PDF or Word document, extract structured data, and access millions of academic papers - all through simple APIs.

Đặc sắc*