Tải tập tin lên
So với văn bản trò chuyện, các tệp tài liệu có thể chứa một lượng lớn thông tin, chẳng hạn như báo cáo khoa học và hợp đồng pháp lý. Tuy nhiên, Các Mô hình Ngôn ngữ Lớn (LLMs) vốn dĩ chỉ có thể xử lý văn bản hoặc hình ảnh, gây khó khăn cho việc trích xuất thông tin ngữ cảnh phong phú trong các tệp này. Do đó, người dùng ứng dụng thường phải sao chép và dán thủ công một lượng lớn thông tin để trò chuyện với LLMs, làm tăng đáng kể chi phí hoạt động không cần thiết.
Tính năng tải tệp giải quyết hạn chế này bằng cách cho phép tệp được tải lên, phân tích, tham chiếu và tải xuống dưới dạng các biến Tệp trong các ứng dụng quy trình làm việc. Điều này giúp các nhà phát triển dễ dàng xây dựng các quy trình làm việc phức tạp có khả năng hiểu và xử lý nhiều loại phương tiện khác nhau, bao gồm hình ảnh, âm thanh và video.
Tình huống Ứng Dụng
Phân tích Tài liệu: Tải lên các báo cáo nghiên cứu học thuật để LLM nhanh chóng tóm tắt các điểm chính và trả lời các câu hỏi liên quan dựa trên nội dung tệp.
Xem Xét Mã: Các nhà phát triển có thể tải lên các tệp mã nguồn để nhận được các đề xuất tối ưu và phát hiện lỗi.
Hỗ Trợ Học Tập: Sinh viên có thể tải lên các bài tập hoặc tài liệu học tập để nhận được giải thích và hướng dẫn cá nhân hóa.
Trợ Giúp Pháp Lý: Tải lên các văn bản hợp đồng hoàn chỉnh để LLM hỗ trợ trong việc xem xét các điều khoản và xác định các rủi ro tiềm năng.
Sự Khác Biệt Giữa Tải Tệp và Cơ Sở Dữ Liệu Kiến Thức
Cả tải tệp và cơ sở dữ liệu kiến thức đều cung cấp thông tin ngữ cảnh bổ sung cho LLMs, nhưng chúng có sự khác biệt đáng kể trong các tình huống sử dụng và chức năng:
Nguồn Thông Tin:
Tải Tệp: Cho phép người dùng cuối tải tệp động trong quá trình trò chuyện, cung cấp thông tin ngữ cảnh cá nhân hóa ngay lập tức.
Cơ Sở Dữ Liệu Kiến Thức: Được cài đặt và quản lý trước bởi các nhà phát triển ứng dụng, chứa một tập hợp thông tin tương đối cố định.
Tính Linh Hoạt Trong Sử Dụng:
Tải Tệp: Linh hoạt hơn, người dùng có thể tải lên các loại tệp khác nhau dựa trên nhu cầu cụ thể.
Cơ Sở Dữ Liệu Kiến Thức: Nội dung tương đối cố định nhưng có thể được tái sử dụng qua nhiều phiên.
Xử Lý Thông Tin:
Tải Tệp: Cần các công cụ trích xuất tài liệu hoặc công cụ khác để chuyển đổi nội dung tệp thành văn bản mà LLMs có thể hiểu.
Cơ Sở Dữ Liệu Kiến Thức: Thường được xử lý và lập chỉ mục trước, sẵn sàng để truy xuất trực tiếp.
Tình Huống Ứng Dụng:
Tải Tệp: Phù hợp cho các tình huống cần xử lý tài liệu người dùng cụ thể, như phân tích tài liệu, hỗ trợ học tập cá nhân hóa, v.v.
Cơ Sở Dữ Liệu Kiến Thức: Phù hợp cho các tình huống yêu cầu truy cập một lượng lớn thông tin được thiết lập trước, như dịch vụ khách hàng, truy vấn sản phẩm, v.v.
Tính Bền Vững Dữ Liệu:
Tải Tệp: Thường chỉ dùng tạm thời, không được lưu trữ lâu dài trong hệ thống.
Cơ Sở Dữ Liệu Kiến Thức: Tồn tại như một phần lâu dài của ứng dụng, có thể được cập nhật và bảo trì liên tục.
Bắt Đầu Nhanh
Dify hỗ trợ tải tệp trong cả ứng dụng ChatFlow và Workflow, xử lý chúng thông qua các biến cho LLMs. Các nhà phát triển ứng dụng có thể tham khảo các phương pháp sau để kích hoạt tính năng tải tệp:
Trong ứng dụng Workflow:
Thêm các biến tệp trong "Nút Bắt Đầu"
Trong ứng dụng ChatFlow:
Kích hoạt tải tệp trong "Tính năng Thêm" để cho phép tải tệp trực tiếp trong cửa sổ trò chuyện
Thêm các biến tệp trong "Nút Bắt Đầu"
Lưu ý: Hai phương pháp này có thể được cấu hình đồng thời và độc lập với nhau. Cài đặt tải tệp trong các tính năng bổ sung (bao gồm phương pháp tải và giới hạn số lượng) không ảnh hưởng đến các biến tệp trong nút bắt đầu. Ví dụ, nếu bạn chỉ muốn tạo các biến tệp thông qua nút bắt đầu, bạn không cần kích hoạt tính năng tải tệp trong các tính năng bổ sung.
Hai phương pháp này cung cấp các tùy chọn tải tệp linh hoạt cho các ứng dụng để đáp ứng nhu cầu của các tình huống khác nhau.
Các Loại Tệp
Các biến tệp và biến mảng[file] hỗ trợ các loại và định dạng tệp sau:
Tài Liệu
TXT, MARKDOWN, PDF, HTML, XLSX, XLS, DOCX, CSV, EML, MSG, PPTX, PPT, XML, EPUB.
Hình Ảnh
JPG, JPEG, PNG, GIF, WEBP, SVG.
Âm Thanh
MP3, M4A, WAV, WEBM, AMR.
Video
MP4, MOV, MPEG, MPGA.
Khác
Hỗ trợ định dạng tệp tùy chỉnh
Phương Pháp 1: Kích Hoạt Tải Tệp Trong Hộp Trò Chuyện Ứng Dụng (Chỉ Dành Cho Chatflow)
1.
Nhấp vào nút "Tính năng" ở góc trên bên phải của ứng dụng Chatflow để thêm nhiều chức năng hơn cho ứng dụng. Sau khi kích hoạt tính năng này, người dùng ứng dụng có thể tải lên và cập nhật các tệp bất kỳ lúc nào trong quá trình đối thoại của ứng dụng. Tối đa 10 tệp có thể được tải lên đồng thời, với kích thước tối đa là 15MB cho mỗi tệp.
Kích hoạt tính năng này không cho phép LLMs đọc trực tiếp các tệp. Một Trình Trích Xuất Tài Liệu vẫn cần thiết để phân tích các tài liệu thành văn bản cho LLM hiểu được.
• Đối với các tệp âm thanh, các mô hình như gpt-4o-audio-preview hỗ trợ đầu vào đa phương thức có thể xử lý âm thanh trực tiếp mà không cần trích xuất thêm.
• Đối với video và các loại tệp khác, hiện tại chưa có các trình trích xuất tương ứng. Các nhà phát triển ứng dụng cần tích hợp các công cụ bên ngoài để xử lý.
2
.Thêm một nút Trình Trích Xuất Tài Liệu, và chọn biến sys.files trong các biến đầu vào.
3
.Thêm một nút LLM và chọn biến đầu ra của nút Trình Trích Xuất Tài Liệu trong lời nhắc hệ thống.
4
.Thêm một nút "Phản hồi" ở cuối, điền vào biến đầu ra của nút LLM.
Khi được kích hoạt, người dùng có thể tải lên tệp và tham gia vào các cuộc trò chuyện trong hộp đối thoại. Tuy nhiên, với phương pháp này, ứng dụng LLM không có khả năng nhớ nội dung tệp, và các tệp cần được tải lên cho mỗi cuộc trò chuyện.
Nếu bạn muốn LLM nhớ nội dung tệp trong các cuộc trò chuyện, vui lòng tham khảo Phương pháp 2.
Phương Pháp 2: Kích Hoạt Tải Tệp Bằng Cách Thêm Biến Tệp
Thêm Biến Tệp Trong "Nút Bắt Đầu" Thêm các trường đầu vào trong "Nút Bắt Đầu" của ứng dụng, chọn "Tệp Đơn" hoặc "Danh Sách Tệp" làm kiểu trường cho biến.
Tệp Đơn
Cho phép người dùng ứng dụng tải lên chỉ một tệp.
Danh Sách Tệp
Cho phép người dùng ứng dụng tải lên nhiều tệp cùng một lúc.
Để dễ vận hành, chúng ta sẽ sử dụng biến tệp đơn làm ví dụ.
Phân Tích Tệp
Có hai cách chính để sử dụng các biến tệp:
1.Sử dụng các nút công cụ để chuyển đổi nội dung tệp: •tài liệu loại tệp, bạn có thể sử dụng nút "Trình Trích Xuất Tài Liệu" để chuyển đổi nội dung tệp thành định dạng văn bản.
•Phương pháp này phù hợp cho các trường hợp mà nội dung tệp cần phải được phân tích thành định dạng mà mô hình có thể hiểu (chẳng hạn như string, array[string], v.v.).
2.Sử dụng các biến tệp trực tiếp trong nút LLM: •Đối với một số loại tệp (như hình ảnh), bạn có thể sử dụng các biến tệp trực tiếp trong các nút LLM.
•Ví dụ, đối với các biến tệp loại hình ảnh, bạn có thể kích hoạt tính năng thị giác trong nút LLM và sau đó tham chiếu trực tiếp biến tệp tương ứng trong bộ chọn biến.
Sự lựa chọn giữa các phương pháp này phụ thuộc vào loại tệp và yêu cầu cụ thể của bạn. Tiếp theo, chúng tôi sẽ chi tiết các bước cụ thể cho cả hai phương pháp.
Thêm Nút Trình Trích Xuất Tài Liệu Sau khi tải lên, các tệp được lưu trữ trong các biến tệp đơn mà LLM không thể đọc trực tiếp. Do đó, trước tiên, cần thêm một nút "Trình Trích Xuất Tài Liệu" để trích xuất nội dung từ các tệp tài liệu đã tải lên và gửi đến nút LLM để xử lý thông tin.
Sử dụng biến tệp từ "Nút Bắt Đầu" làm biến đầu vào cho nút "Trình Trích Xuất Tài Liệu".
Điền vào biến đầu ra của nút "Trình Trích Xuất Tài Liệu" trong lời nhắc hệ thống của nút LLM.
Sau khi hoàn tất các thiết lập này, người dùng ứng dụng có thể dán URL tệp hoặc tải lên các tệp cục bộ trong WebApp, sau đó tương tác với LLM về nội dung tài liệu. Người dùng có thể thay thế các tệp bất kỳ lúc nào trong cuộc trò chuyện, và LLM sẽ lấy nội dung tệp mới nhất.
Tham Chiếu Các Biến Tệp Trong Các Nút LLM
Đối với một số loại tệp (như hình ảnh), các biến tệp có thể được sử dụng trực tiếp bên trong các nút LLM. Phương pháp này đặc biệt phù hợp cho các tình huống yêu cầu phân tích hình ảnh. Dưới đây là các bước cụ thể:
Trong nút LLM, kích hoạt chức năng thị giác. Điều này cho phép mô hình xử lý đầu vào hình ảnh (mô hình phải hỗ trợ khả năng thị giác).
Trong bộ chọn biến của nút LLM, tham chiếu trực tiếp biến tệp đã tạo trước đó. Nếu việc tải tệp được kích hoạt thông qua các tính năng bổ sung, chọn biến sys.files.
Trong lời nhắc hệ thống, hướng dẫn mô hình cách xử lý đầu vào hình ảnh. Ví dụ, bạn có thể chỉ đạo mô hình mô tả nội dung hình ảnh hoặc trả lời các câu hỏi về hình ảnh.
Dưới đây là một ví dụ cấu hình:
Sử dụng biến tệp trực tiếp trong nút LLM
Cần lưu ý rằng khi sử dụng trực tiếp biến tệp trong nút LLM, các nhà phát triển cần đảm bảo rằng biến tệp chứa chỉ các tệp hình ảnh; nếu không, có thể xảy ra lỗi. Nếu người dùng có thể tải lên các loại tệp khác nhau, chúng ta cần sử dụng các phép toán danh sách để lọc.
Tải Tệp (File Download)
Đặt các biến tệp trong các nút phản hồi hoặc nút kết thúc sẽ cung cấp một thẻ tải xuống tệp trong hộp trò chuyện khi ứng dụng đến nút đó. Nhấp vào thẻ sẽ cho phép tải xuống tệp.
Sử Dụng Nâng Cao
Nếu bạn muốn ứng dụng hỗ trợ tải lên nhiều loại tệp khác nhau, chẳng hạn như cho phép người dùng tải lên các tệp tài liệu, hình ảnh và tệp âm thanh/video cùng một lúc, bạn cần thêm một biến "Danh Sách Tệp" trong "Nút Bắt Đầu" và sử dụng nút "Phép Toán Danh Sách" để xử lý các loại tệp khác nhau. Để biết hướng dẫn chi tiết, vui lòng tham khảo nút Phép Toán Danh Sách.
Last updated