Quản lý Documents & Chunks
Xem, thêm, chỉnh sửa hoặc xóa tài liệu và chunks để giữ Knowledge Base luôn cập nhật và chính xác.
Mục lục
· [Quản lý Documents](#quản-lý-documents)
· [Quản lý Chunks](#quản-lý-chunks)
· [Best Practices](#best-practices)
Quản lý Documents
Trong trang chi tiết Knowledge Base, bạn có thể quản lý tất cả tài liệu đã upload:
Các thao tác với Documents
Thao tác
Mô tả
View
Xem danh sách tất cả tài liệu, trạng thái xử lý, và thông tin chi tiết
Add
Upload thêm tài liệu mới vào Knowledge Base
Enable / Disable
Bật/tắt tài liệu. Tài liệu bị tắt sẽ không được truy xuất nhưng vẫn được lưu
Archive
Lưu trữ tài liệu không còn sử dụng thường xuyên
Delete
Xóa vĩnh viễn tài liệu khỏi Knowledge Base
Re-index
Lập chỉ mục lại tài liệu khi thay đổi settings
Trạng thái Document
Trạng thái
Mô tả
Queuing
Đang chờ xử lý
Processing
Đang được chunking và indexing
Available
Sẵn sàng cho retrieval
Error
Xử lý gặp lỗi — nhấn để xem chi tiết
Disabled
Đã tắt — không tham gia retrieval
Archived
Đã lưu trữ
💡 TIP: Sử dụng Enable/Disable thay vì Delete khi bạn muốn tạm thời loại bỏ tài liệu khỏi retrieval. Bạn có thể bật lại bất kỳ lúc nào mà không cần upload lại.
Quản lý Chunks
Nhấn vào một document để xem và quản lý các chunks:
Các thao tác với Chunks
Thao tác
Mô tả
View
Xem nội dung chi tiết của chunk
Edit
Chỉnh sửa nội dung chunk
Add
Thêm chunk mới thủ công
Enable / Disable
Bật/tắt chunk riêng lẻ
Delete
Xóa chunk
Add Image
Đính kèm hình ảnh vào chunk
Lưu ý khi chỉnh sửa Chunks
Với Parent-Child Mode:
· Khi chỉnh sửa parent chunk, bạn có thể chọn tạo lại (regenerate) các child chunks hoặc giữ nguyên
· Chỉnh sửa child chunk không cập nhật parent chunk tương ứng
Giới hạn đính kèm:
· Kích thước hình ảnh tối đa: Theo cấu hình ATTACHMENT_IMAGE_FILE_SIZE_LIMIT
· Số file đính kèm tối đa mỗi chunk: Theo cấu hình SINGLE_CHUNK_ATTACHMENT_LIMIT
⚠️ IMPORTANT: Khi chỉnh sửa chunks, nội dung mới sẽ được re-embed tự động. Tuy nhiên, hãy test retrieval sau khi chỉnh sửa để đảm bảo kết quả vẫn chính xác.
Best Practices
Kiểm tra chất lượng Chunk
Sau khi tạo Knowledge Base, hãy review các chunks để phát hiện vấn đề:
· Chunks quá ngắn — Có thể thiếu đủ context, dẫn đến mất ý nghĩa ngữ cảnh và câu trả lời không chính xác
· Chunks quá dài — Có thể bao gồm thông tin không liên quan, gây nhiễu ngữ nghĩa và giảm độ chính xác retrieval
· Chunks không hoàn chỉnh ngữ nghĩa — Chunking bắt buộc cắt qua câu hoặc đoạn, dẫn đến nội dung bị thiếu hoặc sai lệch khi retrieval
Sử dụng Child Chunks làm Retrieval Hooks
Trong Parent-Child mode, child chunks đóng vai trò "hooks" — điểm bắt retrieval, sau đó parent chunk cung cấp context đầy đủ hơn.
Các loại child chunk hiệu quả:
Loại
Ví dụ
Keywords
blinking light, won't turn on, red light, connection error, frozen
Summaries
Hướng dẫn phân tích màu LED và xử lý sự cố phần cứng
Queries
Đèn đỏ liên tục nghĩa là gì?
Sử dụng Summary để kết nối Query-Content
Summary đặc biệt hữu ích trong các trường hợp:
· Câu hỏi người dùng khác ngôn ngữ tài liệu: Với tài liệu kỹ thuật viết formal, thêm summary theo cách người dùng thực sự hỏi
· Khái niệm ẩn trong chi tiết: Thêm summary mức cao surface core concepts, cho phép chunk được match mà không cần dựa vào chi tiết nhỏ
· Nội dung không phải text: Khi chunk chủ yếu là code, bảng, log — thêm summary mô tả rõ chunk chứa gì
· Chunks liên quan cần truy xuất cùng nhau: Áp dụng summary giống nhau cho các chunks liên quan để hỗ trợ grouped retrieval
📝 NOTE: Số lượng chunks liên quan trả về phụ thuộc vào giới hạn Top K trong retrieval settings.
📖 Trước: [External Knowledge API](./07-external-knowledge-api.md) · Tiếp: [Metadata](./09-metadata.md)
Last updated