Quản lý Documents & Chunks

Xem, thêm, chỉnh sửa hoặc xóa tài liệu và chunks để giữ Knowledge Base luôn cập nhật và chính xác.

Mục lục

· [Quản lý Documents](#quản-lý-documents)

· [Quản lý Chunks](#quản-lý-chunks)

· [Best Practices](#best-practices)

Quản lý Documents

Trong trang chi tiết Knowledge Base, bạn có thể quản lý tất cả tài liệu đã upload:

Các thao tác với Documents

Thao tác

Mô tả

View

Xem danh sách tất cả tài liệu, trạng thái xử lý, và thông tin chi tiết

Add

Upload thêm tài liệu mới vào Knowledge Base

Enable / Disable

Bật/tắt tài liệu. Tài liệu bị tắt sẽ không được truy xuất nhưng vẫn được lưu

Archive

Lưu trữ tài liệu không còn sử dụng thường xuyên

Delete

Xóa vĩnh viễn tài liệu khỏi Knowledge Base

Re-index

Lập chỉ mục lại tài liệu khi thay đổi settings

Trạng thái Document

Trạng thái

Mô tả

Queuing

Đang chờ xử lý

Processing

Đang được chunking và indexing

Available

Sẵn sàng cho retrieval

Error

Xử lý gặp lỗi — nhấn để xem chi tiết

Disabled

Đã tắt — không tham gia retrieval

Archived

Đã lưu trữ

💡 TIP: Sử dụng Enable/Disable thay vì Delete khi bạn muốn tạm thời loại bỏ tài liệu khỏi retrieval. Bạn có thể bật lại bất kỳ lúc nào mà không cần upload lại.

Quản lý Chunks

Nhấn vào một document để xem và quản lý các chunks:

Các thao tác với Chunks

Thao tác

Mô tả

View

Xem nội dung chi tiết của chunk

Edit

Chỉnh sửa nội dung chunk

Add

Thêm chunk mới thủ công

Enable / Disable

Bật/tắt chunk riêng lẻ

Delete

Xóa chunk

Add Image

Đính kèm hình ảnh vào chunk

Lưu ý khi chỉnh sửa Chunks

Với Parent-Child Mode:

· Khi chỉnh sửa parent chunk, bạn có thể chọn tạo lại (regenerate) các child chunks hoặc giữ nguyên

· Chỉnh sửa child chunk không cập nhật parent chunk tương ứng

Giới hạn đính kèm:

· Kích thước hình ảnh tối đa: Theo cấu hình ATTACHMENT_IMAGE_FILE_SIZE_LIMIT

· Số file đính kèm tối đa mỗi chunk: Theo cấu hình SINGLE_CHUNK_ATTACHMENT_LIMIT

⚠️ IMPORTANT: Khi chỉnh sửa chunks, nội dung mới sẽ được re-embed tự động. Tuy nhiên, hãy test retrieval sau khi chỉnh sửa để đảm bảo kết quả vẫn chính xác.

Best Practices

Kiểm tra chất lượng Chunk

Sau khi tạo Knowledge Base, hãy review các chunks để phát hiện vấn đề:

· Chunks quá ngắn — Có thể thiếu đủ context, dẫn đến mất ý nghĩa ngữ cảnh và câu trả lời không chính xác

· Chunks quá dài — Có thể bao gồm thông tin không liên quan, gây nhiễu ngữ nghĩa và giảm độ chính xác retrieval

· Chunks không hoàn chỉnh ngữ nghĩa — Chunking bắt buộc cắt qua câu hoặc đoạn, dẫn đến nội dung bị thiếu hoặc sai lệch khi retrieval

Sử dụng Child Chunks làm Retrieval Hooks

Trong Parent-Child mode, child chunks đóng vai trò "hooks" — điểm bắt retrieval, sau đó parent chunk cung cấp context đầy đủ hơn.

Các loại child chunk hiệu quả:

Loại

Ví dụ

Keywords

blinking light, won't turn on, red light, connection error, frozen

Summaries

Hướng dẫn phân tích màu LED và xử lý sự cố phần cứng

Queries

Đèn đỏ liên tục nghĩa là gì?

Sử dụng Summary để kết nối Query-Content

Summary đặc biệt hữu ích trong các trường hợp:

· Câu hỏi người dùng khác ngôn ngữ tài liệu: Với tài liệu kỹ thuật viết formal, thêm summary theo cách người dùng thực sự hỏi

· Khái niệm ẩn trong chi tiết: Thêm summary mức cao surface core concepts, cho phép chunk được match mà không cần dựa vào chi tiết nhỏ

· Nội dung không phải text: Khi chunk chủ yếu là code, bảng, log — thêm summary mô tả rõ chunk chứa gì

· Chunks liên quan cần truy xuất cùng nhau: Áp dụng summary giống nhau cho các chunks liên quan để hỗ trợ grouped retrieval

📝 NOTE: Số lượng chunks liên quan trả về phụ thuộc vào giới hạn Top K trong retrieval settings.

📖 Trước: [External Knowledge API](./07-external-knowledge-api.md) · Tiếp: [Metadata](./09-metadata.md)

Last updated