Tạo nhanh kiến thức

Cách nhanh nhất để tạo Knowledge Base — import dữ liệu, cấu hình chunking, và ClickAI tự xử lý phần còn lại.

Mục lục

· [Quy trình Quick Create](#quy-trình-quick-create)

· [Bước 1: Import dữ liệu](#bước-1-import-dữ-liệu)

· [Bước 2: Cấu hình Chunk Settings](#bước-2-cấu-hình-chunk-settings)

· [Bước 3: Cấu hình Index Method & Retrieval Settings](#bước-3-cấu-hình-index-method--retrieval-settings)

· [Bước 4: Chờ xử lý hoàn tất](#bước-4-chờ-xử-lý-hoàn-tất)

Quy trình Quick Create

Quick Create là phương pháp phổ biến nhất để tạo Knowledge Base trên ClickAI. Quy trình gồm 4 bước chính:

1. Nhấn Knowledge > Create Knowledge, sau đó upload file từ máy, đồng bộ dữ liệu từ Notion, hoặc thu thập từ website, hoặc tạo knowledge base trống.

2. Cấu hình Chunk Settings và xem trước kết quả chunking. Giai đoạn này bao gồm tiền xử lý nội dung và cấu trúc hóa — chia văn bản dài thành nhiều chunks nhỏ hơn.

3. Chỉ định Index Method và Retrieval Settings. Khi knowledge base nhận câu hỏi từ người dùng, nó sẽ tìm kiếm trong các tài liệu hiện có theo phương pháp retrieval đã cấu hình và trích xuất các chunks có liên quan cao nhất.

4. Chờ quá trình xử lý dữ liệu hoàn tất.

💡 TIP: Bạn có thể tạo Knowledge Base trống trước rồi thêm tài liệu sau. Điều này hữu ích khi bạn muốn chuẩn bị cấu hình trước.

Bước 1: Import dữ liệu

ClickAI hỗ trợ 3 nguồn import dữ liệu:

Upload Local Files (Upload file từ máy)

Hỗ trợ các định dạng tài liệu phổ biến:

Định dạng

Mô tả

.txt

Văn bản thuần (plain text)

.md / .markdown

Tài liệu Markdown

.pdf

Tài liệu PDF

.html / .htm

Trang web HTML

.docx

Microsoft Word

.csv

Bảng dữ liệu CSV

.xlsx / .xls

Microsoft Excel

.pptx

Microsoft PowerPoint

Giới hạn upload:

Thông số

Giá trị

Số file tối đa mỗi lần upload

20

Kích thước file tối đa

15 MB

📝 NOTE: ClickAI hỗ trợ xử lý hình ảnh nhúng trong file DOCX. Đối với các loại file khác (ví dụ PDF), bạn có thể sử dụng plugin trích xuất tài liệu trong Knowledge Pipeline để extract hình ảnh.

Hình ảnh qua URL Markdown: Ngoài hình ảnh nhúng, ClickAI cũng hỗ trợ hình ảnh được tham chiếu qua URL sử dụng cú pháp Markdown:

![alt text](image_url) ![alt text](image_url "optional title")

Sync Data from Notion (Đồng bộ từ Notion)

Kết nối tài khoản Notion để đồng bộ trang và database trực tiếp vào Knowledge Base.

Cách thực hiện:

5. Vào Knowledge > Create Knowledge

6. Chọn nguồn dữ liệu Sync from Notion

7. Nếu chưa kết nối, nhấn Connect để ủy quyền tài khoản Notion

8. Chọn các trang Notion muốn đồng bộ

9. Nhấn Import để bắt đầu

⚠️ IMPORTANT: Khi sử dụng Notion sync, nội dung sẽ được đồng bộ tại thời điểm import. Để cập nhật nội dung mới, bạn cần re-sync thủ công.

Import Data from Website (Thu thập từ website)

Crawl nội dung từ các trang web công khai để tạo Knowledge Base.

Cách thực hiện:

10. Vào Knowledge > Create Knowledge

11. Chọn nguồn dữ liệu Sync from Website

12. Nhập URL cần crawl

13. Cấu hình phạm vi crawl (single page hoặc crawl sub-pages)

14. Nhấn Run để bắt đầu thu thập

Bước 2: Cấu hình Chunk Settings

Xem chi tiết tại: [Cấu hình Chunk Settings](./03-chunk-settings.md)

Bước 3: Cấu hình Index Method & Retrieval Settings

Xem chi tiết tại: [Index Method & Retrieval Settings](./04-index-retrieval-settings.md)

Bước 4: Chờ xử lý hoàn tất

Sau khi cấu hình xong, nhấn Save & Process. ClickAI sẽ tự động:

· Tiền xử lý văn bản (loại bỏ ký tự thừa, chuẩn hóa)

· Chia tài liệu thành các chunks theo cấu hình

· Tạo embedding vectors cho từng chunk

· Lập chỉ mục (indexing) để sẵn sàng cho truy xuất

Thời gian xử lý phụ thuộc vào:

· Số lượng và kích thước tài liệu

· Phương pháp indexing đã chọn (High Quality mất nhiều thời gian hơn Economical)

💡 TIP: Bạn có thể theo dõi tiến trình xử lý trong trang chi tiết Knowledge Base. Trạng thái sẽ chuyển từ "Processing" sang "Available" khi hoàn tất.

📖 Trước: [Tổng quan](./01-overview.md) · Tiếp: [Cấu hình Chunk Settings](./03-chunk-settings.md)

Last updated