Giới Hạn Bot: Session, Token, Request – Cần Biết Trước Khi Dùng

Giới hạn bot chatbot Mimo với session token request minh họa hệ thống AI

Hiểu rõ giới hạn Session, Token, Request trong chatbot Mimo để tối ưu hiệu suất, tránh lỗi và tiết kiệm chi phí vận hành.

Khi bắt đầu đưa chatbot vào vận hành thực tế, việc nắm rõ các chỉ số kỹ thuật là điều kiện tiên quyết để đảm bảo trải nghiệm khách hàng không bị gián đoạn. Trong bài viết này, chúng ta sẽ đi sâu vào việc giải thích giới hạn chatbot AI session token request trên hệ thống của Mimo Group.

Hiểu đúng về chatbot limit sẽ giúp bạn thiết lập kịch bản dự phòng hợp lý và chọn được gói cước tối ưu nhất cho doanh nghiệp của mình.


Session là gì và tính thế nào?

Session chatbot là gì? Trong kỹ thuật, một session (phiên) là một cuộc trò chuyện liên tục giữa người dùng và chatbot, được định danh thông qua một session_id. Phiên này có thể được tái sử dụng nếu người dùng quay lại trong khoảng thời gian chờ.

Để chống lạm dụng và kiểm soát luồng tư vấn, hệ thống áp dụng giới hạn session bot chung cho tất cả gói cước:

  • Gói Starter: Tối đa 10 tin nhắn/người dùng trong 1 session.
  • Gói Growth: Tối đa 10 tin nhắn/người dùng trong 1 session.
  • Gói Pro: Tối đa 10 tin nhắn/người dùng trong 1 session.

Điều gì xảy ra khi chạm giới hạn? Hệ thống sẽ kích hoạt trạng thái bảo vệ . Lúc này, chatbot sẽ tự động ngừng sinh câu trả lời AI và sử dụng kịch bản chuyển giao mà bạn đã cấu hình (ví dụ: “Bạn đã đạt giới hạn câu hỏi, vui lòng để lại SĐT để nhân viên hỗ trợ”).


Token và cách chatbot dùng token

Token chatbot là gì? AI không đọc chữ cái như con người mà chia văn bản thành các đơn vị nhỏ gọi là “token” (trung bình 1 token tương đương khoảng 3/4 từ tiếng Anh, với tiếng Việt sẽ tốn nhiều token hơn một chút).

Mỗi khi người dùng hỏi, chatbot không chỉ tiêu tốn token cho câu hỏi đó, mà tổng lượng token tính phí sẽ bao gồm: Định dạng vai trò + Dữ liệu truy hồi từ RAG/Sitemap + Lịch sử chat + Câu trả lời của bot.

Token limit chatbot được cấp mới mỗi ngày tùy theo gói:

  • Gói Starter: 50,000 token/ngày.
  • Gói Growth: 200,000 token/ngày.
  • Gói Pro: 600,000 token/ngày.

Khi vượt mức này, bot sẽ tạm ngưng và sử dụng kịch bản chuyển giao mà bạn đã cấu hình. Nói cách khác, khi đó bot sẽ tự gửi link zalo nếu người dùng vẫn tiếp tục tương tác.


Request/Message limit mỗi ngày

Bên cạnh token, nền tảng còn có các cơ chế request limit chatbot (giới hạn số lượng tin nhắn thực tế) để cân bằng tải và chống Spam.

1. Giới hạn tổng số tin nhắn toàn hệ thống mỗi ngày (message_limit_daily):

  • Starter: 300 tin/ngày.
  • Growth: 800 tin/ngày.
  • Pro: 1,500 tin/ngày.

2. Giới hạn tin nhắn trên mỗi người dùng riêng biệt :
Tránh việc 1 người dùng spam hết sạch ngân sách chat của cả hệ thống.

  • Starter: 10 tin/visitor/ngày.
  • Growth: 10 tin/visitor/ngày.
  • Pro: 10 tin/visitor/ngày.

3. Giới hạn kỹ thuật chống Spam :

  • Cooldown (Thời gian nghỉ giữa 2 tin nhắn): 4 giây (Starter), 3 giây (Growth), 2 giây (Pro).
  • Burst limit (Chống spam liên hoàn): Chặn nếu gửi quá 4/5/6 tin nhắn liên tục trong vòng 30 giây.

Giới hạn theo từng gói giá (Bảng tóm tắt)

Để có cái nhìn tổng quan nhất, bạn có thể xem bảng giới hạn theo plan chi tiết dưới đây:

Chỉ số kỹ thuật Gói Starter Gói Growth Gói Pro
Số Bot tối đa 2 4 10
Token giới hạn / Ngày 50,000 200,000 600,000
Tổng tin nhắn / Ngày 300 800 1,500
Tin nhắn tối đa / Session 10 15 20
Tin nhắn tối đa / Visitor / Ngày 10 15 20
Cooldown (Chờ giữa 2 tin) 4 giây 3 giây 2 giây
Burst limit (Tin gửi nhanh/30s) 4 tin / 30s 5 tin / 30s 6 tin / 30s
Thời gian khóa nếu Spam 10 phút 10 phút 8 phút
Độ dài tối đa (Ký tự / 1 tin hỏi) 200 200 200

Khi nào cần nâng cấp (theo đúng limit)?

Việc theo dõi các giới hạn bot theo gói sẽ giúp bạn chủ động vận hành. Bạn nên cân nhắc truy cập bảng giá dịch vụ Chatbot AI của Mimo để nâng cấp lên gói cao hơn khi:

  • Chạm trần tin nhắn ngày: Hệ thống báo lỗi hết 300 tin (Starter) thì cần lên Growth, hết 800 tin (Growth) thì cần lên Pro.
  • Sản phẩm tư vấn phức tạp: Nếu khách hàng của bạn thường xuyên cần hỏi sâu và chat dài hơn 10/15/20 tin trong một phiên (session).
  • Traffic cao đột biến: Vào các dịp Sale, lượng khách hỏi cùng lúc quá lớn khiến bị vướng các chính sách Cooldown/Burst chặn spam.
  • Mở rộng quy mô: Khi bạn có nhiều Website/Fanpage và cần tạo số lượng bot vượt mức 2/4/10 bot mặc định.

(Đọc thêm về cách cấu hình chuẩn tại: Hướng Dẫn Cài Đặt & Vận Hành Chatbot AI Cho Website


Câu hỏi thường gặp

1. Vì sao khách hàng gửi tin nhắn nhanh lại bị chặn?
Đây là tính năng bảo vệ hệ thống. Nếu khách chat quá nhanh (ví dụ: gửi 5 tin liên tiếp trong vòng 30 giây ở gói Starter), cơ chế Burst limitCooldown sẽ kích hoạt và tạm khóa khách hàng đó (Spam block) trong vài phút để ngăn chặn phá hoại.

2. Vì sao mới đầu ngày mà bot đã báo hết lượt?
Có hai khả năng: Một là toàn bộ khách hàng trên website đã dùng hết tổng số tin nhắn trong ngày, hai là một khách hàng cá biệt đã hỏi hết hạn mức của chính họ trong ngày hôm đó.

3. Token được tính như thế nào?
AI xử lý cả văn bản đầu vào và đầu ra. Ví dụ: Prompt của bạn có 500 token, tài liệu RAG quét ra 1000 token, khách hỏi tốn 20 token, bot trả lời tốn 200 token. Vậy tổng 1 lượt hỏi đáp đó sẽ tiêu tốn: 500 + 1000 + 20 + 200 = 1,720 token.

4. Giới hạn 200 ký tự/tin nghĩa là gì?
Để tránh việc người dùng copy-paste một bài văn siêu dài vào khung chat gây lãng phí Token, hệ thống giới hạn khung nhập liệu tối đa 200 ký tự cho mỗi câu hỏi của khách hàng (áp dụng cho cả 3 gói).

5. Khi bị chặn do đạt giới hạn, bot sẽ phản hồi như thế nào?
Bot sẽ không trả về mã lỗi kỹ thuật khó hiểu mà sẽ sử dụng kịch bản chuyển giao (Handoff templates) mà bạn đã cấu hình. Ví dụ: “Hiện tại lượng khách hàng quá tải, quý khách vui lòng liên hệ Zalo 0123… để được hỗ trợ nhanh nhất”.


Mimo Group
Chuyên SEO, thiết kế website và marketing online cho doanh nghiệp.