Nghiên cứu · OpenRouter: Announcements

OpenRouter ra mắt Guardrails: Bộ công cụ bảo mật và quản trị toàn diện cho AI

OpenRouter giới thiệu Guardrails, bộ công cụ giúp kiểm soát ngân sách, bảo mật dữ liệu, ngăn chặn tấn công prompt injection và quản lý quyền truy cập mô hình cho các AI agent.

Điểm 56Thời gian 19:00 · 29/05/2026

Tóm tắt

Vì sao đáng chú ý

Đây là bản cập nhật quan trọng cho các nhà phát triển AI, giải quyết trực tiếp các vấn đề nhức nhối về chi phí và bảo mật khi triển khai ứng dụng thực tế.

Nội dung dịch chi tiết

OpenRouter vừa ra mắt Guardrails, bộ công cụ bảo mật và quản trị có thể cấu hình để thực thi ngân sách, đảm bảo không lưu trữ dữ liệu (ZDR), hạn chế mô hình và nhà cung cấp, cũng như phòng chống tấn công prompt injection và mất mát dữ liệu.

Người dùng có thể áp dụng các quy tắc này cho toàn bộ không gian làm việc hoặc tạo các thiết lập tùy chỉnh cho từng nhóm thành viên và khóa API mà không cần can thiệp vào mã nguồn. Bạn có thể quản lý Guardrails thông qua bảng điều khiển tại mục Workspaces > Guardrails hoặc sử dụng API quản lý.

Tính năng kiểm soát ngân sách cho phép đặt giới hạn chi tiêu theo ngày, tuần hoặc tháng. Khi vượt quá giới hạn, các yêu cầu sẽ bị từ chối với mã lỗi 402. Ngân sách được áp dụng riêng biệt cho từng thực thể; ví dụ, nếu một thành viên có giới hạn 100 USD/ngày và khóa API của họ có giới hạn 30 USD/ngày, hệ thống sẽ kiểm tra cả hai ngưỡng này trên mỗi yêu cầu.

Với tính năng ZDR và hạn chế mô hình, bạn có thể chặn các nhà cung cấp lưu trữ hoặc huấn luyện trên dữ liệu của mình chỉ bằng một cú nhấp chuột. Các yêu cầu không hợp lệ sẽ nhận phản hồi 404. Điều này giúp đảm bảo lưu lượng truy cập chỉ nằm trong danh sách cho phép và các nhà cung cấp đã được kiểm duyệt.

Hệ thống phòng chống Prompt Injection quét đầu vào dựa trên hơn 30 mẫu regex từ OWASP để phát hiện các nỗ lực jailbreak. Quá trình này diễn ra trước khi gửi yêu cầu đến nhà cung cấp mô hình, giúp chặn lưu lượng độc hại ngay tại OpenRouter. Bạn có thể chọn các hành động: Gắn cờ (Flag), Che giấu (Redact) hoặc Chặn (Block).

Tính năng ngăn chặn mất mát dữ liệu (DLP) giúp phát hiện thông tin nhạy cảm (PII) như số thẻ tín dụng, email, hoặc dữ liệu tùy chỉnh thông qua regex và xử lý ngôn ngữ tự nhiên (NLP). Bạn có thể cấu hình để che giấu hoặc chặn hoàn toàn các yêu cầu chứa thông tin nhạy cảm, đảm bảo tuân thủ các cam kết bảo mật dữ liệu.

Ý chính từ bài gốc

Kiểm soát ngân sách linh hoạt theo ngày, tuần, tháng cho từng thành viên hoặc khóa API.
Tính năng ZDR và hạn chế nhà cung cấp giúp bảo vệ dữ liệu và kiểm soát chi phí mô hình.
Phòng chống Prompt Injection bằng cách quét các mẫu độc hại trước khi gửi yêu cầu.
Ngăn chặn mất mát dữ liệu (DLP) với khả năng phát hiện PII qua regex và NLP.
Dễ dàng quản lý qua bảng điều khiển hoặc API mà không cần thay đổi mã nguồn.

Mở bài gốc

Bài viết được AI dịch và tổng hợp tự động từ OpenRouter. Liên kết bài gốc ở phía trên. AIHOT.vn luôn dẫn nguồn đầy đủ — nếu bạn thấy điểm cần chỉnh sửa, hãy gửi ý kiến tại trang phản hồi.

Tóm tắt

Vì sao đáng chú ý

Nội dung dịch chi tiết

Ý chính từ bài gốc

Bài liên quan