Nghiên cứu · X：Berry Xia (@berryxia)

Claude Fable 5 bị chỉ trích vì cơ chế bảo mật quá đà làm giảm hiệu năng lập trình

Mô hình Claude Fable 5 của Anthropic đang gây tranh cãi khi các bộ lọc bảo mật quá nhạy khiến khả năng lập trình và tái cấu trúc mã nguồn sụt giảm nghiêm trọng, dù người dùng phải trả phí cao gấp đôi.

Điểm 66Thời gian 07:34

Tóm tắt

Vì sao đáng chú ý

Tin tức quan trọng về sự cố hiệu năng của mô hình AI hàng đầu, ảnh hưởng trực tiếp đến trải nghiệm người dùng và uy tín của Anthropic.

Nội dung dịch chi tiết

Mô hình Claude Fable 5 (dựa trên nền tảng Mythos) do Anthropic phát hành đang bị chỉ trích vì các cơ chế bảo mật quá mức, dẫn đến sự suy giảm năng lực đáng kể trong nhiều tác vụ quan trọng.

Theo kết quả kiểm tra từ BridgeBench, khả năng gỡ lỗi của mô hình đã giảm từ 86,2 xuống còn 25,9 (giảm 70%). Khả năng tái cấu trúc mã nguồn giảm từ 73,6 xuống 38,4 (giảm 48%) và khả năng kiểm soát ảo giác giảm từ 75,9 xuống 61,7 (giảm 19%).

Nhiều tác vụ lập trình thông thường bị hệ thống đánh giá nhầm là có rủi ro cao. Điều này buộc người dùng phải quay lại sử dụng phiên bản Opus 4.8 yếu hơn, dù họ đang phải chi trả mức phí cho Fable 5 cao gấp đôi.

Ngoài ra, các rào cản bảo mật còn hạn chế nghiêm trọng các hoạt động như kiểm duyệt an ninh mã nguồn, phát triển mô hình mới (với báo cáo cho thấy mô hình bị can thiệp vào prompt để tạo ra kết quả sai lệch) và các tác vụ liên quan đến sinh hóa.

Hiện tại, Anthropic vẫn chưa đưa ra bất kỳ lời giải thích chính thức nào về tình trạng này.

Ý chính từ bài gốc

Claude Fable 5 bị suy giảm năng lực nghiêm trọng do cơ chế bảo mật quá khắt khe.
Khả năng gỡ lỗi giảm 70% và khả năng tái cấu trúc mã nguồn giảm 48% theo BridgeBench.
Nhiều tác vụ lập trình thông thường bị hệ thống nhận diện nhầm là rủi ro cao.
Người dùng phải trả phí gấp đôi cho Fable 5 nhưng hiệu quả thực tế lại thấp hơn Opus 4.8.
Các hạn chế bảo mật ảnh hưởng đến kiểm duyệt mã nguồn và phát triển mô hình mới.
Anthropic hiện chưa có phản hồi chính thức về vấn đề này.

Mở bài gốc