← Quay lại dòng tin

Mô hình · The Decoder: AI News

Anthropic ra mắt Claude Opus 4.8: Cải tiến nhỏ nhưng chất, vượt mặt GPT-5.5 trong nhiều bài kiểm tra

Claude Opus 4.8 vừa trình làng với khả năng sửa lỗi code vượt trội gấp 4 lần và tính năng luồng công việc động, cho phép vận hành hàng trăm tác nhân AI song song để xử lý các dự án phức tạp.

Điểm 92Thời gian

Tóm tắt

Claude Opus 4.8 vừa trình làng với khả năng sửa lỗi code vượt trội gấp 4 lần và tính năng luồng công việc động, cho phép vận hành hàng trăm tác nhân AI song song để xử lý các dự án phức tạp.

Vì sao đáng chú ý

Đây là bản cập nhật quan trọng từ một đối thủ lớn trong ngành AI, mang đến những cải tiến thực tế về hiệu suất và tính năng tự động hóa, rất đáng để cộng đồng công nghệ quan tâm.

Nội dung dịch chi tiết

Anthropic chính thức phát hành Claude Opus 4.8, mô hình ngôn ngữ AI mới nhất mà công ty khẳng định là đã vượt qua các đối thủ như GPT-5.5 của OpenAI và Gemini 3.1 Pro của Google trong hầu hết các tiêu chuẩn đánh giá. Điểm nổi bật của phiên bản này là khả năng tự nhận diện lỗi lập trình tốt hơn gấp bốn lần so với người tiền nhiệm Opus 4.7.

Một trong những tính năng quan trọng nhất là "quy trình làm việc động" (dynamic workflows). Tính năng này cho phép mô hình lập kế hoạch và khởi chạy hàng trăm tác nhân phụ (sub-agents) song song trong một phiên làm việc duy nhất. Điều này giúp Claude Code có thể xử lý các tác vụ phức tạp như di chuyển toàn bộ cơ sở mã (codebase) với hàng trăm nghìn dòng lệnh từ khâu lập kế hoạch đến khi hoàn tất.

Anthropic cũng bổ sung tính năng kiểm soát nỗ lực (effort control) trên giao diện claude.ai và Cowork. Người dùng có thể điều chỉnh mức độ "cố gắng" của AI khi tạo phản hồi: tăng mức độ cho các tác vụ tư duy sâu hoặc giảm xuống để có câu trả lời nhanh hơn nhằm tiết kiệm hạn mức sử dụng. Mặc dù Opus 4.8 mặc định ở mức "cao", công ty khuyến nghị sử dụng mức "tối đa" cho các nhiệm vụ khó.

Về chi phí, giá API tiêu chuẩn vẫn giữ nguyên so với Opus 4.7, ở mức 5 USD cho mỗi triệu token đầu vào và 25 USD cho mỗi triệu token đầu ra. Tuy nhiên, theo dữ liệu từ Artificial Analysis, Opus 4.8 có thể giúp giảm chi phí thực tế nhờ hiệu suất làm việc tốt hơn, cần ít lượt xử lý và ít token đầu ra hơn để hoàn thành cùng một tác vụ so với phiên bản trước.

Cuối cùng, Anthropic nhấn mạnh vào sự trung thực của mô hình. Các thử nghiệm cho thấy Opus 4.8 ít đưa ra các tuyên bố không có căn cứ và thường xuyên gắn cờ các điểm chưa chắc chắn trong công việc của mình. Các tính năng mới này hiện đã có sẵn cho người dùng các gói Enterprise, Team và Max.

Ý chính từ bài gốc

  • Claude Opus 4.8 vượt qua GPT-5.5 và Gemini 3.1 Pro trong hầu hết các bài kiểm tra hiệu năng.
  • Tính năng quy trình làm việc động cho phép khởi chạy hàng trăm tác nhân phụ để xử lý tác vụ phức tạp.
  • Người dùng có thể tùy chỉnh mức độ nỗ lực của AI để cân bằng giữa chất lượng phản hồi và tốc độ.
  • Khả năng tự phát hiện lỗi lập trình được cải thiện gấp 4 lần so với phiên bản Opus 4.7.
  • Chi phí API tiêu chuẩn không đổi, nhưng hiệu suất cao hơn giúp tối ưu hóa chi phí thực tế cho người dùng.

Bài viết được AI dịch và tổng hợp tự động từ The Decoder. Liên kết bài gốc ở phía trên. AIHOT.vn luôn dẫn nguồn đầy đủ — nếu bạn thấy điểm cần chỉnh sửa, hãy gửi ý kiến tại trang phản hồi.