Mô hình · Artificial Analysis
Anthropic ra mắt Claude Opus 4.8, thiết lập kỷ lục mới trên bảng xếp hạng GDPval-AA
Claude Opus 4.8 vừa chính thức soán ngôi đầu bảng xếp hạng GDPval-AA với 1890 điểm, vượt xa GPT-5.5 xhigh với tỷ lệ thắng áp đảo 67% trong các tác vụ thực tế.
Tóm tắt
Claude Opus 4.8 vừa chính thức soán ngôi đầu bảng xếp hạng GDPval-AA với 1890 điểm, vượt xa GPT-5.5 xhigh với tỷ lệ thắng áp đảo 67% trong các tác vụ thực tế.
Vì sao đáng chú ý
Đây là tin tức quan trọng về sự thay đổi vị thế dẫn đầu trong cuộc đua mô hình AI, có tính thời sự cao và tác động trực tiếp đến cộng đồng công nghệ.
Nội dung dịch chi tiết
Anthropic đã chính thức công bố mô hình Claude Opus 4.8. Đây là phiên bản mới nhất được kỳ vọng sẽ nâng cao tiêu chuẩn cho các mô hình ngôn ngữ lớn trong việc xử lý các tác vụ thực tế.
Trong các bài kiểm tra trên bảng xếp hạng GDPval-AA của công ty Artificial Analysis, Claude Opus 4.8 đã đạt được 1890 điểm ở thiết lập nỗ lực "max". Đây là bảng xếp hạng tập trung vào khả năng thực hiện các công việc thực tế của các tác nhân AI.
Kết quả này đánh dấu bước tiến đáng kể so với phiên bản tiền nhiệm Opus 4.7, với mức tăng 137 điểm. Đồng thời, Opus 4.8 cũng dẫn trước mô hình xếp thứ hai là GPT-5.5 xhigh với cách biệt 121 điểm.
Trong các bài so sánh trực tiếp, Claude Opus 4.8 thể hiện ưu thế rõ rệt với tỷ lệ thắng khoảng 67% so với GPT-5.5 xhigh.
Trước khi chính thức phát hành rộng rãi, Anthropic đã cung cấp quyền truy cập sớm cho Artificial Analysis để thực hiện các đánh giá chuyên sâu về hiệu năng của mô hình này.
Ý chính từ bài gốc
- Anthropic ra mắt mô hình Claude Opus 4.8 với hiệu suất vượt trội.
- Đạt 1890 điểm trên bảng xếp hạng GDPval-AA, dẫn đầu thị trường hiện nay.
- Vượt qua phiên bản tiền nhiệm Opus 4.7 với khoảng cách 137 điểm.
- Đạt tỷ lệ thắng 67% trong các bài so sánh trực tiếp với GPT-5.5 xhigh.
- Được đánh giá bởi Artificial Analysis thông qua quyền truy cập sớm.
Bài viết được AI dịch và tổng hợp tự động từ X/Twitter. Liên kết bài gốc ở phía trên. AIHOT.vn luôn dẫn nguồn đầy đủ — nếu bạn thấy điểm cần chỉnh sửa, hãy gửi ý kiến tại trang phản hồi.