Nghiên cứu · Artificial Analysis
NVIDIA ra mắt Nemotron 3 Ultra: Mô hình 550B tham số với tốc độ suy luận vượt trội
NVIDIA vừa trình làng Nemotron 3 Ultra, mô hình mạnh mẽ nhất trong dòng Nemotron 3 với 550 tỷ tham số. Sản phẩm gây ấn tượng nhờ tốc độ suy luận đạt hơn 300 tokens/s, vượt xa các đối thủ cùng phân khú
Tóm tắt
NVIDIA vừa trình làng Nemotron 3 Ultra, mô hình mạnh mẽ nhất trong dòng Nemotron 3 với 550 tỷ tham số. Sản phẩm gây ấn tượng nhờ tốc độ suy luận đạt hơn 300 tokens/s, vượt xa các đối thủ cùng phân khúc.
Vì sao đáng chú ý
Đây là bước tiến lớn của NVIDIA trong lĩnh vực mô hình mở, kết hợp giữa hiệu năng thông minh và tốc độ suy luận cực nhanh, rất đáng chú ý với cộng đồng AI.
Nội dung dịch chi tiết
NVIDIA vừa chính thức công bố Nemotron 3 Ultra tại sự kiện Computex. Đây là phiên bản lớn nhất trong dòng Nemotron 3 với tổng số tham số lên tới 550 tỷ (trong đó có 55 tỷ tham số kích hoạt).
Theo đánh giá từ Artificial Analysis Intelligence Index, Nemotron 3 Ultra hiện là mô hình có trọng số mở thông minh nhất tại Mỹ. Với số điểm 48, mô hình này đã vượt qua Gemma 4 31B (39 điểm), tuy nhiên vẫn xếp sau K2.6 của Moonshot AI (Kimi) với 54 điểm.
Về tốc độ suy luận, Nemotron 3 Ultra đạt hiệu suất ấn tượng trên các điểm cuối (endpoint) tiền phát hành với tốc độ vượt ngưỡng 300 tokens/giây. Con số này cao hơn đáng kể so với mức 50-100 tokens/giây thường thấy ở các mô hình cùng cấp độ từ Trung Quốc.
Để tối ưu hóa hiệu suất suy luận, NVIDIA sẽ cung cấp mô hình dưới dạng trọng số BF16 và phiên bản lượng tử hóa NVFP4.
Ý chính từ bài gốc
- NVIDIA ra mắt Nemotron 3 Ultra với 550 tỷ tham số (55 tỷ tham số kích hoạt).
- Đạt 48 điểm trên bảng xếp hạng Artificial Analysis, vượt qua Gemma 4 31B.
- Tốc độ suy luận vượt 300 tokens/giây, nhanh hơn nhiều so với các mô hình cùng phân khúc.
- Cung cấp tùy chọn trọng số BF16 và phiên bản lượng tử hóa NVFP4 để tối ưu hiệu suất.
Bài viết được AI dịch và tổng hợp tự động từ X/Twitter. Liên kết bài gốc ở phía trên. AIHOT.vn luôn dẫn nguồn đầy đủ — nếu bạn thấy điểm cần chỉnh sửa, hãy gửi ý kiến tại trang phản hồi.