Nghiên cứu · NVIDIA Technical Blog (Blog - RSS)
NVIDIA Vera CPU: Thiết lập tiêu chuẩn mới cho các tác vụ AI Agent
NVIDIA Vera CPU được tối ưu hóa để nâng cao hiệu suất cho các tác vụ AI Agent, đánh dấu bước tiến mới trong việc mở rộng khả năng suy luận và thực thi của mô hình AI trong các nhà máy thông minh.
Tóm tắt
NVIDIA Vera CPU được tối ưu hóa để nâng cao hiệu suất cho các tác vụ AI Agent, đánh dấu bước tiến mới trong việc mở rộng khả năng suy luận và thực thi của mô hình AI trong các nhà máy thông minh.
Vì sao đáng chú ý
Thông tin quan trọng về phần cứng chuyên dụng cho AI Agent, phản ánh xu hướng phát triển hạ tầng tính toán mới nhất từ NVIDIA.
Nội dung dịch chi tiết
Mỗi làn sóng AI đều tạo ra một quy luật mở rộng mới. Nếu như trước đây, việc huấn luyện sơ bộ tập trung vào dữ liệu lớn và hệ thống GPU song song, thì kỷ nguyên AI tác nhân (agentic AI) hiện nay tập trung vào việc mở rộng các hành động. Các mô hình giờ đây thực hiện nhiều bước hơn, gọi nhiều công cụ hơn và tương tác liên tục với môi trường thực thi để hoàn thành nhiệm vụ.
Trong kỷ nguyên này, CPU đóng vai trò then chốt trong đường dẫn thực thi. GPU vẫn cần thiết cho suy luận và huấn luyện, nhưng các tác vụ như truy xuất dữ liệu, lập lịch, điều phối và thực thi mã trong môi trường sandbox đều dựa vào CPU. Khi các tác nhân trở nên thông minh hơn, thời gian thực thi trên CPU trở thành yếu tố quyết định đến độ trễ, hiệu suất sử dụng bộ tăng tốc và sản lượng đầu ra của nhà máy AI.
CPU NVIDIA Vera được thiết kế để giải quyết thách thức này bằng cách kết hợp 88 lõi NVIDIA Olympus với băng thông bộ nhớ LPDDR5X lên tới 1,2 TB/s. Thiết kế này ưu tiên hiệu suất trên mỗi lõi để đảm bảo các bước thực thi tuần tự không bị nghẽn, đồng thời duy trì khả năng xử lý đồng thời cao cho hàng ngàn tác nhân cùng lúc.
Lõi Olympus mang lại hiệu suất IPC (số lệnh trên mỗi chu kỳ) cao hơn tới 50% so với thế hệ NVIDIA Grace. Với bộ dự đoán nhánh thần kinh và công cụ thực thi lệnh ngoài luồng (out-of-order) chuyên sâu, nó duy trì thông lượng ổn định cho các ngăn xếp phần mềm phức tạp như PyTorch. Ngoài ra, công nghệ Scalable Coherency Fabric (SCF) giúp kết nối các lõi với độ trễ dự đoán được, tăng tốc độ di chuyển dữ liệu giữa các lõi lên 50%.
Về hiệu quả năng lượng, Vera CPU sử dụng bộ nhớ LPDDR5X tiêu thụ ít hơn 30W, thấp hơn đáng kể so với các cấu hình DDR5 truyền thống. Với mức TDP linh hoạt từ 250W đến 450W, hệ thống này giúp các nhà máy AI tối ưu hóa chi phí vận hành, giảm nhu cầu làm mát và cải thiện hiệu suất trên mỗi watt điện năng tiêu thụ.
Kết quả thực tế cho thấy, CPU Vera mang lại hiệu suất thực thi sandbox cho AI tác nhân cao hơn 1,8 lần so với các kiến trúc x86 cạnh tranh. Đây là bước chuyển dịch quan trọng từ việc tối ưu hóa số lõi trên mỗi đô la sang tối ưu hóa sản lượng AI trên mỗi đô la và mỗi watt điện, đáp ứng nhu cầu khắt khe của các trung tâm dữ liệu AI thế hệ mới.
Ý chính từ bài gốc
- CPU Vera tích hợp 88 lõi Olympus, tối ưu hóa cho các tác vụ AI tác nhân và học tăng cường.
- Hiệu suất IPC cao hơn 50% so với NVIDIA Grace, hỗ trợ xử lý các mã lệnh phức tạp và phân nhánh.
- Băng thông bộ nhớ LPDDR5X đạt 1,2 TB/s, giúp giảm độ trễ và duy trì hiệu suất ổn định dưới tải cao.
- Tiết kiệm năng lượng vượt trội với hệ thống bộ nhớ tiêu thụ dưới 30W, tối ưu hóa chi phí vận hành nhà máy AI.
- Hiệu suất thực thi sandbox cao hơn 1,8 lần so với các kiến trúc x86 truyền thống.
Bài viết được AI dịch và tổng hợp tự động từ NVIDIA Technical Blog. Liên kết bài gốc ở phía trên. AIHOT.vn luôn dẫn nguồn đầy đủ — nếu bạn thấy điểm cần chỉnh sửa, hãy gửi ý kiến tại trang phản hồi.