← Quay lại dòng tin

Nghiên cứu · NVIDIA Blog: Generative AI (Web)

Cosmos 3: Bước tiến của NVIDIA giúp AI 'suy nghĩ' trước khi hành động trong thế giới thực

NVIDIA ra mắt Cosmos 3, mô hình nền tảng vật lý cho phép AI mô phỏng và suy luận trước khi thực thi hành động. Công nghệ này giúp tối ưu hóa quá trình huấn luyện robot và các hệ thống tự hành từ môi t

Điểm 66Thời gian

Tóm tắt

NVIDIA ra mắt Cosmos 3, mô hình nền tảng vật lý cho phép AI mô phỏng và suy luận trước khi thực thi hành động. Công nghệ này giúp tối ưu hóa quá trình huấn luyện robot và các hệ thống tự hành từ môi trường giả lập sang thực tế.

Vì sao đáng chú ý

Đây là bước đột phá quan trọng trong lĩnh vực AI hiện thân (Embodied AI), giải quyết bài toán cốt lõi về khả năng suy luận vật lý cho robot, có tính ứng dụng thực tiễn cao.

Nội dung dịch chi tiết

NVIDIA đã chính thức công bố Cosmos 3, một mô hình nền tảng thế giới (world foundation model) được thiết kế chuyên biệt cho AI vật lý. Mục tiêu cốt lõi của mô hình này là hỗ trợ các hệ thống AI thực hiện quá trình "suy nghĩ" và mô phỏng các tình huống trước khi đưa ra hành động trong thế giới thực.

Cosmos 3 là một mô hình ngôn ngữ thị giác (vision-language model) tiên tiến, có khả năng hỗ trợ suy luận dựa trên các quy luật vật lý. Khả năng này cho phép hệ thống hiểu rõ hơn về môi trường xung quanh, từ đó đưa ra các quyết định chính xác và an toàn hơn cho các robot hoặc hệ thống tự hành.

Một trong những ưu điểm nổi bật của Cosmos 3 là khả năng tạo ra dữ liệu tổng hợp chất lượng cao. Dữ liệu này đóng vai trò quan trọng trong việc huấn luyện các robot và hệ thống tự hành, giúp chúng làm quen với nhiều kịch bản phức tạp mà không cần phải thử nghiệm trực tiếp ngay từ đầu.

Hiện tại, Cosmos 3 đã được cung cấp thông qua API với độ dài ngữ cảnh lên tới 200k tokens. Việc tích hợp mô hình này hứa hẹn sẽ rút ngắn đáng kể thời gian phát triển, giúp các nhà nghiên cứu và kỹ sư chuyển đổi quy trình từ giai đoạn mô phỏng sang triển khai thực tế một cách hiệu quả hơn.

Ý chính từ bài gốc

  • NVIDIA ra mắt Cosmos 3, mô hình nền tảng thế giới dành cho AI vật lý.
  • Hỗ trợ AI 'suy nghĩ' và mô phỏng hành động trước khi thực hiện trong thực tế.
  • Là mô hình ngôn ngữ thị giác có khả năng suy luận dựa trên vật lý.
  • Cung cấp dữ liệu tổng hợp chất lượng cao để huấn luyện robot và hệ thống tự hành.
  • Hỗ trợ API với độ dài ngữ cảnh 200k tokens, tăng tốc quy trình phát triển từ mô phỏng đến thực tế.

Bài viết được AI dịch và tổng hợp tự động từ NVIDIA Blog. Liên kết bài gốc ở phía trên. AIHOT.vn luôn dẫn nguồn đầy đủ — nếu bạn thấy điểm cần chỉnh sửa, hãy gửi ý kiến tại trang phản hồi.