← Quay lại dòng tin

Sản phẩm · NVIDIA Technical Blog (Blog - RSS)

Microsoft hợp tác cùng NVIDIA ra mắt công cụ hỗ trợ xây dựng AI Agent cá nhân trên Windows

Microsoft và NVIDIA vừa giới thiệu bộ công cụ mới giúp đơn giản hóa quy trình phát triển và triển khai các AI Agent thế hệ mới ngay trên máy tính Windows, đảm bảo tính bảo mật và hiệu năng tối ưu.

Điểm 66Thời gian

Tóm tắt

Microsoft và NVIDIA vừa giới thiệu bộ công cụ mới giúp đơn giản hóa quy trình phát triển và triển khai các AI Agent thế hệ mới ngay trên máy tính Windows, đảm bảo tính bảo mật và hiệu năng tối ưu.

Vì sao đáng chú ý

Tin tức quan trọng về hạ tầng phát triển AI, đánh dấu bước tiến lớn trong việc đưa AI Agent lên thiết bị cá nhân, thu hút sự quan tâm của cả lập trình viên và người dùng.

Nội dung dịch chi tiết

NVIDIA và Microsoft vừa công bố loạt công cụ mới tại COMPUTEX 2026 nhằm hỗ trợ phát triển các AI agent chạy cục bộ trên Windows. Các giải pháp này bao gồm Microsoft eXecution Containers (MXC) để tăng cường bảo mật và NVIDIA OpenShell để tích hợp runtime, giúp các agent hoạt động an toàn mà không cần truy cập toàn bộ hệ thống.

Dòng sản phẩm NVIDIA RTX Spark (bao gồm máy tính để bàn và laptop) được thiết kế cho kỷ nguyên trợ lý cá nhân, cung cấp hiệu suất AI lên tới 1 petaflop và bộ nhớ 128 GB. Microsoft cũng ra mắt phiên bản Surface RTX Spark Dev Box, được cài đặt sẵn các công cụ phát triển chuyên dụng.

Các nền tảng như NVIDIA NemoClaw, Hermes Agent và mô hình Holo 3.1 của H Company đã được nâng cấp để mở rộng khả năng của agent. Đặc biệt, mô hình Holo 3.1 hỗ trợ "Computer Use", cho phép agent thực hiện các thao tác trên màn hình như con người, với hiệu suất trên GPU NVIDIA tăng gấp đôi.

Để tối ưu hóa hiệu suất, NVIDIA đã hợp tác với cộng đồng mã nguồn mở để cải tiến các backend suy luận như llama.cpp và vLLM. Việc áp dụng kỹ thuật Multi-Token Prediction (MTP) và Programmatic Dependent Launch (PDL) giúp tăng tốc độ suy luận đáng kể, đặc biệt là trên các mô hình ngôn ngữ lớn.

Khả năng hỗ trợ đa GPU cũng được cải thiện thông qua kỹ thuật song song tensor (Tensor Parallelism) trong llama.cpp và phương pháp Classifier-Free Guidance (CFG) trong ComfyUI. Điều này cho phép người dùng chạy các mô hình lớn hơn và tận dụng tối đa sức mạnh của hai GPU trên PC.

Cuối cùng, bộ công cụ NVIDIA AI for Media SDK (AI4M) đã được mở rộng với các tính năng như LipSync và Active Speaker Detection (ASD) đạt chuẩn GA. Nền tảng Windows AI cũng được tăng tốc bởi NVIDIA TensorRT, giúp các ứng dụng Windows khai thác tối đa sức mạnh phần cứng RTX.

Ý chính từ bài gốc

  • Microsoft eXecution Containers (MXC) và NVIDIA OpenShell giúp bảo mật AI agent trên Windows.
  • Dòng sản phẩm RTX Spark cung cấp hiệu suất AI lên tới 1 petaflop cho các tác vụ cá nhân.
  • Mô hình Holo 3.1 hỗ trợ khả năng điều khiển máy tính (Computer Use) với hiệu suất tăng gấp đôi.
  • Kỹ thuật Multi-Token Prediction giúp tăng tốc độ suy luận trên llama.cpp và vLLM.
  • Hỗ trợ đa GPU giúp chạy các mô hình lớn hơn với hiệu suất tăng lên đến 1.8x - 2x.

Bài viết được AI dịch và tổng hợp tự động từ NVIDIA Technical Blog. Liên kết bài gốc ở phía trên. AIHOT.vn luôn dẫn nguồn đầy đủ — nếu bạn thấy điểm cần chỉnh sửa, hãy gửi ý kiến tại trang phản hồi.