Mô hình · MarkTechPost
MiniMax ra mắt mô hình M3: Kiến trúc MSA đột phá, hỗ trợ 1 triệu token và khả năng đa phương thức
MiniMax vừa trình làng mô hình M3 với kiến trúc MSA độc quyền, hỗ trợ cửa sổ ngữ cảnh lên tới 1 triệu token cùng khả năng xử lý hình ảnh, video và lập trình tác tử (agent) chuyên sâu.
Tóm tắt
MiniMax vừa trình làng mô hình M3 với kiến trúc MSA độc quyền, hỗ trợ cửa sổ ngữ cảnh lên tới 1 triệu token cùng khả năng xử lý hình ảnh, video và lập trình tác tử (agent) chuyên sâu.
Vì sao đáng chú ý
Đây là bước tiến quan trọng của MiniMax trong cuộc đua mô hình ngôn ngữ lớn, đặc biệt với kiến trúc MSA và khả năng xử lý ngữ cảnh cực lớn, rất đáng chú ý với cộng đồng AI.
Nội dung dịch chi tiết
Vào ngày 1/6/2026, MiniMax đã chính thức ra mắt MiniMax M3, thế hệ kế tiếp của dòng M-series. Điểm nhấn kỹ thuật quan trọng nhất là kiến trúc MiniMax Sparse Attention (MSA), giúp giải quyết bài toán độ phức tạp tính toán của các mô hình truyền thống, cho phép M3 duy trì cửa sổ ngữ cảnh 1 triệu token với hiệu suất vượt trội.
Kiến trúc MSA tối ưu hóa bộ nhớ đệm KV thông qua phương pháp "KV outer gather Q", giúp tăng tốc độ xử lý lên gấp 4 lần so với các triển khai mã nguồn mở hiện có. Tại mức ngữ cảnh 1 triệu token, chi phí tính toán trên mỗi token của M3 chỉ bằng 1/20 so với thế hệ M2, đồng thời tốc độ giai đoạn prefill và giải mã tăng lần lượt hơn 9 lần và 15 lần.
Khác với các mô hình bổ sung khả năng đa phương thức sau huấn luyện, M3 được đào tạo hỗn hợp ngay từ đầu với dữ liệu văn bản, hình ảnh và video. Với quy mô dữ liệu lên tới 100 nghìn tỷ token, mô hình này có khả năng hiểu tài liệu đa phương thức và vận hành máy tính để bàn một cách tự nhiên.
Trong các bài kiểm tra hiệu năng, M3 đạt 59% trên SWE-Bench Pro, vượt qua GPT-5.5 và Gemini 3.1 Pro. Mô hình cũng thể hiện năng lực tác nhân (agentic) mạnh mẽ thông qua các thử nghiệm thực tế như tự động tái hiện nghiên cứu khoa học, tối ưu hóa nhân CUDA và tự động hóa quy trình huấn luyện mô hình mà không cần sự can thiệp của con người.
MiniMax cũng giới thiệu MiniMax Code, một sản phẩm tác nhân được xây dựng dựa trên M3, hỗ trợ các quy trình làm việc đa giai đoạn, tự động sửa lỗi thông qua vòng lặp kiểm chứng và khả năng điều khiển ứng dụng trên máy tính. Các trọng số mô hình và báo cáo kỹ thuật dự kiến sẽ được công bố công khai trong vòng 10 ngày kể từ ngày ra mắt.
Ý chính từ bài gốc
- Ra mắt kiến trúc MSA giúp đạt cửa sổ ngữ cảnh 1 triệu token với chi phí tính toán thấp hơn 20 lần so với thế hệ trước.
- Khả năng đa phương thức gốc (văn bản, hình ảnh, video) được tích hợp ngay từ giai đoạn huấn luyện đầu tiên.
- Hiệu suất lập trình và tác nhân (agentic) vượt trội, đạt 59% trên SWE-Bench Pro và dẫn đầu trong nhiều bài kiểm tra thực tế.
- Hỗ trợ vận hành máy tính tự động, cho phép thực hiện các tác vụ phức tạp như tối ưu hóa nhân CUDA và tái hiện nghiên cứu khoa học.
- MiniMax Code là sản phẩm tác nhân đi kèm, hỗ trợ quy trình làm việc đa giai đoạn và tự động hóa trên máy tính.
Bài viết được AI dịch và tổng hợp tự động từ MarkTechPost. Liên kết bài gốc ở phía trên. AIHOT.vn luôn dẫn nguồn đầy đủ — nếu bạn thấy điểm cần chỉnh sửa, hãy gửi ý kiến tại trang phản hồi.