← Quay lại dòng tin

Nghiên cứu · Quy Tàng (guizang.ai)

MiniMax ra mắt mô hình M3: Bước tiến đột phá với kiến trúc MSA và cửa sổ ngữ cảnh 1M

MiniMax vừa trình làng mô hình M3 với kiến trúc MSA giúp tối ưu hiệu suất tính toán gấp 20 lần trên cửa sổ ngữ cảnh 1 triệu token. M3 tích hợp khả năng đa phương thức ngay từ giai đoạn huấn luyện và đ

Điểm 76Thời gian

Tóm tắt

MiniMax vừa trình làng mô hình M3 với kiến trúc MSA giúp tối ưu hiệu suất tính toán gấp 20 lần trên cửa sổ ngữ cảnh 1 triệu token. M3 tích hợp khả năng đa phương thức ngay từ giai đoạn huấn luyện và đạt kết quả ấn tượng trong các bài kiểm tra lập trình chuyên sâu.

Vì sao đáng chú ý

Đây là bản cập nhật quan trọng từ một trong những startup AI hàng đầu Trung Quốc, mang tính ứng dụng cao nhờ tối ưu hóa chi phí tính toán và khả năng xử lý ngữ cảnh lớn.

Nội dung dịch chi tiết

MiniMax chính thức phát hành phiên bản nâng cấp lớn mang tên M3. Mô hình này được trang bị tiêu chuẩn ngữ cảnh siêu dài 1 triệu token, sử dụng kiến trúc chú ý thưa MSA (MoE with Segment-wise Attention) mới.

Nhờ kiến trúc MSA, lượng tính toán trên mỗi token khi xử lý ngữ cảnh 1 triệu đã giảm xuống chỉ còn khoảng 1/20 so với thế hệ trước đó.

M3 được thiết kế với khả năng đa phương thức (multimodal) tích hợp ngay từ quá trình huấn luyện ban đầu, thay vì bổ sung sau.

Trong các bài kiểm tra tiêu chuẩn, mô hình đạt được những kết quả đáng chú ý: 59,0% tại SWE-Bench Pro, 66,0% tại Terminal Bench 2.1 và 74,2% tại MCP Atlas.

Bên cạnh đó, MiniMax cũng triển khai chương trình ưu đãi giảm giá 50% trong 7 ngày cho các lệnh gọi API dưới 512k.

Dự kiến, trọng số của mô hình và báo cáo kỹ thuật chi tiết sẽ được công bố sau khoảng 10 ngày tới.

Ý chính từ bài gốc

  • MiniMax ra mắt mô hình M3 với ngữ cảnh tiêu chuẩn 1 triệu token.
  • Sử dụng kiến trúc MSA giúp giảm 20 lần chi phí tính toán trên mỗi token.
  • Tích hợp khả năng đa phương thức ngay từ giai đoạn huấn luyện.
  • Đạt kết quả cao trong các bài kiểm tra SWE-Bench Pro, Terminal Bench và MCP Atlas.
  • Ưu đãi giảm giá 50% cho API trong 7 ngày đối với các lệnh gọi dưới 512k.

Bài viết được AI dịch và tổng hợp tự động từ X/Twitter. Liên kết bài gốc ở phía trên. AIHOT.vn luôn dẫn nguồn đầy đủ — nếu bạn thấy điểm cần chỉnh sửa, hãy gửi ý kiến tại trang phản hồi.