← Quay lại dòng tin

Mô hình · MiniMax (official)

MiniMax công bố chi tiết mô hình M3: Đột phá xử lý 1 triệu token với kiến trúc đa phương thức

MiniMax ra mắt mô hình M3 với công nghệ MSA giúp tối ưu hóa bộ nhớ đệm KV, cho phép xử lý 1 triệu token cực nhanh. Đây là mô hình đa phương thức hỗ trợ xử lý video, hình ảnh và thực hiện các tác vụ ph

Điểm 74Thời gian

Tóm tắt

MiniMax ra mắt mô hình M3 với công nghệ MSA giúp tối ưu hóa bộ nhớ đệm KV, cho phép xử lý 1 triệu token cực nhanh. Đây là mô hình đa phương thức hỗ trợ xử lý video, hình ảnh và thực hiện các tác vụ phức tạp như phân tích tài chính.

Vì sao đáng chú ý

Thông tin kỹ thuật chuyên sâu về tối ưu hóa context window và khả năng đa phương thức của M3 rất có giá trị cho cộng đồng AI, đặc biệt là các nhà phát triển.

Nội dung dịch chi tiết

MiniMax đã chia sẻ những thông tin cốt lõi về mô hình M3 thông qua một phiên trực tuyến. Điểm nhấn kỹ thuật là công nghệ MSA sử dụng cơ chế chọn lọc Top-K theo khối, duy trì bộ nhớ đệm KV nguyên bản và không nén, cho phép cửa sổ ngữ cảnh 1 triệu token vận hành hiệu quả.

Công nghệ này giúp giảm đáng kể thời gian giải mã nhân chú ý (attention kernel) cho các ngữ cảnh dài, từ khoảng 30% xuống còn khoảng 5%, mang lại sự cải thiện hiệu suất rõ rệt.

M3 là mô hình đa phương thức nguyên bản, hỗ trợ đầu vào là hình ảnh và video. Mô hình có khả năng xử lý các tác vụ thông minh dài hạn, thao tác trên máy tính và sở hữu năng lực tự đánh giá thông qua thị giác.

Trong các thử nghiệm thực tế, mô hình đã thể hiện năng lực phân tích tương đương với trình độ của một chuyên viên phân tích tài chính sơ cấp.

Trong tương lai, các phiên bản tiếp theo sẽ tập trung vào những tác vụ dài hạn phức tạp hơn, đồng thời mở rộng ứng dụng sang các lĩnh vực chuyên sâu như tài chính, luật pháp và sinh học. Hiện tại, Together AI đang cung cấp dịch vụ suy luận cho mô hình này.

Ý chính từ bài gốc

  • Công nghệ MSA giúp tối ưu hóa cửa sổ ngữ cảnh 1 triệu token, giảm thời gian giải mã nhân chú ý từ 30% xuống 5%.
  • M3 là mô hình đa phương thức nguyên bản, hỗ trợ đầu vào hình ảnh, video và các tác vụ thông minh dài hạn.
  • Mô hình có khả năng tự đánh giá qua thị giác và thực hiện các thao tác trên máy tính.
  • Hiệu suất trong lĩnh vực tài chính đạt trình độ tương đương chuyên viên phân tích sơ cấp.
  • Together AI là đơn vị cung cấp dịch vụ suy luận cho mô hình M3.

Bài viết được AI dịch và tổng hợp tự động từ X/Twitter. Liên kết bài gốc ở phía trên. AIHOT.vn luôn dẫn nguồn đầy đủ — nếu bạn thấy điểm cần chỉnh sửa, hãy gửi ý kiến tại trang phản hồi.