← Quay lại dòng tin

Mô hình · Chubby♨️

Mai-1 Thinking: Mô hình suy luận đầu tiên của Microsoft với 45 tỷ tham số hoạt động

Microsoft ra mắt Mai-1 Thinking, mô hình suy luận sử dụng kiến trúc MoE với 45 tỷ tham số hoạt động, đạt hiệu suất ngang ngửa Sonnet 3.5 mà không cần chưng cất tri thức.

Điểm 63Thời gian

Tóm tắt

Microsoft ra mắt Mai-1 Thinking, mô hình suy luận sử dụng kiến trúc MoE với 45 tỷ tham số hoạt động, đạt hiệu suất ngang ngửa Sonnet 3.5 mà không cần chưng cất tri thức.

Vì sao đáng chú ý

Đây là bước tiến quan trọng của Microsoft trong lĩnh vực mô hình suy luận (reasoning models), cạnh tranh trực tiếp với các ông lớn như Anthropic.

Nội dung dịch chi tiết

Mai-1 Thinking được giới thiệu là mô hình suy luận đầu tiên của Microsoft. Đây là một mô hình có kích thước trung bình, được thiết kế để tối ưu hóa khả năng tư duy và giải quyết vấn đề.

Về mặt kỹ thuật, Mai-1 Thinking sở hữu 45 tỷ tham số hoạt động. Mô hình sử dụng kiến trúc Mixture of Experts (MoE), cho phép phân bổ tài nguyên tính toán hiệu quả hơn trong quá trình xử lý.

Một điểm đáng chú ý là Mai-1 Thinking đạt hiệu suất ngang bằng với Sonnet 4.6. Điều này khẳng định vị thế cạnh tranh mạnh mẽ của mô hình trong phân khúc các mô hình suy luận hiện nay.

Đặc biệt, mô hình này không sử dụng phương pháp chưng cất tri thức (0 knowledge distillation). Đây là bước tiến quan trọng trong việc phát triển các mô hình AI tự chủ và mạnh mẽ từ Microsoft.

Ý chính từ bài gốc

  • Mai-1 Thinking là mô hình suy luận đầu tiên của Microsoft.
  • Sở hữu 45 tỷ tham số hoạt động với kiến trúc MoE.
  • Hiệu suất ngang bằng với Sonnet 4.6.
  • Không sử dụng phương pháp chưng cất tri thức.

Bài viết được AI dịch và tổng hợp tự động từ X/Twitter. Liên kết bài gốc ở phía trên. AIHOT.vn luôn dẫn nguồn đầy đủ — nếu bạn thấy điểm cần chỉnh sửa, hãy gửi ý kiến tại trang phản hồi.