← Quay lại dòng tin

Mô hình · MarkTechPost(RSS)

Mistral AI ra mắt Leanstral 1.5: Mô hình AI chuyên biệt cho chứng minh toán học Lean 4

Mistral AI giới thiệu Leanstral 1.5, mô hình MoE 119B tối ưu cho Lean 4 với khả năng giải toán vượt trội, đạt SOTA trên nhiều benchmark như PutnamBench với chi phí thấp hơn đáng kể so với các đối thủ.

Điểm 59Thời gian 05:41
Tóm tắt

Mistral AI giới thiệu Leanstral 1.5, mô hình MoE 119B tối ưu cho Lean 4 với khả năng giải toán vượt trội, đạt SOTA trên nhiều benchmark như PutnamBench với chi phí thấp hơn đáng kể so với các đối thủ.

Vì sao đáng chú ý

Bước tiến đột phá trong AI suy luận toán học, mã nguồn mở và hiệu suất vượt trội so với các mô hình hiện có, rất đáng chú ý cho cộng đồng nghiên cứu.

Nội dung dịch chi tiết

Mistral AI đã chính thức phát hành Leanstral 1.5, một mô hình tác tử mã nguồn (code agent) được thiết kế riêng cho Lean 4, một trợ lý chứng minh toán học. Mô hình này được phát hành theo giấy phép Apache 2.0, cho phép cộng đồng sử dụng miễn phí thông qua API hoặc tự lưu trữ.

Leanstral 1.5 sử dụng kiến trúc Mixture-of-Experts (MoE) với tổng cộng 119 tỷ tham số, trong đó có 6,5 tỷ tham số được kích hoạt cho mỗi token. Mô hình hỗ trợ độ dài ngữ cảnh lên tới 256.000 token và có khả năng xử lý đầu vào đa phương thức (văn bản và hình ảnh).

Quy trình đào tạo của mô hình bao gồm ba giai đoạn: đào tạo trung gian, tinh chỉnh có giám sát và học tăng cường (RL) với CISPO. Trong môi trường tác tử, Leanstral có thể tự chỉnh sửa tệp tin, chạy lệnh bash và sử dụng máy chủ ngôn ngữ Lean để tinh chỉnh các chứng minh thông qua phản hồi từ trình biên dịch.

Về hiệu suất, Leanstral 1.5 đã đạt mức bão hòa trên bộ dữ liệu miniF2F và giải quyết thành công 587 trên 672 bài toán trong PutnamBench. Mô hình cũng thiết lập tiêu chuẩn mới trên các benchmark đại số FATE-H và FATE-X, đồng thời vượt qua các mô hình lớn hơn nhiều lần về hiệu quả chi phí.

Trong các ứng dụng thực tế, Leanstral đã chứng minh được độ phức tạp thời gian cho cấu trúc cây AVL và phát hiện 11 lỗi thực tế trong các kho lưu trữ mã nguồn mở, trong đó có 5 lỗi chưa từng được báo cáo trên GitHub. Khả năng này cho phép các đội ngũ phát triển tự động hóa việc kiểm chứng tính đúng đắn của mã nguồn.

Người dùng có thể bắt đầu sử dụng Leanstral thông qua công cụ dòng lệnh Mistral Vibe hoặc tự triển khai bằng vLLM 0.24.0 trở lên. Mô hình hỗ trợ gọi hàm (tool calling) theo phong cách OpenAI, giúp tích hợp sâu vào các quy trình kỹ thuật chứng minh hiện có.

Ý chính từ bài gốc

  • Leanstral 1.5 là mô hình tác tử mã nguồn mở cho Lean 4 với 119 tỷ tham số (6,5 tỷ tham số hoạt động).
  • Đạt hiệu suất 100% trên miniF2F và giải quyết 587/672 bài toán PutnamBench.
  • Sử dụng kiến trúc Mixture-of-Experts với khả năng xử lý ngữ cảnh lên tới 256k token.
  • Có khả năng phát hiện lỗi thực tế trong mã nguồn Rust thông qua việc chuyển đổi sang Lean.
  • Hỗ trợ triển khai linh hoạt qua API miễn phí hoặc tự lưu trữ bằng vLLM.