← Quay lại dòng tin

Mô hình · Mistral AI:News(Web)

Mistral AI ra mắt Leanstral 1.5: Mô hình chứng minh toán học đột phá với hiệu suất SOTA

Mistral AI giới thiệu Leanstral 1.5, mô hình mã nguồn mở chuyên về xác thực hình thức với khả năng giải toán vượt trội, đạt kỷ lục SOTA trên nhiều bài kiểm tra và có khả năng tự phát hiện lỗi trong mã

Điểm 66Thời gian 22:19
Tóm tắt

Mistral AI giới thiệu Leanstral 1.5, mô hình mã nguồn mở chuyên về xác thực hình thức với khả năng giải toán vượt trội, đạt kỷ lục SOTA trên nhiều bài kiểm tra và có khả năng tự phát hiện lỗi trong mã nguồn.

Vì sao đáng chú ý

Đây là bước tiến quan trọng trong AI suy luận toán học, mô hình có hiệu suất ấn tượng, tính ứng dụng thực tế cao và hoàn toàn miễn phí cho cộng đồng.

Nội dung dịch chi tiết

Mistral AI vừa giới thiệu Leanstral 1.5, mô hình chuyên biệt cho kỹ thuật chứng minh trong Lean 4. Với 119 tỷ tham số tổng thể và 6 tỷ tham số hoạt động, mô hình này mang đến hiệu suất vượt trội trong việc giải quyết các bài toán toán học phức tạp và kiểm chứng mã nguồn thực tế.

Leanstral 1.5 được huấn luyện qua ba giai đoạn: huấn luyện trung gian, tinh chỉnh có giám sát và học tăng cường với CISPO. Mô hình hoạt động trong hai môi trường chính: môi trường đa lượt (tự kiểm tra và tinh chỉnh chứng minh dựa trên phản hồi từ trình biên dịch Lean) và môi trường tác nhân mã nguồn (tương tác trực tiếp với hệ thống tệp, chạy lệnh bash và sử dụng máy chủ ngôn ngữ Lean).

Trên các bộ tiêu chuẩn đánh giá, Leanstral 1.5 đạt kết quả ấn tượng: bão hòa hoàn toàn miniF2F, giải 587/672 bài toán PutnamBench, và đạt kết quả cao nhất (SOTA) trên FATE-H (87%) và FATE-X (34%). Đặc biệt, mô hình cho thấy khả năng mở rộng theo thời gian thực thi (test-time scaling) mạnh mẽ, giải quyết được các bài toán phức tạp với hàng triệu token mà không cần sự can thiệp của ngôn ngữ tự nhiên.

Trong các thử nghiệm thực tế, Leanstral 1.5 đã chứng minh khả năng kiểm chứng độ phức tạp thời gian của cấu trúc dữ liệu AVL Trees và tự động phát hiện 5 lỗi chưa từng được báo cáo trong 57 kho lưu trữ mã nguồn. Điều này khẳng định tính ứng dụng cao của các phương pháp hình thức trong việc bảo mật và tối ưu hóa phần mềm.

Người dùng hiện có thể truy cập Leanstral 1.5 thông qua Hugging Face hoặc API miễn phí. Mistral AI khuyến nghị sử dụng mô hình này trong công cụ Mistral Vibe để thực hiện các tác vụ chứng minh định lý, gỡ lỗi hoặc đóng góp vào các kho lưu trữ mã nguồn.

Ý chính từ bài gốc

  • Leanstral 1.5 là mô hình mã nguồn mở (Apache-2.0) với 6 tỷ tham số hoạt động, tối ưu cho kiểm chứng hình thức.
  • Đạt kết quả SOTA trên các bộ tiêu chuẩn toán học như FATE-H (87%) và FATE-X (34%).
  • Khả năng mở rộng vượt trội: giải quyết các bài toán phức tạp bằng cách suy luận qua hàng triệu token.
  • Ứng dụng thực tế: kiểm chứng độ phức tạp thuật toán và tự động phát hiện lỗi trong mã nguồn Rust/Lean.
  • Có sẵn miễn phí qua Hugging Face và API, hỗ trợ tích hợp vào quy trình làm việc với Lean 4.