← Quay lại dòng tin

Mô hình · X: Testing Catalog (@testingcatalog)

Mistral ra mắt Leanstral 1.5: Mô hình mã nguồn mở chuyên biệt cho chứng minh toán học Lean 4

Mistral vừa phát hành Leanstral 1.5, mô hình tối ưu cho ngôn ngữ Lean 4, cho thấy khả năng suy luận hình thức vượt trội với hiệu suất tăng trưởng ổn định khi mở rộng ngân sách token.

Điểm 56Thời gian

Tóm tắt

Mistral vừa phát hành Leanstral 1.5, mô hình tối ưu cho ngôn ngữ Lean 4, cho thấy khả năng suy luận hình thức vượt trội với hiệu suất tăng trưởng ổn định khi mở rộng ngân sách token.

Vì sao đáng chú ý

Đây là bước tiến quan trọng trong lĩnh vực suy luận toán học và xác thực mã nguồn, thu hút sự quan tâm lớn từ cộng đồng nghiên cứu và kỹ thuật chuyên sâu.

Nội dung dịch chi tiết

Mistral đã chính thức công bố Leanstral 1.5, mô hình mã nguồn mở mới nhất được thiết kế đặc biệt cho kỹ thuật chứng minh Lean 4. Hiện tại, trọng số của mô hình đã được tải lên nền tảng Hugging Face để cộng đồng tiếp cận.

Lean 4 là một ngôn ngữ đa năng, vừa có thể sử dụng như một ngôn ngữ lập trình hàm để phát triển các công cụ CLI và thư viện, vừa đóng vai trò là trợ lý chứng minh để xác minh cơ học các đặc tính của mã nguồn, giao thức và thuật toán.

Theo các dữ liệu được công bố, Leanstral 1.5 cho thấy khả năng mở rộng thời gian kiểm thử (test-time scaling) mạnh mẽ nhất trong số các mô hình suy luận hình thức hiện nay.

Cụ thể, trên bộ dữ liệu PutnamBench, chỉ số Pass@8 của mô hình ghi nhận sự tăng trưởng ổn định và liên tục khi ngân sách token được mở rộng từ 25k lên đến 4M.

Ý chính từ bài gốc

  • Mistral phát hành Leanstral 1.5, mô hình mã nguồn mở cho kỹ thuật chứng minh Lean 4.
  • Trọng số của mô hình đã được cung cấp công khai trên Hugging Face.
  • Lean 4 hỗ trợ cả phát triển phần mềm và xác minh hình thức các thuật toán, giao thức.
  • Leanstral 1.5 đạt hiệu suất test-time scaling mạnh mẽ nhất trong các mô hình suy luận hình thức.
  • Hiệu suất Pass@8 trên PutnamBench tăng trưởng ổn định khi ngân sách token tăng từ 25k lên 4M.

Bài viết được AI dịch và tổng hợp tự động từ X/Twitter. Liên kết bài gốc ở phía trên. AIHOT.vn luôn dẫn nguồn đầy đủ — nếu bạn thấy điểm cần chỉnh sửa, hãy gửi ý kiến tại trang phản hồi.