← Quay lại dòng tin

Mô hình · IT Home

JetBrains ra mắt Mellum2: Mô hình 12B tối ưu cho lập trình AI Agent

JetBrains vừa mã nguồn mở Mellum2, mô hình 12B sử dụng kiến trúc Mixture-of-Experts với khả năng xử lý ngữ cảnh 131K token, hỗ trợ mạnh mẽ cho các tác vụ lập trình tự động và quy trình làm việc đa bướ

Điểm 67Thời gian

Tóm tắt

JetBrains vừa mã nguồn mở Mellum2, mô hình 12B sử dụng kiến trúc Mixture-of-Experts với khả năng xử lý ngữ cảnh 131K token, hỗ trợ mạnh mẽ cho các tác vụ lập trình tự động và quy trình làm việc đa bước.

Vì sao đáng chú ý

Đây là bước tiến quan trọng từ một tên tuổi lớn trong ngành công cụ lập trình, cung cấp giải pháp mã nguồn mở hiệu quả cho các nhà phát triển AI Agent.

Nội dung dịch chi tiết

Vào ngày 1 tháng 6, JetBrains đã chính thức công bố mã nguồn mở cho Mellum2, một mô hình học máy mới dành cho các hệ thống kỹ thuật phần mềm. So với phiên bản Mellum tiền nhiệm, Mellum2 đã được nâng cấp từ một mô hình gợi ý mã nguồn đơn thuần thành một trợ lý lập trình hoàn chỉnh.

Cửa sổ ngữ cảnh của Mellum2 đã được mở rộng đáng kể từ 8.192 token lên 131.072 token. Các nhà phát triển hiện có thể triển khai ba phiên bản gồm: bản cơ sở (base), bản hướng dẫn (instruct) và bản tư duy (thought) theo giấy phép Apache 2.0.

Về thông số kỹ thuật, Mellum2 có tổng quy mô 12B tham số, cao hơn mức 4B của phiên bản trước. Mô hình sử dụng khung Mixture-of-Experts (MoE) thưa thớt, chỉ kích hoạt 2,5B tham số mỗi token, giúp duy trì tốc độ tính toán nhanh trên các phần cứng tiêu chuẩn.

Về khả năng, Mellum2 có thể tạo và chỉnh sửa mã nguồn, gọi các công cụ bên ngoài, thực hiện quy trình làm việc đa bước theo dạng tác nhân (Agentic) và duy trì các cuộc hội thoại dài. JetBrains định vị Mellum2 cho các tác vụ định tuyến và điều phối khối lượng công việc AI, đường ống RAG độ trễ thấp, các tác nhân phụ (sub-agent) trong quy trình phức tạp và triển khai AI cục bộ riêng tư.

Trong quá trình đào tạo, đội ngũ phát triển cho biết họ đã áp dụng chương trình dữ liệu ba giai đoạn. Sự kết hợp dữ liệu được chuyển dần từ nội dung web đa dạng sang các nội dung mã nguồn và toán học được chọn lọc kỹ lưỡng, giúp mô hình bám sát hơn với các nhiệm vụ kỹ thuật phần mềm.

Ý chính từ bài gốc

  • Mellum2 là mô hình mã nguồn mở 12B với kiến trúc Mixture-of-Experts, chỉ kích hoạt 2,5B tham số mỗi token.
  • Cửa sổ ngữ cảnh được mở rộng đáng kể lên 131.072 token, hỗ trợ các tác vụ lập trình phức tạp.
  • Nâng cấp từ mô hình gợi ý mã nguồn thành trợ lý lập trình AI toàn diện, hỗ trợ quy trình làm việc đa bước.
  • Phù hợp cho các ứng dụng RAG độ trễ thấp, điều phối tác nhân AI và triển khai cục bộ riêng tư.
  • Phát hành theo giấy phép Apache 2.0 với ba phiên bản: cơ sở, hướng dẫn và tư duy.

Bài viết được AI dịch và tổng hợp tự động từ www.ithome.com. Liên kết bài gốc ở phía trên. AIHOT.vn luôn dẫn nguồn đầy đủ — nếu bạn thấy điểm cần chỉnh sửa, hãy gửi ý kiến tại trang phản hồi.