Meituan ra mắt LongCat-2.0: Mô hình MoE 1.6 nghìn tỷ tham số, hỗ trợ ngữ cảnh 1 triệu token

06/07/2026 · 04:25 (giờ Việt Nam)

Tóm tắt AI

Meituan giới thiệu LongCat-2.0, mô hình MoE mã nguồn mở chuyên dụng cho lập trình với 1.6 nghìn tỷ tham số và cửa sổ ngữ cảnh 1 triệu token. Mô hình đạt hiệu suất vượt trội trên các bài kiểm tra lập trình và được tối ưu hóa hoàn toàn trên hạ tầng chip AI nội địa.

Bản dịch AI

Meituan vừa ra mắt LongCat-2.0, một mô hình ngôn ngữ Mixture-of-Experts (MoE) quy mô lớn. Mô hình này sở hữu tổng cộng 1,6 nghìn tỷ tham số và kích hoạt khoảng 48 tỷ tham số cho mỗi token. Mục tiêu của mô hình là khả năng lập trình theo tác nhân (agentic coding): hiểu, tạo và thực thi mã nguồn bên trong các quy trình làm việc của tác nhân.

Có hai điểm đáng chú ý. Thứ nhất, LongCat-2.0 hỗ trợ cửa sổ ngữ cảnh gốc lên tới 1 triệu token. Thứ hai, cả quá trình huấn luyện và phục vụ (serving) đều chạy hoàn toàn trên các siêu cụm (superpods) sử dụng chip AI ASIC nội địa.

LongCat-2.0 là gì?

LongCat-2.0 là mô hình mở thế hệ tiếp theo với quy mô nghìn tỷ tham số của Meituan. Nó kế thừa LongCat-Flash, một mô hình 560B được ra mắt vào năm 2025. Kiến trúc của mô hình được thiết kế xoay quanh một mục tiêu duy nhất: lập trình theo tác nhân một cách đáng tin cậy và hiệu quả.

Quá trình tiền huấn luyện trải dài trên hơn 35 nghìn tỷ token với hàng triệu giờ chạy trên bộ tăng tốc. Meituan báo cáo rằng không có lần hoàn tác (rollback) hay các đợt sụt giảm mất mát dữ liệu không thể phục hồi nào xảy ra trong quá trình này. Tuyên bố về tính ổn định đó rất quan trọng trên phần cứng không phải của Nvidia, nơi mà các công cụ hỗ trợ vẫn chưa thực sự hoàn thiện.

Kiến trúc: Làm thế nào để một mô hình 1.6T duy trì chi phí vận hành thấp?

Thiết kế này kết hợp bốn ý tưởng giúp giảm chi phí quy mô. Mỗi ý tưởng đều đáng để tìm hiểu riêng biệt.

Để phục vụ, Meituan sử dụng lược đồ song song 6D và kiến trúc phân tách prefill-decode. Họ cũng sử dụng các ‘super kernels’ và kỹ thuật nạp trước trọng số vào bộ nhớ đệm L2 (L2-cache weight prefetching) để ẩn độ trễ I/O.

Các bài kiểm tra hiệu năng (Benchmarks)

Meituan định vị LongCat-2.0 là một mô hình lập trình theo tác nhân. Mọi số liệu dưới đây đều đến từ các thử nghiệm nội bộ của Meituan.

Trên SWE-bench Pro, Meituan báo cáo rằng LongCat-2.0 vượt qua GPT-5.5 (58.6). Meituan cũng tuyên bố hiệu suất tổng thể tương đương với Gemini 3.1 Pro của Google. Lợi thế được báo cáo tập trung vào lĩnh vực kỹ thuật phần mềm. Trên các bài kiểm tra tác nhân tổng quát rộng hơn như FORTE và BrowseComp, các dữ liệu cho thấy mô hình vẫn còn theo sau các hệ thống tiên phong hàng đầu. Hiện chưa có xác nhận từ các bảng xếp hạng độc lập.

LongCat-2.0 so với LongCat-Flash

Bước nhảy vọt so với thế hệ trước là rất lớn trên lý thuyết. Bảng này sử dụng các thông số kỹ thuật đã được công bố của từng mô hình.

Các trường hợp sử dụng kèm ví dụ

LongCat-2.0 được tinh chỉnh cho công việc phần mềm theo phong cách tác nhân, không phải để trò chuyện thông thường. Một vài mô hình cụ thể phù hợp với thế mạnh của nó.

Các mô hình này chạy bên trong các khung tác nhân (agent harnesses) tiêu chuẩn. Do đó, các đội ngũ phát triển có thể áp dụng mô hình mà không cần xây dựng công cụ mới.

Cách truy cập

LongCat-2.0 có thể truy cập thông qua Nền tảng API LongCat. Nó cung cấp các điểm cuối (endpoints) tương thích với cả OpenAI và Anthropic. Mô hình cũng có mặt trên OpenRouter và trong các khung như Claude Code, OpenClaw, OpenCode và Codex. Hiện chưa thể tự lưu trữ cục bộ vì trọng số vẫn chưa được công bố.

Điểm cuối tương thích với OpenAI sử dụng ID mô hình là LongCat-2.0. Độ dài đầu ra tối đa là 131.072 token (128K). Đoạn mã dưới đây gọi đến điểm cuối chat-completions đã được ghi chép.

Giá được báo cáo là 0,75 USD cho mỗi triệu token đầu vào và 2,95 USD cho mỗi triệu token đầu ra. Chương trình khuyến mãi ra mắt liệt kê mức giá 0,30 USD và 1,20 USD, với các lượt đọc ngữ cảnh đã lưu vào bộ nhớ đệm được miễn phí. Những con số này đến từ các nguồn tin bên thứ ba và có thể thay đổi.

Công cụ giải thích tương tác

Những điểm chính cần ghi nhớ

Hãy xem Trọng số mô hình, Kho lưu trữ GitHub và các chi tiết kỹ thuật. Ngoài ra, hãy theo dõi chúng tôi trên Twitter và đừng quên tham gia SubReddit 150k+ ML của chúng tôi cũng như Đăng ký Bản tin của chúng tôi. Khoan đã! Bạn có dùng Telegram không? Bây giờ bạn cũng có thể tham gia cùng chúng tôi trên Telegram.

Cần hợp tác với chúng tôi để quảng bá Kho lưu trữ GitHub, Trang Hugging Face, Bản phát hành sản phẩm hoặc Hội thảo trực tuyến của bạn? Hãy kết nối với chúng tôi.

Mô hình ngôn ngữMã nguồn mởLập trình AIMeituanMoE

Đọc bài gốc

Bài viết được AI dịch và tổng hợp tự động từ MarkTechPost. Liên kết bài gốc ở phía trên. AIHOT.vn luôn dẫn nguồn đầy đủ — nếu bạn thấy điểm cần chỉnh sửa, hãy gửi ý kiến tại trang phản hồi.