← Quay lại dòng tin

Nghiên cứu · : StepFun (Step)

Step 3.7 Flash: Bước tiến mới của StepStar cho các tác vụ Agent cấp độ sản xuất

StepStar vừa ra mắt Step 3.7 Flash, mô hình tối ưu hóa hiệu suất cao được thiết kế chuyên biệt để hỗ trợ các tác vụ Agent trong môi trường sản xuất thực tế.

Điểm 61Thời gian

Tóm tắt

StepStar vừa ra mắt Step 3.7 Flash, mô hình tối ưu hóa hiệu suất cao được thiết kế chuyên biệt để hỗ trợ các tác vụ Agent trong môi trường sản xuất thực tế.

Vì sao đáng chú ý

Đây là bản cập nhật quan trọng từ một đơn vị AI uy tín, tập trung vào tính ứng dụng thực tế cho Agent, rất phù hợp với xu hướng phát triển AI hiện nay.

Nội dung dịch chi tiết

Step 3.7 Flash không chỉ tập trung vào tốc độ hay chi phí thấp, mà được tối ưu hóa hệ thống cho các luồng công việc của Agent, lập trình, tìm kiếm và đa phương thức. Mục tiêu của mô hình là đạt được sự cân bằng tối ưu giữa tốc độ, chi phí, khả năng thực thi đáng tin cậy và hoàn thành các tác vụ phức tạp.

Trong giai đoạn tiếp theo của cuộc đua AI, khả năng thông minh có thể mở rộng và hiệu quả là yếu tố then chốt. Khi Agent bước vào môi trường sản xuất, mô hình cần hiểu các đầu vào phức tạp, chủ động tìm kiếm thông tin, gọi công cụ ổn định và duy trì quỹ đạo thực thi trong các tác vụ đa vòng.

Các tính năng nổi bật của Step 3.7 Flash bao gồm: khả năng hiểu đa phương thức gốc (UI, biểu đồ, tài liệu, hình ảnh); tăng cường tìm kiếm trực tuyến và hình ảnh; khả năng gọi công cụ và điều phối có độ tin cậy cao; cùng khả năng tương thích tối ưu với các khung Agent phổ biến như Claude Code, KiloCode, RooCode và các giao thức như MCP.

Với kiến trúc MoE thưa (196B+1.8B tham số, kích hoạt 11B), mô hình đạt tốc độ tạo văn bản lên tới 400 Tokens/s. Điều này đặc biệt phù hợp cho các Agent tần suất cao, Agent lập trình, Agent tìm kiếm và Agent tri thức doanh nghiệp, giúp tăng số lần lặp lại và độ chính xác trong cùng một đơn vị thời gian.

Step 3.7 Flash đã được kiểm chứng qua các bộ tiêu chuẩn như Toolathlon (49.5%), ClawEval-1.1 (67.1%) và GDPval (45.8%). Mô hình hỗ trợ triển khai trên cả đám mây và cục bộ, với các phiên bản tối ưu hóa cho máy trạm cá nhân, giúp các nhà phát triển dễ dàng tích hợp vào các quy trình sản xuất thực tế.

Ý chính từ bài gốc

  • Tối ưu hóa hệ thống cho Agent, lập trình, tìm kiếm và đa phương thức.
  • Kiến trúc MoE thưa với 11B tham số kích hoạt, tốc độ lên tới 400 Tokens/s.
  • Khả năng hiểu đa phương thức gốc: UI, biểu đồ, tài liệu và hình ảnh.
  • Độ tin cậy cao trong việc gọi công cụ và duy trì quỹ đạo thực thi tác vụ.
  • Tương thích tốt với các khung Agent phổ biến và giao thức MCP/Skills.
  • Hỗ trợ triển khai linh hoạt trên đám mây và cục bộ (GGUF).

Bài viết được AI dịch và tổng hợp tự động từ Weixin Official Accounts Platform. Liên kết bài gốc ở phía trên. AIHOT.vn luôn dẫn nguồn đầy đủ — nếu bạn thấy điểm cần chỉnh sửa, hãy gửi ý kiến tại trang phản hồi.