← Quay lại dòng tin

Nghiên cứu · : StepFun (Step)

Mô hình Step 3.7 Flash của StepFun thống trị bảng xếp hạng Artificial Analysis

Mô hình Step 3.7 Flash của StepFun vừa đạt được nhiều vị trí dẫn đầu trên bảng xếp hạng uy tín Artificial Analysis, khẳng định hiệu suất vượt trội trong lĩnh vực AI.

Điểm 45Thời gian

Tóm tắt

Mô hình Step 3.7 Flash của StepFun vừa đạt được nhiều vị trí dẫn đầu trên bảng xếp hạng uy tín Artificial Analysis, khẳng định hiệu suất vượt trội trong lĩnh vực AI.

Vì sao đáng chú ý

Tin tức quan trọng về hiệu suất mô hình AI nội địa Trung Quốc đạt thành tích quốc tế, có giá trị tham khảo cao cho cộng đồng công nghệ.

Nội dung dịch chi tiết

Bảng xếp hạng mô hình ngôn ngữ lớn uy tín toàn cầu Artificial Analysis vừa cập nhật dữ liệu mới, trong đó Step 3.7 Flash đã vươn lên dẫn đầu các mô hình phổ biến ở hạng mục Tốc độ đầu ra (Output Speed) với 409 tokens/s. Ngoài ra, mô hình này còn chiếm ưu thế ở các tiêu chí quan trọng như thời gian phản hồi đầu cuối (End-to-End Response Time), hiệu suất thông minh và tỷ lệ tốc độ trên giá thành.

Trong kỷ nguyên của các tác nhân (Agent), cuộc cạnh tranh giữa các mô hình đã chuyển dịch từ khả năng hỏi đáp đơn lẻ sang hiệu quả hoàn thành nhiệm vụ thực tế. Việc duyệt web, hiểu tài liệu, phân tích giao diện hay gọi công cụ đều tiêu tốn tài nguyên và thời gian. Do đó, sự cân bằng giữa tốc độ, trí tuệ và chi phí trở thành yếu tố quyết định trải nghiệm và khả năng triển khai quy mô lớn.

Với tốc độ 409 tokens/s, Step 3.7 Flash vượt xa hầu hết các mô hình phổ thông, giúp tăng cường khả năng xử lý tác vụ. Trong các kịch bản thực thi nhiệm vụ dài, tương tác đa vòng và gọi công cụ liên tục, mô hình giúp rút ngắn thời gian chờ đợi và nâng cao hiệu suất luồng công việc tổng thể.

Ở bài kiểm tra thời gian phản hồi đầu cuối, Step 3.7 Flash chỉ mất 7,1 giây để hoàn thành nhiệm vụ đánh giá, mang lại trải nghiệm cộng tác người - máy mượt mà hơn. Điều này giúp mô hình trở thành lựa chọn tối ưu cho các tác nhân hoạt động trong môi trường sản xuất thực tế.

Về hiệu suất thông minh, Step 3.7 Flash duy trì được sự ổn định trong các tác vụ tìm kiếm, lập trình và hiểu đa phương thức. Đồng thời, xét về tỷ lệ tốc độ trên giá thành, mô hình này nằm trong nhóm hấp dẫn nhất, cung cấp giải pháp kinh tế cho các hệ thống Agent cần vận hành liên tục và gọi hàm tần suất cao.

Những kết quả này khẳng định định hướng của chúng tôi về các mô hình Agent cấp độ sản xuất: không chỉ theo đuổi tốc độ đơn thuần mà tập trung vào hiệu quả hoàn thành nhiệm vụ thực tế. Chúng tôi sẽ tiếp tục cải tiến mô hình để không ngừng khám phá giới hạn hiệu suất của Agent trong tương lai.

Ý chính từ bài gốc

  • Step 3.7 Flash đạt tốc độ đầu ra 409 tokens/s, dẫn đầu bảng xếp hạng Artificial Analysis.
  • Tối ưu hóa thời gian phản hồi đầu cuối chỉ trong 7,1 giây, nâng cao trải nghiệm tương tác người - máy.
  • Cân bằng xuất sắc giữa hiệu suất thông minh, tốc độ và chi phí, phù hợp cho triển khai Agent quy mô lớn.
  • Tập trung vào hiệu quả hoàn thành nhiệm vụ thực tế thay vì chỉ cải thiện tốc độ đơn lẻ.

Bài viết được AI dịch và tổng hợp tự động từ Weixin Official Accounts Platform. Liên kết bài gốc ở phía trên. AIHOT.vn luôn dẫn nguồn đầy đủ — nếu bạn thấy điểm cần chỉnh sửa, hãy gửi ý kiến tại trang phản hồi.