← Quay lại dòng tin

Sản phẩm · : (MiniCPM)

FaceWall AI ra mắt ForgeTrain: Khung huấn luyện AI tự động, vượt mặt Megatron-LM chỉ sau 8 giờ

FaceWall AI giới thiệu ForgeTrain, khung huấn luyện mô hình ngôn ngữ lớn đầu tiên do AI tự viết mã mà không cần can thiệp từ con người. Hệ thống này tối ưu hóa hiệu suất phần cứng vượt trội, giúp rút

Điểm 65Thời gian 17:00
Tóm tắt

FaceWall AI giới thiệu ForgeTrain, khung huấn luyện mô hình ngôn ngữ lớn đầu tiên do AI tự viết mã mà không cần can thiệp từ con người. Hệ thống này tối ưu hóa hiệu suất phần cứng vượt trội, giúp rút ngắn thời gian huấn luyện và tăng hiệu quả sử dụng tài nguyên tính toán đáng kể.

Vì sao đáng chú ý

Đây là bước tiến đột phá trong kỹ thuật huấn luyện AI, giúp giảm phụ thuộc vào kỹ sư con người và tối ưu hóa chi phí vận hành, rất có giá trị cho cộng đồng kỹ thuật.

Nội dung dịch chi tiết

Vào ngày 27/6/2026, Facechain cùng cộng đồng OpenBMB và AGI BAR đã tổ chức sự kiện 'AI4AI Fermentation Night'. Tại đây, Li Yuxuan, Trưởng bộ phận AI Infra của Facechain, đã trình bày về ForgeTrain – khung huấn luyện mô hình lớn do AI tự xây dựng. Đây là minh chứng cho logic tự lặp lại và phát triển của AI trong kỷ nguyên mới.

Li Yuxuan nhấn mạnh rằng việc nâng cao năng lực mô hình không còn chỉ dựa vào việc chồng chất dữ liệu và sức mạnh tính toán. Khi các mô hình bắt đầu có khả năng tự lặp lại, 'AI tạo ra AI' trở thành con đường hiệu quả nhất để phá vỡ các giới hạn hiện tại. Điều này được ví như cuộc cách mạng công nghiệp: từ 'máy móc hỗ trợ sức lao động' tiến tới 'máy móc tạo ra máy móc'.

Để đo lường năng lực này, Facechain đề xuất thang đo 5 cấp độ, từ L1 (gợi ý) đến L5 (cùng tiến hóa). Hiện tại, ngành công nghiệp đang ở mức L2, trong khi ForgeTrain của Facechain đang nỗ lực vượt qua L3 để tiến tới L4 (cải tiến đệ quy). ForgeTrain cho phép AI tự 'rèn' một khung huấn luyện chuyên biệt cho từng mô hình và phần cứng cụ thể thay vì sử dụng khung chung.

Kết quả thực tế cho thấy, ForgeTrain chỉ mất 8 giờ để bắt kịp hiệu suất của Megatron-LM và vượt qua sau 1,5 đến 2 ngày với MFU tăng từ 8% đến 10%. Khả năng này có thể áp dụng trên nhiều mô hình và nền tảng phần cứng khác nhau như H100 hay NPU của Huawei.

Quy trình tối ưu hóa của ForgeTrain gồm 4 giai đoạn: Anchor (xây dựng cơ sở), Bit-for-Bit (tạo mã cơ bản), Surpass (tối ưu hóa tự chủ) và Per-Op (tùy chỉnh sâu từng toán tử). Triết lý 'Forge Engineering' này không chỉ là đột phá kỹ thuật mà còn là một tư duy kỹ thuật mới, cho phép cá nhân và nhóm nhỏ tạo ra các mô hình tùy chỉnh mạnh mẽ, phá vỡ sự phụ thuộc vào các hệ sinh thái phần mềm truyền thống.

Ý chính từ bài gốc

  • ForgeTrain là khung huấn luyện mô hình lớn đầu tiên do AI tự viết, không cần sự can thiệp của con người.
  • Công nghệ này giúp bắt kịp hiệu suất của Megatron-LM trong 8 giờ và vượt mặt sau 2 ngày.
  • Facechain đề xuất thang đo 5 cấp độ cho năng lực 'AI tạo ra AI', với mục tiêu tiến tới cấp độ L4 (cải tiến đệ quy).
  • Triết lý 'Forge Engineering' cho phép tạo ra các khung huấn luyện tùy chỉnh, tối ưu hóa hiệu suất cho từng phần cứng cụ thể.
  • Sự phát triển của AI đang chuyển dịch từ việc sử dụng AI để thay thế trí tuệ sang việc để AI tự tạo ra các hệ thống thông minh.