Nghiên cứu · Hacker News Nổi bật (buzzing.cc bản dịch tiếng Trung)
Liệu các mô hình ngôn ngữ lớn có thể vượt mặt thuật toán tối ưu hóa siêu tham số truyền thống?
Nghiên cứu mới đánh giá khả năng của LLM trong việc tối ưu hóa siêu tham số, so sánh trực tiếp với các thuật toán kinh điển để xem liệu AI có thực sự ưu việt hơn trong tác vụ này.
Tóm tắt
Nghiên cứu mới đánh giá khả năng của LLM trong việc tối ưu hóa siêu tham số, so sánh trực tiếp với các thuật toán kinh điển để xem liệu AI có thực sự ưu việt hơn trong tác vụ này.
Vì sao đáng chú ý
Chủ đề mang tính thực tiễn cao, giải quyết bài toán tối ưu hóa vốn là 'nút thắt' trong huấn luyện mô hình, thu hút sự quan tâm lớn từ giới kỹ thuật.
Nội dung dịch chi tiết
Kho lưu trữ 'autoresearch' cho phép các tác nhân LLM tối ưu hóa siêu tham số bằng cách chỉnh sửa trực tiếp mã nguồn huấn luyện. Nghiên cứu này sử dụng công cụ trên làm nền tảng để so sánh các thuật toán HPO truyền thống với các phương pháp dựa trên LLM trong việc điều chỉnh siêu tham số cho một mô hình ngôn ngữ nhỏ với ngân sách tính toán cố định.
Khi xác định không gian tìm kiếm cố định, các phương pháp truyền thống như CMA-ES và TPE liên tục vượt trội hơn các tác nhân dựa trên LLM. Trong bối cảnh này, việc tránh các lỗi tràn bộ nhớ (out-of-memory) quan trọng hơn sự đa dạng trong tìm kiếm. Ngay cả khi cho phép LLM chỉnh sửa mã nguồn trực tiếp, khoảng cách hiệu suất vẫn không được thu hẹp đáng kể, dù sử dụng các mô hình tiên tiến như Claude Opus 4.6 hay Gemini 3.1 Pro Preview.
Các tác giả quan sát thấy rằng LLM gặp khó khăn trong việc theo dõi trạng thái tối ưu hóa qua các lần thử nghiệm. Ngược lại, các phương pháp truyền thống lại thiếu kiến thức chuyên môn mà LLM sở hữu. Để kết hợp thế mạnh của cả hai, nhóm nghiên cứu giới thiệu 'Centaur', một mô hình lai chia sẻ trạng thái nội bộ có thể diễn giải của CMA-ES (bao gồm vectơ trung bình, kích thước bước và ma trận hiệp phương sai) với LLM.
Centaur đạt kết quả tốt nhất trong các thử nghiệm, với một LLM 0.8B là đủ để vượt qua tất cả các phương pháp truyền thống và phương pháp thuần LLM. Tuy nhiên, đối với việc chỉnh sửa mã không giới hạn, cần các mô hình lớn hơn để cạnh tranh với các phương pháp truyền thống.
Nghiên cứu cũng phân tích sự đa dạng trong tìm kiếm, khả năng mở rộng mô hình từ 0.8B lên các mô hình tiên tiến và tỷ lệ các thử nghiệm do LLM đề xuất trong Centaur. Kết luận chung cho thấy LLM hiệu quả nhất khi đóng vai trò là phần bổ sung cho các bộ tối ưu hóa truyền thống.
Ý chính từ bài gốc
- Các thuật toán truyền thống như CMA-ES và TPE vẫn vượt trội hơn LLM trong việc tối ưu hóa siêu tham số với ngân sách tính toán cố định.
- LLM gặp khó khăn trong việc duy trì trạng thái tối ưu hóa qua các lần thử nghiệm so với các phương pháp truyền thống.
- Mô hình lai 'Centaur' kết hợp trạng thái của CMA-ES với LLM, mang lại hiệu suất vượt trội so với các phương pháp đơn lẻ.
- LLM hiệu quả nhất khi đóng vai trò bổ trợ cho các bộ tối ưu hóa truyền thống thay vì thay thế hoàn toàn.
Bài viết được AI dịch và tổng hợp tự động từ arXiv.org. Liên kết bài gốc ở phía trên. AIHOT.vn luôn dẫn nguồn đầy đủ — nếu bạn thấy điểm cần chỉnh sửa, hãy gửi ý kiến tại trang phản hồi.