← Quay lại dòng tin

Mô hình · IT Home

Turing Award Richard Sutton: AI tạo sinh thông thường khó đảm đương trọng trách khám phá khoa học

Theo Richard Sutton, AI tạo sinh hiện nay thiếu cơ chế đánh giá để thực hiện các khám phá khoa học thực thụ. Ông cho rằng các hệ thống có khả năng tự kiểm chứng và phản hồi như AlphaGo hay AlphaProof

Điểm 60Thời gian

Tóm tắt

Theo Richard Sutton, AI tạo sinh hiện nay thiếu cơ chế đánh giá để thực hiện các khám phá khoa học thực thụ. Ông cho rằng các hệ thống có khả năng tự kiểm chứng và phản hồi như AlphaGo hay AlphaProof mới là chìa khóa cho những đột phá trong tương lai.

Vì sao đáng chú ý

Góc nhìn sâu sắc từ chuyên gia hàng đầu về AI, phân tích đúng điểm yếu cốt lõi của LLM hiện tại và định hướng tiềm năng cho các hệ thống AI thông minh (Agent).

Nội dung dịch chi tiết

Trong một bài viết được trang công nghệ The Decoder đăng tải, Richard Sutton - nhà khoa học máy tính, người tiên phong trong lĩnh vực học tăng cường và là chủ nhân giải thưởng Turing 2024 - đã đưa ra nhận định về giới hạn của AI tạo sinh. Ông cho rằng các mô hình ngôn ngữ, hình ảnh và video hiện nay chủ yếu học từ dữ liệu khổng lồ để tạo ra nội dung tương tự, nhưng thiếu đi khả năng tự đánh giá và sàng lọc cần thiết cho nghiên cứu khoa học.

Sutton tóm tắt thực trạng này bằng một câu nói đùa trong giới nghiên cứu: "Phần tốt thì không mới, còn phần mới thì không tốt". Khi mô hình tạo ra nội dung thực sự mới lạ, chúng thường vượt quá phạm vi dữ liệu huấn luyện và dễ dẫn đến tình trạng "ảo giác" (hallucination) khi đối mặt với các vấn đề thực tế.

Ông khẳng định khám phá khoa học không thể dừng lại ở việc bắt chước. Một quy trình khám phá thực thụ bao gồm ba bước: biến dị, đánh giá và giữ lại có chọn lọc. Đây là nguyên tắc chung trong tiến hóa, phương pháp khoa học, lập kế hoạch và học tăng cường. Điểm yếu lớn nhất của AI tạo sinh thông thường chính là thiếu khâu đánh giá để sàng lọc các phương án tối ưu.

Ngược lại, Sutton dẫn chứng các hệ thống như AlphaGo, AlphaZero, AlphaFold, AlphaProof hay GT-Sophy là những ví dụ thành công. Các hệ thống này sở hữu vòng lặp đánh giá khép kín, cho phép chúng theo đuổi các giải pháp tối ưu thay vì chỉ đưa ra các câu trả lời dự kiến.

Cuối cùng, Sutton chỉ trích việc ngành công nghiệp AI đang đặt cược quá mức vào các mô hình ngôn ngữ lớn. Thay vào đó, ông đề cao các tác nhân AI có khả năng tương tác lâu dài với môi trường, học hỏi từ kinh nghiệm, xây dựng mô hình thế giới và lập kế hoạch chiến lược.

Ý chính từ bài gốc

  • AI tạo sinh thông thường thiếu khả năng tự đánh giá và sàng lọc, khó thực hiện khám phá khoa học thực thụ.
  • Nội dung mới từ AI thường dễ gặp lỗi "ảo giác" vì vượt quá dữ liệu huấn luyện ban đầu.
  • Khám phá khoa học đòi hỏi quy trình 3 bước: biến dị, đánh giá và giữ lại có chọn lọc.
  • Các hệ thống như AlphaGo thành công nhờ có vòng lặp đánh giá khép kín để tìm ra giải pháp tối ưu.
  • Sutton ủng hộ việc phát triển các tác nhân AI có khả năng tương tác và học hỏi từ môi trường thay vì chỉ mở rộng mô hình ngôn ngữ.

Bài viết được AI dịch và tổng hợp tự động từ www.ithome.com. Liên kết bài gốc ở phía trên. AIHOT.vn luôn dẫn nguồn đầy đủ — nếu bạn thấy điểm cần chỉnh sửa, hãy gửi ý kiến tại trang phản hồi.