Nghiên cứu · Ethan Mollick
Gemini 2.5 đánh bại các giáo sư luật trong bài kiểm tra tư vấn pháp lý
Các giáo sư luật đã so sánh câu trả lời của Gemini 2.5 với con người trong các tình huống thực tế. Kết quả cho thấy AI thắng 75% các lượt đánh giá và được nhận định là đưa ra lời khuyên an toàn, ít rủ
Tóm tắt
Các giáo sư luật đã so sánh câu trả lời của Gemini 2.5 với con người trong các tình huống thực tế. Kết quả cho thấy AI thắng 75% các lượt đánh giá và được nhận định là đưa ra lời khuyên an toàn, ít rủi ro hơn so với con người.
Vì sao đáng chú ý
Nghiên cứu thực nghiệm thú vị từ Ethan Mollick, cho thấy bước tiến lớn của AI trong các lĩnh vực chuyên môn đòi hỏi độ chính xác và trách nhiệm cao như luật pháp.
Nội dung dịch chi tiết
Các giáo sư luật đã ghi lại những câu hỏi mà sinh viên thường đặt ra trong giờ làm việc. Sau đó, Gemini 2.5 và các giáo sư thực thụ đã cùng đưa ra câu trả lời cho những câu hỏi này.
Để đảm bảo tính khách quan, một nhóm các giáo sư luật khác đã đánh giá các câu trả lời mà không hề biết ai là tác giả của chúng.
Kết quả cho thấy Gemini 2.5 đã giành chiến thắng với tỷ lệ 75%, vượt qua các giáo sư con người trong các bài đánh giá.
Ngoài ra, các câu trả lời của Gemini còn được đánh giá là ít gây hại hơn so với câu trả lời từ con người.
Đáng chú ý, các phiên bản mô hình cập nhật hơn thậm chí còn cho thấy hiệu suất vượt trội hơn nữa trong thử nghiệm này.
Ý chính từ bài gốc
- Gemini 2.5 đạt tỷ lệ thắng 75% khi đối đầu với các giáo sư luật.
- Các câu trả lời của AI được đánh giá là ít gây hại hơn so với con người.
- Quy trình đánh giá được thực hiện mù (không biết tác giả) để đảm bảo tính khách quan.
- Các phiên bản mô hình mới hơn tiếp tục cải thiện hiệu suất vượt trội.
Bài viết được AI dịch và tổng hợp tự động từ X/Twitter. Liên kết bài gốc ở phía trên. AIHOT.vn luôn dẫn nguồn đầy đủ — nếu bạn thấy điểm cần chỉnh sửa, hãy gửi ý kiến tại trang phản hồi.