Mô hình · Hacker News Nổi bật (buzzing.cc bản dịch tiếng Trung)

Lỗi GPT-5.5: Hiện tượng 'kẹt' token khiến hiệu suất suy giảm trong các tác vụ phức tạp

Báo cáo chỉ ra GPT-5.5 bị tập trung bất thường vào các mốc 516, 1034 và 1552 token. Xu hướng này cho thấy mô hình có thể đang bị giới hạn bởi ngân sách suy luận hoặc cơ chế cắt tỉa, làm giảm đáng kể c

Điểm 61Thời gian 09:22 · 05/07/2026

Lý do đề xuất

Đây là phát hiện kỹ thuật quan trọng về hành vi mô hình, ảnh hưởng trực tiếp đến độ tin cậy của AI trong thực tế, thu hút sự quan tâm lớn từ cộng đồng lập trình viên.

Tóm tắt

Bản dịch AI

Một báo cáo lỗi trên GitHub cho thấy sự bất thường trong dữ liệu metadata của Codex đối với mô hình GPT-5.5. Các phản hồi của mô hình này thường xuyên dừng lại ở đúng 516 token suy luận, với các điểm tăng đột biến khác tại mốc 1034 và 1552. Hiện tượng này không xuất hiện ở các mô hình khác và trùng khớp với việc giảm cường độ suy luận tổng thể.

Người báo cáo cho rằng đây có thể là dấu hiệu của việc cắt bớt chuỗi suy nghĩ (chain-of-thought) do cơ chế giới hạn ngân sách hoặc lập lịch nội bộ. Dữ liệu phân tích từ tháng 2 đến tháng 6 năm 2026 cho thấy GPT-5.5 chiếm tới 82% các sự kiện dừng ở mốc 516 token, dù chỉ chiếm 19,3% tổng số phản hồi.

Sự phân cụm này được đánh giá là đáng ngờ vì số lượng token suy luận cho các tác vụ phức tạp lẽ ra phải biến thiên tự nhiên theo độ khó của công việc, thay vì tập trung vào các giá trị cố định. Tỷ lệ xuất hiện các mốc này ở GPT-5.5 cao gấp 33,6 lần so với các mô hình khác.

Người dùng đề nghị đội ngũ Codex điều tra xem liệu GPT-5.5 có đang áp dụng cơ chế giới hạn ngân sách, định tuyến hoặc cắt bớt phản hồi hay không. Việc xác định rõ đây là điểm dừng bình thường hay một ngưỡng hạn chế hiệu suất là rất quan trọng để cải thiện độ chính xác cho các tác vụ đòi hỏi tư duy cao.

Ý chính từ bài gốc

GPT-5.5 xuất hiện hiện tượng phân cụm token suy luận tại các mốc cố định 516, 1034 và 1552.
Hiện tượng này có khả năng gây giảm hiệu suất và dẫn đến sai sót trong các tác vụ phức tạp.
GPT-5.5 chiếm 82% các trường hợp dừng ở mốc 516 token, cao bất thường so với các mô hình khác.
Nghi vấn về cơ chế giới hạn ngân sách suy luận hoặc cắt bớt chuỗi suy nghĩ nội bộ.
Đề nghị đội ngũ Codex kiểm tra lại các ngưỡng lập lịch và quy trình xử lý của mô hình.

Mở bài gốc

Bài viết được AI dịch và tổng hợp tự động từ GitHub. Liên kết bài gốc ở phía trên. AIHOT.vn luôn dẫn nguồn đầy đủ — nếu bạn thấy điểm cần chỉnh sửa, hãy gửi ý kiến tại trang phản hồi.

Lý do đề xuất

Tóm tắt

Bản dịch AI

Ý chính từ bài gốc

Bài liên quan