← Quay lại dòng tin

Nghiên cứu · Jiqizhixin

ACL 2026: T* giải mã bài toán 'khối càng lớn, suy luận càng kém' trong mô hình ngôn ngữ khuếch tán

Các nhà nghiên cứu từ Viện Trí tuệ Nhân tạo Khoa học Thượng Hải giới thiệu T*, phương pháp huấn luyện tăng dần kích thước khối giúp cải thiện đáng kể khả năng suy luận toán học cho mô hình ngôn ngữ kh

Điểm 88Thời gian

Lý do đề xuất

Nghiên cứu giải quyết vấn đề kỹ thuật cốt lõi trong mô hình khuếch tán, có đóng góp thực tiễn cho hiệu suất suy luận và được chấp nhận tại hội nghị ACL danh giá.

Tóm tắt

Các nhà nghiên cứu từ Viện Trí tuệ Nhân tạo Khoa học Thượng Hải giới thiệu T*, phương pháp huấn luyện tăng dần kích thước khối giúp cải thiện đáng kể khả năng suy luận toán học cho mô hình ngôn ngữ khuếch tán, khắc phục tình trạng sụp đổ huấn luyện khi xử lý song song.

Bản dịch AI

ACL 2026 | Khối càng lớn, suy luận càng kém? Thách thức mới của mô hình ngôn ngữ khuếch tán (Diffusion Language Models) đã được T* giải mã

//arxiv.org/pdf/2602.09375 Thế lưỡng nan của mô hình ngôn ngữ khuếch tán: Khối càng lớn, tiềm năng song song càng cao, nhưng suy luận lại càng dễ tổn thương. Các mô hình ngôn ngữ lớn (LLM) hiện nay hầu hết đều áp dụng cơ chế tạo tự hồi quy (autoregressive generation): mỗi lần...

Machine之心 (Synced)

Điểm tin chọn lọc từ các kênh AI (05/07/2026)

ACL 2026 | Khối càng lớn, suy luận càng kém? Thách thức mới của mô hình ngôn ngữ khuếch tán đã được T* giải mã. Nguồn: Machine之心. Mô hình ngôn ngữ khuếch tán, học tăng cường, học theo chương trình (curriculum learning), suy luận toán học, tạo song song...

Double Tong Fafa

Tóm tắt hàng ngày | Theo dõi AI | 05/07/2026

2026 | Khối càng lớn, suy luận càng kém? Thách thức mới của mô hình ngôn ngữ khuếch tán đã được T* giải mã. Nghiên cứu tại ACL 2026 chỉ ra rằng, việc tăng kích thước khối trong mô hình ngôn ngữ khuếch tán dễ dẫn đến suy giảm khả năng suy luận...

Kanchaidanshui (Chặt củi gánh nước)

AI giải quyết các bài toán y tế, những nghiên cứu lọt vào hội nghị đỉnh cao này chỉ là "phần nổi của tảng băng chìm" trong công nghệ của Tencent Thiên Diễn (Tencent Hunyuan/Tianyuan)

Machine之心 đăng tải. Ban biên tập Machine之心: Phòng thí nghiệm Thiên Diễn là đơn vị trực thuộc Tencent, chuyên tập trung vào... ACL là hội nghị có tầm ảnh hưởng lớn nhất và năng động nhất trong lĩnh vực ngôn ngữ học tính toán và xử lý ngôn ngữ tự nhiên...

Machine之心

Mô hình thế giới (World Models): Chìa khóa đột phá cho trí tuệ hiện thân (robot hình người)

(11/02/2026). https://36kr.com/p/3678363993252488. [10] 36Kr. Vương Hiểu Cương và "Mô hình thế giới" của ông: Một người quản lý mười con chó, để robot bốn chân xuống phố làm việc trước...

Xây dựng cảng thông minh

GigaBrain-0.5M*: Một mô hình VLA (Vision-Language-Action) mới được hỗ trợ bởi mô hình thế giới

Kiến trúc được thiết kế chuyên biệt cho robot hai cánh tay, có khả năng tạo ra các ngôn ngữ chứa mục tiêu phụ, rời rạc... Hàm mất mát của mô hình huấn luyện kết hợp "ba trong một" đồng thời tối ưu hóa "suy luận chuỗi tư duy" (Chain-of-Thought) và "hành động"...

Cục Khám phá Vũ trụ

Bản tin sáng AI của YuYi - Ngày 23 tháng 03 năm 2026

Mô hình ngôn ngữ thị giác Alpamayo mã nguồn mở có khả năng suy luận, công cụ tái tạo thần kinh mã nguồn mở... Đến nay đã công bố hơn mười bài báo tại các hội nghị quốc tế hàng đầu như NeurIPS, ACL, với số trích dẫn trên Google Scholar...

Tập đoàn Công nghệ YuYi

Mô hình đã có khả năng tự soi xét (introspection), nhưng trước đây "cánh cửa tâm hồn" của nó đã bị khóa | Hao Hao trò chuyện về bài báo

Bản chất của mô hình ngôn ngữ là viết tiếp, chuỗi suy luận chẳng qua chỉ là một phần của việc viết tiếp, không có lý do gì để ở cấp độ nhân quả... Nhưng vấn đề mới mà nó đặt ra và lời giải đằng sau đó mới quan trọng hơn. Bởi vì câu trả lời cho vấn đề này...

Tencent Technology

Tencent và Alibaba đều đã tham gia! Chương trình hội thảo về bộ nhớ của mô hình lớn đã được công bố, phân tích chuyên sâu về các công nghệ như bộ nhớ tôm hùm (lobster memory), Hunyuan, v.v.

Đã công bố hơn 70 bài báo trên các tạp chí và hội nghị quốc tế như ACL và TKDE, sở hữu hơn 10 bằng sáng chế được cấp... Các bài báo tiêu điểm trên "Machine之心", "QbitAI" (Liangzwei) và "PaperWeekly", và nhiều...

Cục Tình báo Xe thông minh

Tân Mân Giang Net | Đột phá AI năm 2026: Mô hình sở hữu khả năng tự soi xét nhưng lại bị cơ chế căn chỉnh (alignment) khóa chặt "cánh cửa tâm hồn"

Khả năng cốt lõi của mô hình ngôn ngữ là viết tiếp, chuỗi suy luận chỉ là một phần của việc viết tiếp, vốn dĩ không nên điều khiển đầu ra cuối cùng ở cấp độ nhân quả. Tuy nhiên, vào ngày 23 tháng 3 năm 2026, Đại học Emory và...

Mạng lưới bắt bọ thương mại

1 2 3 4 5 6 7 8 9 10 Trang tiếp theo

Tìm thấy khoảng 205 kết quả

Ý chính từ bài gốc

  • Mô hình ngôn ngữ khuếch tán gặp khó khăn khi tăng kích thước khối: song song hóa cao hơn nhưng suy luận kém đi.
  • T* giới thiệu phương pháp học theo lộ trình: huấn luyện ổn định từ khối nhỏ trước khi mở rộng lên khối lớn.
  • Phương pháp này giúp ngăn chặn hiện tượng sụp đổ huấn luyện và trôi dạt chính sách trong học tăng cường.
  • Kết quả thực nghiệm cho thấy mô hình 4B đạt độ chính xác 76,00% trên MATH500 tại B=8, vượt xa mức 60,73% ban đầu.

Bài viết được AI dịch và tổng hợp tự động từ weixin.sogou.com. Liên kết bài gốc ở phía trên. AIHOT.vn luôn dẫn nguồn đầy đủ — nếu bạn thấy điểm cần chỉnh sửa, hãy gửi ý kiến tại trang phản hồi.