← Quay lại dòng tin

Nghiên cứu · HuggingFace Daily Papers (Nổi bậtBài nghiên cứu)

Goku: Bước tiến mới trong chỉnh sửa video bằng câu lệnh với tập dữ liệu quy mô triệu mẫu

Goku là tập dữ liệu gồm 2 triệu cặp video chất lượng cao, cho phép chỉnh sửa video đa nhiệm từ ngoại hình đến chuyển động. Mô hình Goku-Edit với kiến trúc phân tách giúp cải thiện 8% khả năng tuân thủ

Điểm 39Thời gian 21:28
Tóm tắt

Goku là tập dữ liệu gồm 2 triệu cặp video chất lượng cao, cho phép chỉnh sửa video đa nhiệm từ ngoại hình đến chuyển động. Mô hình Goku-Edit với kiến trúc phân tách giúp cải thiện 8% khả năng tuân thủ câu lệnh so với các mô hình mã nguồn mở hiện nay.

Vì sao đáng chú ý

Đây là nghiên cứu đột phá giải quyết bài toán khó trong chỉnh sửa video bằng AI, cung cấp cả tập dữ liệu lớn và bộ tiêu chuẩn đánh giá thực tế, rất hữu ích cho cộng đồng nghiên cứu.

Nội dung dịch chi tiết

Goku là tập dữ liệu gồm 2 triệu cặp video chất lượng cao, cho phép chỉnh sửa video đa nhiệm từ ngoại hình đến chuyển động. Mô hình Goku-Edit với kiến trúc phân tách giúp cải thiện 8% khả năng tuân thủ câu lệnh so với các mô hình mã nguồn mở hiện nay.