Nghiên cứu · IT Home（RSS）

Nghiên cứu từ Bridgewater: Tự tinh chỉnh mô hình mã nguồn mở vượt xa AI thương mại trong tài chính

Nghiên cứu cho thấy các mô hình AI hàng đầu chỉ đạt độ chính xác 50-70% trong tác vụ tài chính. Bằng cách tinh chỉnh mô hình Qwen3-235B, nhóm nghiên cứu đạt độ chính xác 84,7% với chi phí chỉ bằng 1/1

Điểm 63Thời gian 21:07

Tóm tắt

Vì sao đáng chú ý

Thông tin có giá trị thực tiễn cao cho doanh nghiệp, chứng minh hiệu quả kinh tế và độ chính xác của việc tinh chỉnh mô hình mã nguồn mở so với các mô hình đóng đắt đỏ.

Nội dung dịch chi tiết

Một nghiên cứu mới từ AIA Labs (thuộc quỹ Bridgewater) phối hợp cùng Thinking Machines Lab đã đánh giá khả năng của các mô hình ngôn ngữ lớn (LLM) hàng đầu như GPT, Claude và Gemini trong các tác vụ sàng lọc thông tin tài chính cơ bản. Kết quả cho thấy hiệu suất của các mô hình này chưa đạt kỳ vọng.

Nhóm nghiên cứu đã thực hiện 6 tác vụ điển hình của chuyên gia phân tích đầu tư, bao gồm đánh giá giá trị của các bài báo tài chính và dự báo xu hướng lãi suất từ văn bản ngân hàng trung ương. Với các câu lệnh (prompt) cơ bản, các mô hình hàng đầu chỉ đạt độ chính xác trung bình khoảng 50%. Ngay cả khi được tối ưu hóa bằng các câu lệnh chuyên sâu và hệ thống phân loại ba cấp, độ chính xác cũng chỉ dừng lại ở mức 70%, thấp hơn ngưỡng tin cậy 80% mà các nhà nghiên cứu đặt ra.

Báo cáo cũng chỉ ra rằng việc nâng cấp phiên bản mô hình không mang lại cải thiện đáng kể. Ví dụ, GPT-5.4 có chi phí cao hơn 43% so với GPT-5.2 nhưng độ chính xác chỉ tăng nhẹ. Điều này cho thấy các mô hình tiên tiến vẫn tồn tại những "điểm mù" đối với dữ liệu chuyên biệt và kiến thức chuyên môn chưa được mã hóa của doanh nghiệp.

Để giải quyết vấn đề, nhóm nghiên cứu đã sử dụng mô hình mã nguồn mở Qwen3-235B của Alibaba làm nền tảng. Thông qua quy trình tinh chỉnh (fine-tuning) với cơ chế xác thực dữ liệu thông minh, nhóm đã khắc phục được các lỗi nhãn dán và tối ưu hóa chi phí. Kết quả, mô hình tùy chỉnh này đạt độ chính xác 84,7%, vượt qua mức 78,2% của mô hình thương mại tốt nhất trong thử nghiệm.

Ngoài hiệu suất vượt trội, mô hình tinh chỉnh còn giúp giảm chi phí suy luận xuống chỉ còn khoảng 1/14 so với các mô hình thương mại. Quan trọng hơn, cách tiếp cận này cho phép doanh nghiệp giữ quyền kiểm soát dữ liệu độc quyền và hạ tầng tính toán, thay vì phải phụ thuộc vào các phòng thí nghiệm AI bên thứ ba.

Bridgewater cho biết mô hình này đã được đưa vào sử dụng thực tế. Họ tin rằng việc phát triển "trí tuệ khác biệt" được tùy chỉnh theo nhu cầu cụ thể của tổ chức sẽ là xu hướng tất yếu trong tương lai.

Ý chính từ bài gốc

Các mô hình AI hàng đầu như GPT, Claude chỉ đạt độ chính xác 50-70% trong các tác vụ tài chính cơ bản, chưa đạt ngưỡng tin cậy 80%.
Mô hình mã nguồn mở Qwen3-235B sau khi tinh chỉnh đạt độ chính xác 84,7%, vượt trội hơn các mô hình thương mại tốt nhất.
Chi phí vận hành của mô hình tinh chỉnh chỉ bằng 1/14 so với các mô hình AI tiên tiến hiện nay.
Việc tự tinh chỉnh mô hình giúp doanh nghiệp bảo mật dữ liệu độc quyền và duy trì quyền kiểm soát hạ tầng công nghệ.

Mở bài gốc