Nhật báo AI ngày 24/06/2026

Sky Computing Lab ra mắt FastWan-QAD, mô hình tạo video sử dụng kỹ thuật chưng cất nhận thức lượng tử, cho phép tạo video 480P siêu tốc trên phần cứng tiêu dùng.

⚡ HÔM NAY CÓ GÌ HOT? (HIGHLIGHTS)

1. Phát hành / cập nhật mô hình (7 tin)

FastWan-QAD: Tạo video 5 giây chỉ trong 1.8 giây trên card đồ họa RTX 5090

2. Sản phẩm / ứng dụng (6 tin)

IBM ra mắt CUGA: Khung làm việc AI Agent siêu nhẹ với hơn 20 ứng dụng mẫu

3. Tín hiệu ngành (5 tin)

Oracle cắt giảm 21.000 nhân sự để dồn lực đầu tư hạ tầng AI bằng nợ vay

4. Nghiên cứu / bài báo (3 tin)

Nghiên cứu quy mô lớn: Công cụ tuyển dụng AI gây phân biệt chủng tộc và loại trừ hệ thống

5. Thủ thuật / thực hành (5 tin)

Hugging Face chuyển sang quy trình phát hành hàng tuần nhờ tự động hóa AI

Phát hành / cập nhật mô hình

FastWan-QAD: Tạo video 5 giây chỉ trong 1.8 giây trên card đồ họa RTX 5090

Nguồn: X: Sky Computing Lab (@haoailab) · Bài gốc

JD.com ra mắt JoyAI-VL-Interaction: Mô hình đa phương thức mã nguồn mở cho tương tác video thời gian thực

Nguồn: : JoyAI · Bài gốc

JD.com vừa công bố JoyAI-VL-Interaction, mô hình tương tác video toàn diện đầu tiên hỗ trợ vLLM-Omni, cho phép AI quan sát, phân tích và phản hồi sự kiện theo thời gian thực với hiệu suất vượt trội so với các đối thủ lớn.

NetEase Youdao ra mắt Confucius4-TTS: Mô hình AI nhân bản giọng nói đa ngôn ngữ không cần văn bản mẫu

Nguồn: IT Home · Bài gốc

NetEase Youdao giới thiệu Confucius4-TTS, mô hình mã nguồn mở hỗ trợ 14 ngôn ngữ với khả năng nhân bản giọng nói chỉ từ 3 giây âm thanh mà không cần văn bản tham chiếu, đạt độ chính xác 97%.

Krea AI chính thức công bố báo cáo kỹ thuật cho mô hình Krea 2

Nguồn: X: Krea AI (@krea_ai) · Bài gốc

Krea AI vừa phát hành báo cáo kỹ thuật chi tiết, hé lộ toàn bộ dữ liệu, kiến trúc và các kỹ thuật huấn luyện đột phá đằng sau mô hình Krea 2.

ByteDance ra mắt Doubao-Seed-Audio 1.0: Đột phá mới trong sáng tạo âm thanh AI

Nguồn: : · Bài gốc

Mô hình Doubao-Seed-Audio 1.0 của ByteDance cho phép tạo âm thanh đa nhân vật, giàu cảm xúc và nhạc nền chỉ từ văn bản mà không cần hậu kỳ, hỗ trợ tạo đoạn âm thanh dài 2 phút với độ nhất quán cao.

Mistral AI ra mắt Mistral OCR 4: Công cụ nhận diện tài liệu mạnh mẽ, hỗ trợ 170 ngôn ngữ

Nguồn: Mistral AI: News (Web) · Bài gốc

Mistral OCR 4 vừa được trình làng với khả năng phân loại cấu trúc tài liệu chuyên sâu, hỗ trợ 170 ngôn ngữ và cho phép tự triển khai cục bộ. Với độ chính xác cao và chi phí tối ưu, đây là giải pháp mạnh mẽ cho các tác vụ xử lý văn bản quy mô lớn.

ByteDance ra mắt Seed 2.1: Bước tiến mới cho AI tạo năng suất thực tế

Nguồn: Seed: Research Feed (Dữ liệu nhúng trên web) · Bài gốc

Nội dung tiếng Việt đang được cập nhật.

Sản phẩm / ứng dụng

IBM ra mắt CUGA: Khung làm việc AI Agent siêu nhẹ với hơn 20 ứng dụng mẫu

Nguồn: Hugging Face: Blog · Bài gốc

IBM vừa mã nguồn mở CUGA, khung làm việc AI Agent tinh gọn hỗ trợ lập kế hoạch, thực thi và quản lý công cụ. Với hơn 20 ứng dụng mẫu tích hợp, CUGA cho phép lập trình viên xây dựng Agent chuyên biệt chỉ bằng một tệp tin duy nhất.

Runway ra mắt bộ ba mô hình AI mới: Seedance 4K, Seedance Mini và Kling 3.0 Turbo

Nguồn: X: Runway (@runwayml) · Bài gốc

Runway vừa chính thức trình làng ba mô hình AI đột phá gồm Seedance 4K, Seedance Mini và Kling 3.0 Turbo. Người dùng có thể trải nghiệm ngay với ưu đãi giảm giá 30% trong 3 tháng đầu tiên khi sử dụng mã 30RUNWAY.

Unlimited OCR: Giải pháp phân tích văn bản dài trong một lần xử lý

Nguồn: Hacker News Nổi bật (buzzing.cc bản dịch tiếng Trung) · Bài gốc

Unlimited OCR là dự án mã nguồn mở từ Baidu, cho phép xử lý OCR trên các tài liệu có thời lượng hoặc độ dài lớn chỉ trong một lần phân tích duy nhất.

AI tư vấn tuyển sinh đại học đầu tiên tại Trung Quốc: Qwen vượt mặt chuyên gia dày dạn kinh nghiệm

Nguồn: : APP · Bài gốc

Báo cáo từ YouSong Lab cho thấy AI Qwen đạt độ chính xác cao hơn chuyên gia trong việc tư vấn nguyện vọng đại học, giúp giảm 27% thời gian làm việc và nâng cao hiệu suất cho các tư vấn viên con người.

Anthropic ra mắt Claude Tag: Cộng tác trực tiếp với AI ngay trong Slack

Nguồn: Anthropic: Newsroom (Web) · Bài gốc

Anthropic giới thiệu Claude Tag, tính năng cho phép người dùng giao việc cho Claude ngay trong Slack. AI có thể ghi nhớ ngữ cảnh, tự động cập nhật tiến độ và hỗ trợ làm việc bất đồng bộ cho các nhóm doanh nghiệp.

Claude Code v2.1.187: Tăng cường bảo mật sandbox và tối ưu trải nghiệm lập trình

Nguồn: Claude Code: GitHub Releases · Bài gốc

Bản cập nhật mới bổ sung tính năng bảo mật credential trong sandbox, hỗ trợ cấu hình giới hạn mô hình theo tổ chức và khắc phục hàng loạt lỗi về hiệu suất, hiển thị văn bản cùng các sự cố treo phiên làm việc.

Tín hiệu ngành

Oracle cắt giảm 21.000 nhân sự để dồn lực đầu tư hạ tầng AI bằng nợ vay

Nguồn: Ars Technica: AI · Bài gốc

Oracle vừa cắt giảm gần 13% nhân sự để tối ưu chi phí, đồng thời lên kế hoạch huy động tới 50 tỷ USD nợ và vốn cổ phần nhằm mở rộng hạ tầng đám mây phục vụ các ông lớn công nghệ như OpenAI và Nvidia.

Liên minh Ngũ Nhãn cảnh báo: Mối đe dọa từ AI sẽ sớm tấn công người dùng phổ thông

Nguồn: Artificial Intelligence News · Bài gốc

Liên minh Ngũ Nhãn cảnh báo các mô hình AI thế hệ mới đang hạ thấp rào cản tấn công mạng, khiến các vụ lừa đảo cá nhân hóa và mã độc gia tăng mạnh. Người dùng được khuyến cáo tăng cường bảo mật tài khoản ngay từ bây giờ.

GitHub cùng liên minh công nghệ kêu gọi sửa đổi dự luật AI California để bảo vệ mã nguồn mở

Nguồn: GitHub Blog · Bài gốc

GitHub và các đối tác kiến nghị sửa đổi dự luật SB 942 của California, phản đối yêu cầu thu hồi giấy phép mã nguồn mở khi người dùng cuối vi phạm, nhằm đảm bảo tính tương thích với bản chất vĩnh viễn của phần mềm nguồn mở.

OpenAI hợp tác cùng Appia Foundation xây dựng tiêu chuẩn chung cho AI tiên tiến

Nguồn: OpenAI: Tin chính thức (RSS - lọc nội dung doanh nghiệp/khách hàng) · Bài gốc

OpenAI bắt tay với Appia Foundation nhằm thiết lập các tiêu chuẩn chung cho AI tiên tiến, tập trung vào khung đánh giá, thực hành an toàn và thúc đẩy hợp tác toàn cầu.

Omio định hình tương lai du lịch thông minh với công nghệ hội thoại từ OpenAI

Nguồn: OpenAI: Tin chính thức (RSS - lọc nội dung doanh nghiệp/khách hàng) · Bài gốc

Omio tích hợp công nghệ OpenAI để tạo ra trải nghiệm du lịch bằng hội thoại, đẩy nhanh tốc độ phát triển sản phẩm và chuyển mình thành doanh nghiệp ưu tiên AI.

Nghiên cứu / bài báo

Nghiên cứu quy mô lớn: Công cụ tuyển dụng AI gây phân biệt chủng tộc và loại trừ hệ thống

Nguồn: Hacker News Nổi bật (buzzing.cc bản dịch tiếng Trung) · Bài gốc

Nghiên cứu trên 3,4 triệu người cho thấy các công cụ AI tuyển dụng gây ra sự thiên kiến chủng tộc nghiêm trọng, loại trừ 26% ứng viên da đen và 15% ứng viên gốc Á. Việc phụ thuộc vào một số ít nhà cung cấp thuật toán đang tạo ra rào cản hệ thống, đòi hỏi sự giám sát độc lập chặt chẽ.

Nghiên cứu của Apple: Dùng nhiều mô hình AI để chấm điểm không hiệu quả như kỳ vọng

Nguồn: Apple Machine Learning Research · Bài gốc

Nghiên cứu từ Apple chỉ ra rằng việc sử dụng hội đồng nhiều mô hình LLM để đánh giá không mang lại độ chính xác cao do sự tương đồng quá lớn giữa các mô hình, khiến 9 giám khảo thực tế chỉ cung cấp lượng thông tin tương đương 2 giám khảo độc lập.

Tối ưu hóa ngân sách gán nhãn dữ liệu: Học từ phân phối nhãn dựa trên chỉ số đánh giá

Nguồn: Apple Machine Learning Research · Bài gốc

Nghiên cứu từ Apple chỉ ra rằng số lượng người gán nhãn cần thiết phụ thuộc vào chỉ số đánh giá mục tiêu. Việc sử dụng nhãn mềm (soft labels) giúp mô hình đạt hiệu suất tối ưu với ít dữ liệu hơn so với kỹ thuật làm mịn nhãn truyền thống.

Nhật báo AI ngày 24/06/2026

⚡ HÔM NAY CÓ GÌ HOT? (HIGHLIGHTS)

Phát hành / cập nhật mô hình

FastWan-QAD: Tạo video 5 giây chỉ trong 1.8 giây trên card đồ họa RTX 5090

JD.com ra mắt JoyAI-VL-Interaction: Mô hình đa phương thức mã nguồn mở cho tương tác video thời gian thực

NetEase Youdao ra mắt Confucius4-TTS: Mô hình AI nhân bản giọng nói đa ngôn ngữ không cần văn bản mẫu

Krea AI chính thức công bố báo cáo kỹ thuật cho mô hình Krea 2

ByteDance ra mắt Doubao-Seed-Audio 1.0: Đột phá mới trong sáng tạo âm thanh AI

Mistral AI ra mắt Mistral OCR 4: Công cụ nhận diện tài liệu mạnh mẽ, hỗ trợ 170 ngôn ngữ

ByteDance ra mắt Seed 2.1: Bước tiến mới cho AI tạo năng suất thực tế

Sản phẩm / ứng dụng

IBM ra mắt CUGA: Khung làm việc AI Agent siêu nhẹ với hơn 20 ứng dụng mẫu

Runway ra mắt bộ ba mô hình AI mới: Seedance 4K, Seedance Mini và Kling 3.0 Turbo

Unlimited OCR: Giải pháp phân tích văn bản dài trong một lần xử lý

AI tư vấn tuyển sinh đại học đầu tiên tại Trung Quốc: Qwen vượt mặt chuyên gia dày dạn kinh nghiệm

Anthropic ra mắt Claude Tag: Cộng tác trực tiếp với AI ngay trong Slack

Claude Code v2.1.187: Tăng cường bảo mật sandbox và tối ưu trải nghiệm lập trình

Tín hiệu ngành

Oracle cắt giảm 21.000 nhân sự để dồn lực đầu tư hạ tầng AI bằng nợ vay

Liên minh Ngũ Nhãn cảnh báo: Mối đe dọa từ AI sẽ sớm tấn công người dùng phổ thông

GitHub cùng liên minh công nghệ kêu gọi sửa đổi dự luật AI California để bảo vệ mã nguồn mở

OpenAI hợp tác cùng Appia Foundation xây dựng tiêu chuẩn chung cho AI tiên tiến

Omio định hình tương lai du lịch thông minh với công nghệ hội thoại từ OpenAI

Nghiên cứu / bài báo

Nghiên cứu quy mô lớn: Công cụ tuyển dụng AI gây phân biệt chủng tộc và loại trừ hệ thống

Nghiên cứu của Apple: Dùng nhiều mô hình AI để chấm điểm không hiệu quả như kỳ vọng

Tối ưu hóa ngân sách gán nhãn dữ liệu: Học từ phân phối nhãn dựa trên chỉ số đánh giá

Thủ thuật / thực hành

Hugging Face chuyển sang quy trình phát hành hàng tuần nhờ tự động hóa AI

Thử nghiệm API lưu trữ Cross-Origin cho Transformers.js

Cách Meta chế tạo pin vỏ thép siêu mỏng cho kính thông minh AI

Claude ra mắt mô hình truy cập 'Agent Identity': Định nghĩa lại cách AI làm việc trong nhóm

GPT-5 hỗ trợ nhà miễn dịch học Derya Unutmaz giải mã bí ẩn suốt 3 năm