Nhật báo AI ngày 24/06/2026
Sky Computing Lab ra mắt FastWan-QAD, mô hình tạo video sử dụng kỹ thuật chưng cất nhận thức lượng tử, cho phép tạo video 480P siêu tốc trên phần cứng tiêu dùng.
⚡ HÔM NAY CÓ GÌ HOT? (HIGHLIGHTS)
Phát hành / cập nhật mô hình
FastWan-QAD: Tạo video 5 giây chỉ trong 1.8 giây trên card đồ họa RTX 5090
Sky Computing Lab ra mắt FastWan-QAD, mô hình tạo video sử dụng kỹ thuật chưng cất nhận thức lượng tử, cho phép tạo video 480P siêu tốc trên phần cứng tiêu dùng.
JD.com ra mắt JoyAI-VL-Interaction: Mô hình đa phương thức mã nguồn mở cho tương tác video thời gian thực
JD.com vừa công bố JoyAI-VL-Interaction, mô hình tương tác video toàn diện đầu tiên hỗ trợ vLLM-Omni, cho phép AI quan sát, phân tích và phản hồi sự kiện theo thời gian thực với hiệu suất vượt trội so với các đối thủ lớn.
NetEase Youdao ra mắt Confucius4-TTS: Mô hình AI nhân bản giọng nói đa ngôn ngữ không cần văn bản mẫu
NetEase Youdao giới thiệu Confucius4-TTS, mô hình mã nguồn mở hỗ trợ 14 ngôn ngữ với khả năng nhân bản giọng nói chỉ từ 3 giây âm thanh mà không cần văn bản tham chiếu, đạt độ chính xác 97%.
Krea AI chính thức công bố báo cáo kỹ thuật cho mô hình Krea 2
Krea AI vừa phát hành báo cáo kỹ thuật chi tiết, hé lộ toàn bộ dữ liệu, kiến trúc và các kỹ thuật huấn luyện đột phá đằng sau mô hình Krea 2.
ByteDance ra mắt Doubao-Seed-Audio 1.0: Đột phá mới trong sáng tạo âm thanh AI
Mô hình Doubao-Seed-Audio 1.0 của ByteDance cho phép tạo âm thanh đa nhân vật, giàu cảm xúc và nhạc nền chỉ từ văn bản mà không cần hậu kỳ, hỗ trợ tạo đoạn âm thanh dài 2 phút với độ nhất quán cao.
Mistral AI ra mắt Mistral OCR 4: Công cụ nhận diện tài liệu mạnh mẽ, hỗ trợ 170 ngôn ngữ
Mistral OCR 4 vừa được trình làng với khả năng phân loại cấu trúc tài liệu chuyên sâu, hỗ trợ 170 ngôn ngữ và cho phép tự triển khai cục bộ. Với độ chính xác cao và chi phí tối ưu, đây là giải pháp mạnh mẽ cho các tác vụ xử lý văn bản quy mô lớn.
ByteDance ra mắt Seed 2.1: Bước tiến mới cho AI tạo năng suất thực tế
Nội dung tiếng Việt đang được cập nhật.
Sản phẩm / ứng dụng
IBM ra mắt CUGA: Khung làm việc AI Agent siêu nhẹ với hơn 20 ứng dụng mẫu
IBM vừa mã nguồn mở CUGA, khung làm việc AI Agent tinh gọn hỗ trợ lập kế hoạch, thực thi và quản lý công cụ. Với hơn 20 ứng dụng mẫu tích hợp, CUGA cho phép lập trình viên xây dựng Agent chuyên biệt chỉ bằng một tệp tin duy nhất.
Runway ra mắt bộ ba mô hình AI mới: Seedance 4K, Seedance Mini và Kling 3.0 Turbo
Runway vừa chính thức trình làng ba mô hình AI đột phá gồm Seedance 4K, Seedance Mini và Kling 3.0 Turbo. Người dùng có thể trải nghiệm ngay với ưu đãi giảm giá 30% trong 3 tháng đầu tiên khi sử dụng mã 30RUNWAY.
Unlimited OCR: Giải pháp phân tích văn bản dài trong một lần xử lý
Unlimited OCR là dự án mã nguồn mở từ Baidu, cho phép xử lý OCR trên các tài liệu có thời lượng hoặc độ dài lớn chỉ trong một lần phân tích duy nhất.
AI tư vấn tuyển sinh đại học đầu tiên tại Trung Quốc: Qwen vượt mặt chuyên gia dày dạn kinh nghiệm
Báo cáo từ YouSong Lab cho thấy AI Qwen đạt độ chính xác cao hơn chuyên gia trong việc tư vấn nguyện vọng đại học, giúp giảm 27% thời gian làm việc và nâng cao hiệu suất cho các tư vấn viên con người.
Anthropic ra mắt Claude Tag: Cộng tác trực tiếp với AI ngay trong Slack
Anthropic giới thiệu Claude Tag, tính năng cho phép người dùng giao việc cho Claude ngay trong Slack. AI có thể ghi nhớ ngữ cảnh, tự động cập nhật tiến độ và hỗ trợ làm việc bất đồng bộ cho các nhóm doanh nghiệp.
Claude Code v2.1.187: Tăng cường bảo mật sandbox và tối ưu trải nghiệm lập trình
Bản cập nhật mới bổ sung tính năng bảo mật credential trong sandbox, hỗ trợ cấu hình giới hạn mô hình theo tổ chức và khắc phục hàng loạt lỗi về hiệu suất, hiển thị văn bản cùng các sự cố treo phiên làm việc.
Tín hiệu ngành
Oracle cắt giảm 21.000 nhân sự để dồn lực đầu tư hạ tầng AI bằng nợ vay
Oracle vừa cắt giảm gần 13% nhân sự để tối ưu chi phí, đồng thời lên kế hoạch huy động tới 50 tỷ USD nợ và vốn cổ phần nhằm mở rộng hạ tầng đám mây phục vụ các ông lớn công nghệ như OpenAI và Nvidia.
Liên minh Ngũ Nhãn cảnh báo: Mối đe dọa từ AI sẽ sớm tấn công người dùng phổ thông
Liên minh Ngũ Nhãn cảnh báo các mô hình AI thế hệ mới đang hạ thấp rào cản tấn công mạng, khiến các vụ lừa đảo cá nhân hóa và mã độc gia tăng mạnh. Người dùng được khuyến cáo tăng cường bảo mật tài khoản ngay từ bây giờ.
GitHub cùng liên minh công nghệ kêu gọi sửa đổi dự luật AI California để bảo vệ mã nguồn mở
GitHub và các đối tác kiến nghị sửa đổi dự luật SB 942 của California, phản đối yêu cầu thu hồi giấy phép mã nguồn mở khi người dùng cuối vi phạm, nhằm đảm bảo tính tương thích với bản chất vĩnh viễn của phần mềm nguồn mở.
OpenAI hợp tác cùng Appia Foundation xây dựng tiêu chuẩn chung cho AI tiên tiến
OpenAI bắt tay với Appia Foundation nhằm thiết lập các tiêu chuẩn chung cho AI tiên tiến, tập trung vào khung đánh giá, thực hành an toàn và thúc đẩy hợp tác toàn cầu.
Omio định hình tương lai du lịch thông minh với công nghệ hội thoại từ OpenAI
Omio tích hợp công nghệ OpenAI để tạo ra trải nghiệm du lịch bằng hội thoại, đẩy nhanh tốc độ phát triển sản phẩm và chuyển mình thành doanh nghiệp ưu tiên AI.
Nghiên cứu / bài báo
Nghiên cứu quy mô lớn: Công cụ tuyển dụng AI gây phân biệt chủng tộc và loại trừ hệ thống
Nghiên cứu trên 3,4 triệu người cho thấy các công cụ AI tuyển dụng gây ra sự thiên kiến chủng tộc nghiêm trọng, loại trừ 26% ứng viên da đen và 15% ứng viên gốc Á. Việc phụ thuộc vào một số ít nhà cung cấp thuật toán đang tạo ra rào cản hệ thống, đòi hỏi sự giám sát độc lập chặt chẽ.
Nghiên cứu của Apple: Dùng nhiều mô hình AI để chấm điểm không hiệu quả như kỳ vọng
Nghiên cứu từ Apple chỉ ra rằng việc sử dụng hội đồng nhiều mô hình LLM để đánh giá không mang lại độ chính xác cao do sự tương đồng quá lớn giữa các mô hình, khiến 9 giám khảo thực tế chỉ cung cấp lượng thông tin tương đương 2 giám khảo độc lập.
Tối ưu hóa ngân sách gán nhãn dữ liệu: Học từ phân phối nhãn dựa trên chỉ số đánh giá
Nghiên cứu từ Apple chỉ ra rằng số lượng người gán nhãn cần thiết phụ thuộc vào chỉ số đánh giá mục tiêu. Việc sử dụng nhãn mềm (soft labels) giúp mô hình đạt hiệu suất tối ưu với ít dữ liệu hơn so với kỹ thuật làm mịn nhãn truyền thống.
Thủ thuật / thực hành
Hugging Face chuyển sang quy trình phát hành hàng tuần nhờ tự động hóa AI
Hugging Face rút ngắn chu kỳ phát hành thư viện huggingface_hub xuống còn hàng tuần thông qua quy trình tự động hóa toàn diện, kết hợp công cụ mã nguồn mở và AI để soạn thảo nội dung, đồng thời vẫn giữ quyền kiểm duyệt cuối cùng cho con người.
Thử nghiệm API lưu trữ Cross-Origin cho Transformers.js
Transformers.js gặp vấn đề lãng phí băng thông do trình duyệt cô lập bộ nhớ đệm theo nguồn gốc. Bài viết giới thiệu cách dùng Cross-Origin Storage API để chia sẻ tài nguyên AI giữa các ứng dụng web, giúp tối ưu hóa dung lượng lưu trữ và tốc độ tải.
Cách Meta chế tạo pin vỏ thép siêu mỏng cho kính thông minh AI
Meta đã phát triển loại pin vỏ thép rộng chỉ 7mm với cấu trúc điện cực xếp chồng, giúp tăng dung lượng và tối ưu hóa không gian cho kính Ray-Ban Meta thế hệ mới mà không làm giảm hiệu suất.
Claude ra mắt mô hình truy cập 'Agent Identity': Định nghĩa lại cách AI làm việc trong nhóm
Claude giới thiệu mô hình Agent Identity cho phép AI hoạt động như một thực thể độc lập trong các kênh làm việc, thay vì giả danh người dùng. Điều này giúp quản lý quyền truy cập dữ liệu và công cụ linh hoạt, bảo mật hơn cho các tác vụ đa người dùng.
GPT-5 hỗ trợ nhà miễn dịch học Derya Unutmaz giải mã bí ẩn suốt 3 năm
GPT-5 Pro đã giúp nhà miễn dịch học Derya Unutmaz giải quyết một bài toán hóc búa kéo dài 3 năm về hành vi của tế bào T, mở ra hướng đi mới trong nghiên cứu ung thư và các bệnh tự miễn.