Nhật báo AI ngày 04/05/2026

Runway ra mắt 'Characters', tác nhân video thời gian thực có khả năng biến bất kỳ hình ảnh tĩnh nào thành nhân vật video có biểu cảm và giọng nói tự nhiên. Công nghệ này dựa trên mô hình thế giới GWM-1, đạt độ trễ máy chủ cực thấp chỉ 1,75 giây.

⚡ HÔM NAY CÓ GÌ HOT? (HIGHLIGHTS)

1. Sản phẩm / ứng dụng (1 tin)
Xây dựng tác nhân video thời gian thực từ một hình ảnh duy nhất: Phân tích kỹ thuật Runway Characters
2. Nghiên cứu / bài báo (2 tin)
Hệ thống o1 của OpenAI đạt độ chính xác 67% trong chẩn đoán cấp cứu, vượt xa bác sĩ phân loại (50-55%)
3. Thủ thuật / thực hành (6 tin)
Bộ kỹ năng Agent giúp giải quyết các vấn đề kỹ thuật thực tế

Sản phẩm / ứng dụng

Xây dựng tác nhân video thời gian thực từ một hình ảnh duy nhất: Phân tích kỹ thuật Runway Characters

Nguồn: Runway: News (Web) · Bài gốc

Runway ra mắt 'Characters', tác nhân video thời gian thực có khả năng biến bất kỳ hình ảnh tĩnh nào thành nhân vật video có biểu cảm và giọng nói tự nhiên. Công nghệ này dựa trên mô hình thế giới GWM-1, đạt độ trễ máy chủ cực thấp chỉ 1,75 giây.

Nghiên cứu / bài báo

Hệ thống o1 của OpenAI đạt độ chính xác 67% trong chẩn đoán cấp cứu, vượt xa bác sĩ phân loại (50-55%)

Nguồn: Hacker News Nổi bật (buzzing.cc bản dịch tiếng Trung) · Bài gốc

Nghiên cứu từ Harvard cho thấy hệ thống o1 của OpenAI có khả năng chẩn đoán bệnh nhân cấp cứu chính xác hơn các bác sĩ phân loại từ 12 đến 17 điểm phần trăm, mở ra tiềm năng lớn trong hỗ trợ y tế.

Tăng tốc 3 lần trên Google TPU: UCSD tối ưu hóa suy luận LLM bằng giải mã suy đoán kiểu khuếch tán

Nguồn: Google Developers Blog · Bài gốc

Nhóm nghiên cứu tại UCSD đã triển khai DFlash, phương pháp giải mã suy đoán dựa trên khuếch tán khối, giúp tăng tốc suy luận LLM lên gấp 3,13 lần trên TPU của Google bằng cách song song hóa việc tạo token.

Thủ thuật / thực hành

Bộ kỹ năng Agent giúp giải quyết các vấn đề kỹ thuật thực tế

Nguồn: X: Shao Meng (@shao__meng) · Bài gốc

Tác giả chia sẻ bộ kỹ năng Agent trong thư mục .claude nhằm giải quyết các điểm nghẽn kỹ thuật như: căn chỉnh yêu cầu, duy trì tài liệu ngữ cảnh, thiết lập vòng lặp phản hồi kiểm thử và chống lại sự gia tăng entropy của mã nguồn.

Codex ra mắt công cụ mã nguồn mở để kiểm tra áp lực ý tưởng khởi nghiệp

Nguồn: X: Greg Brockman (@gdb) · Bài gốc

Công cụ 'codex-startup-pressure-test-skill' giúp các nhà sáng lập xác định các giả định cốt lõi, tìm ra lỗ hổng chết người, phân tích đối thủ cạnh tranh và lập kế hoạch xây dựng sản phẩm khả thi tối thiểu (MVP) trong hai tuần.

Đa số các công ty vẫn chưa sẵn sàng để đón nhận AI

Nguồn: X: Baoyu (@dotey) · Bài gốc

Rào cản lớn nhất khiến doanh nghiệp khó ứng dụng AI không phải là công nghệ, mà là sự thiếu hụt về mục tiêu rõ ràng, chiến lược mơ hồ và quy trình làm việc chưa chuẩn hóa.

Phân tích tính khả thi kinh tế của mô hình AI hỗ trợ bằng quảng cáo: Chỉ cần 8 quảng cáo mỗi ngày

Nguồn: Tomer Tunguz Blog (phân tích VC) · Bài gốc

Mô hình AI dựa trên quảng cáo hoàn toàn khả thi về mặt kinh tế. Với tần suất hiển thị quảng cáo tương đương các ứng dụng di động thông thường, doanh thu có thể bù đắp chi phí vận hành GPU cho người dùng.

Khởi động lạnh nhanh gấp 60 lần: Coi GPU đồng cấp như máy chủ lưu trữ trọng số

Nguồn: Runway: News (Web) · Bài gốc

Hệ thống NCCLBack của Runway giúp rút ngắn thời gian khởi động mô hình từ vài phút xuống vài giây bằng cách truyền dữ liệu trực tiếp giữa các GPU trong cụm thay vì tải từ bộ nhớ đám mây.

Các mô hình ngôn ngữ lớn (LLM) có thực sự cải thiện kết quả điều trị của bệnh nhân?

Nguồn: Gary Marcus: The Road to AI We Can Trust · Bài gốc

Một nghiên cứu tổng quan chỉ ra rằng dù LLM như GPT, Claude hay LLaMA được ứng dụng rộng rãi trong y tế, hiện vẫn chưa có bằng chứng rõ ràng cho thấy chúng cải thiện trực tiếp các chỉ số lâm sàng quan trọng như tỷ lệ tử vong hay chất lượng cuộc sống của bệnh nhân.