Nhật báo AI ngày 28/05/2026

Runway vừa giới thiệu máy chủ MCP, cho phép các AI như Claude hay Cursor tạo video và hình ảnh trực tiếp từ giao diện chat mà không cần chuyển đổi ứng dụng. Người dùng có thể truy cập các mô hình mạnh mẽ nhất của Runway như Gen-4.5 và Kling 3.0 chỉ bằng cách đăng nhập tài khoản.

⚡ HÔM NAY CÓ GÌ HOT? (HIGHLIGHTS)

1. Sản phẩm / ứng dụng (8 tin)
Runway ra mắt máy chủ MCP: Tích hợp trực tiếp AI tạo video vào Claude, Cursor và ChatGPT
2. Tín hiệu ngành (8 tin)
Jensen Huang công bố kế hoạch mở rộng trung tâm nghiên cứu của Nvidia tại Đài Loan
3. Nghiên cứu / bài báo (4 tin)
Qwen 3.5 đạt tốc độ suy luận kỷ lục 580 tokens/giây
4. Thủ thuật / thực hành (8 tin)
Trò chuyện cùng Phó chủ tịch Google: Kỷ nguyên tìm kiếm 'AI nguyên bản' đã bắt đầu

Sản phẩm / ứng dụng

Runway ra mắt máy chủ MCP: Tích hợp trực tiếp AI tạo video vào Claude, Cursor và ChatGPT

Nguồn: Runway: News (Web) · Bài gốc

Runway vừa giới thiệu máy chủ MCP, cho phép các AI như Claude hay Cursor tạo video và hình ảnh trực tiếp từ giao diện chat mà không cần chuyển đổi ứng dụng. Người dùng có thể truy cập các mô hình mạnh mẽ nhất của Runway như Gen-4.5 và Kling 3.0 chỉ bằng cách đăng nhập tài khoản.

Claude Code cập nhật v2.1.152: Tự động sửa lỗi code và tối ưu hóa trải nghiệm lập trình

Nguồn: Claude Code: GitHub Releases · Bài gốc

Bản cập nhật mới của Claude Code bổ sung tính năng tự động áp dụng sửa lỗi từ code review, cải tiến quản lý kỹ năng qua lệnh mới và nâng cao độ ổn định cho các phiên làm việc.

OpenAI hỗ trợ kết nối bảo mật với máy chủ MCP riêng

Nguồn: X: OpenAI Developers (@OpenAIDevs) · Bài gốc

Các đội ngũ phát triển giờ đây có thể giữ máy chủ MCP trong mạng nội bộ, trong khi ChatGPT và các API của OpenAI vẫn kết nối an toàn thông qua giao thức HTTPS chỉ xuất.

FastVideo Dreamverse: Công cụ tạo video 1080p thời gian thực chỉ trong 7 giây

Nguồn: X: Sky Computing Lab (@haoailab) · Bài gốc

FastVideo Dreamverse là mã nguồn mở mới dựa trên mô hình LTX-2, cho phép tạo video 1080p dài 30 giây chỉ với một GPU NVIDIA B200, tối ưu hóa mạnh mẽ cho nhu cầu sáng tạo nội dung thời gian thực.

Trợ lý lập trình Grok chính thức tích hợp vào nền tảng Kilo IDE

Nguồn: X: xAI (@xai) · Bài gốc

Người dùng X Premium+ hiện có thể trải nghiệm mô hình grok-build-0.1 ngay trong Kilo IDE hoặc CLI, giúp tăng tốc độ và tối ưu hóa quy trình lập trình với sự hỗ trợ từ AI.

Perplexity mã nguồn mở bộ tách từ Unigram giúp giảm 5-6 lần mức sử dụng CPU

Nguồn: X: Perplexity (@perplexity_ai) · Bài gốc

Perplexity vừa công bố bộ tách từ Unigram mã nguồn mở mới, giúp tối ưu hóa hiệu suất bằng cách giảm mức sử dụng CPU từ 5 đến 6 lần, đặc biệt hữu ích cho các mô hình nhỏ có độ trễ thấp.

Đồng bộ trọng số tăng dần trong TRL: Giải pháp tối ưu cho mô hình nghìn tỷ tham số

Nguồn: Hugging Face: Blog · Bài gốc

Bài viết giới thiệu kỹ thuật đồng bộ trọng số tăng dần (delta weight sync) trong framework TRL của Hugging Face, giúp tối ưu hóa việc cập nhật các mô hình quy mô lớn thông qua Hub Bucket.

OpenCode ra mắt MiMo V2.5: Miễn phí trải nghiệm giới hạn với cửa sổ ngữ cảnh 1 triệu token

Nguồn: X: opencode (@opencode) · Bài gốc

OpenCode vừa mở quyền truy cập miễn phí trong thời gian giới hạn cho mô hình MiMo V2.5, hỗ trợ cửa sổ ngữ cảnh lên tới 1 triệu token cùng khả năng xử lý đa phương thức gồm văn bản, hình ảnh và suy luận chuyên sâu.

Tín hiệu ngành

Jensen Huang công bố kế hoạch mở rộng trung tâm nghiên cứu của Nvidia tại Đài Loan

Nguồn: X: Rohan Paul (@rohanpaul_ai) · Bài gốc

Nvidia dự kiến đầu tư khoảng 150 tỷ Đài tệ vào Đài Loan để xây dựng cơ sở mới, chỉ một tuần sau khi AMD công bố khoản đầu tư hơn 10 tỷ Đài tệ vào hệ sinh thái AI tại đây.

Trung Quốc đẩy nhanh xây dựng khung pháp lý toàn diện cho AI và kinh tế tầm thấp

Nguồn: IT Home · Bài gốc

Trung Quốc đang tăng tốc nghiên cứu và ban hành các đạo luật chuyên biệt nhằm quản lý sự phát triển của trí tuệ nhân tạo (AI) và thúc đẩy lĩnh vực kinh tế tầm thấp, đảm bảo sự phát triển bền vững và an toàn.

Cognition trở thành phòng thí nghiệm AI Agent độc lập lớn nhất thế giới

Nguồn: X: swyx (@swyx) · Bài gốc

Cognition vừa huy động thành công hơn 1 tỷ USD với định giá 26 tỷ USD, khẳng định vị thế dẫn đầu trong lĩnh vực AI Agent với doanh thu hàng năm đạt 492 triệu USD nhờ sự bùng nổ của kỹ sư AI Devin.

Giáo hoàng ban hành thông điệp về AGI: Công nghệ không chỉ là vấn đề kỹ thuật

Nguồn: The Verge: AI · Bài gốc

Trong thông điệp 'Magnifica Humanitas', Giáo hoàng cảnh báo việc ứng dụng AI ảnh hưởng trực tiếp đến quyền lợi và tự do con người. Sự kiện có sự góp mặt của đồng sáng lập Anthropic, thu hút sự chú ý lớn từ giới công nghệ.

Qualcomm hợp tác với ByteDance phát triển chip AI ASIC, đơn hàng lên tới hàng triệu đơn vị

Nguồn: IT Home · Bài gốc

Qualcomm được cho là đã đạt thỏa thuận cung cấp chip AI ASIC cho ByteDance với số lượng đặt hàng lên tới hàng triệu đơn vị, nhằm tối ưu hóa hạ tầng xử lý AI của công ty mẹ TikTok.

Alibaba Cloud được Omdia vinh danh là đơn vị dẫn đầu thị trường AI Agent

Nguồn: X: Alibaba Cloud / Alibaba Cloud (@alibaba_cloud) · Bài gốc

Alibaba Cloud được Omdia công nhận là đơn vị dẫn đầu nhờ năng lực toàn diện và là nhà cung cấp dịch vụ đám mây đầu tiên tái cấu trúc nền tảng xoay quanh mô hình AI Agent.

Alibaba Cloud chính thức trở thành thành viên Bạch kim của PyTorch Foundation

Nguồn: X: Alibaba Cloud / Alibaba Cloud (@alibaba_cloud) · Bài gốc

Alibaba Cloud gia nhập PyTorch Foundation với tư cách thành viên Bạch kim, cam kết đóng góp kinh nghiệm kỹ thuật quy mô lớn và thúc đẩy hệ sinh thái mã nguồn mở từ nền tảng của các mô hình Qwen.

OpenAI công bố chiến lược bảo vệ thông tin cho kỳ bầu cử toàn cầu năm 2026

Nguồn: OpenAI: Tin chính thức (RSS - lọc nội dung doanh nghiệp/khách hàng) · Bài gốc

OpenAI triển khai các biện pháp bảo vệ bầu cử năm 2026 thông qua việc cung cấp thông tin chính xác, hỗ trợ phòng thủ mạng và tăng cường tính minh bạch của trí tuệ nhân tạo.

Nghiên cứu / bài báo

Qwen 3.5 đạt tốc độ suy luận kỷ lục 580 tokens/giây

Nguồn: X: / Qwen (@Alibaba_Qwen) · Bài gốc

Qwen 3.5 vừa thiết lập cột mốc mới với tốc độ 580 tokens/giây nhờ tối ưu hóa trên công cụ TokenSpeed và FlashAttention-4, đánh dấu bước tiến lớn về hiệu suất cho các mô hình ngôn ngữ mã nguồn mở.

ITBench-AA: Các mô hình AI hàng đầu đều đạt dưới 50% trong bài kiểm tra tác vụ IT doanh nghiệp

Nguồn: Hugging Face: Blog · Bài gốc

Bài kiểm tra ITBench-AA cho thấy các mô hình AI tiên tiến nhất hiện nay vẫn gặp khó khăn trong việc chẩn đoán sự cố Kubernetes, với điểm số cao nhất chỉ đạt 47%. Kết quả chỉ ra rằng việc suy luận kéo dài không đồng nghĩa với độ chính xác cao hơn, đồng thời nhấn mạnh hiệu quả chi phí của các mô hình nguồn mở.

Google Research giới thiệu giải pháp phân tích dữ liệu bảo mật qua Zero Trust

Nguồn: Google Research: Blog (Web) · Bài gốc

Google Research ra mắt phương pháp phân tích dữ liệu mới kết hợp giao thức mật mã và môi trường thực thi tin cậy (TEE), đảm bảo quyền riêng tư tuyệt đối bằng cách chỉ thu thập thông tin ẩn danh từ cộng đồng dựa trên nguyên tắc Zero Trust.

Tác động của AI lập trình trong nghiên cứu khoa học xã hội

Nguồn: Anthropic: Research ( - Web) · Bài gốc

Khảo sát trên 1.260 nhà khoa học xã hội cho thấy dù AI phổ biến, chỉ 20% ứng dụng các tác nhân lập trình vào công việc. Nghiên cứu chỉ ra sự chênh lệch lớn về tỷ lệ sử dụng dựa trên giới tính và môi trường học thuật, đồng thời phản ánh thái độ thận trọng của giới chuyên môn.

Thủ thuật / thực hành

Trò chuyện cùng Phó chủ tịch Google: Kỷ nguyên tìm kiếm 'AI nguyên bản' đã bắt đầu

Nguồn: X: Kim (@kimmonismus) · Bài gốc

Bài phỏng vấn chuyên sâu về bước chuyển mình của Google Search sang mô hình AI nguyên bản, giải quyết bài toán chi phí vận hành, hạ tầng TPU và sự cân bằng giữa việc cung cấp câu trả lời trực tiếp với lợi ích của các nhà xuất bản nội dung.

Ra mắt AI Skill hỗ trợ dàn trang Tiểu Hồng Thư: Tự động chèn bản đồ và phối ảnh chuyên nghiệp

Nguồn: X: Quy Tàng (@op7418) · Bài gốc

Công cụ guizang-social-card-skill giúp các blogger du lịch tự động tạo bản đồ lộ trình và phối ảnh chất lượng cao. Điểm đặc biệt là nội dung được tạo từ HTML và ảnh thực, giúp tránh bị nền tảng gắn nhãn AI.

Sử dụng mô hình ngôn ngữ lớn để bảo mật mã nguồn hiệu quả

Nguồn: Claude: Blog (Web) · Bài gốc

Bài viết chia sẻ quy trình 6 bước sử dụng Claude Opus để xây dựng mô hình đe dọa, phát hiện và khắc phục lỗ hổng bảo mật trong mã nguồn, giúp tối ưu hóa quy trình xử lý lỗi cho lập trình viên.

Bí quyết làm chủ Coding Agent: Khởi đầu chuẩn xác là chìa khóa thành công

Nguồn: X: Baoyu (@dotey) · Bài gốc

Để tối ưu Coding Agent, hãy tập trung vào khâu lập kế hoạch ban đầu bằng cách so sánh các phương án từ nhiều mô hình mạnh, sau đó chia nhỏ dự án thành các giai đoạn cụ thể và kiểm soát chặt chẽ thay vì để AI tự sửa lỗi chồng chéo.

Anthropic và OpenAI đã tìm thấy điểm chạm thị trường nhờ các tác nhân lập trình

Nguồn: Simon Willison Blog · Bài gốc

Việc chuyển đổi sang mô hình tính phí theo API thay vì gói thuê bao cố định cho thấy các tác nhân lập trình (coding agents) đang tạo ra giá trị thực tế, buộc doanh nghiệp phải chi trả nhiều hơn cho hiệu suất thực tế.

Reachy Mini: Đột phá với khả năng tương tác giọng nói hoàn toàn ngoại tuyến

Nguồn: Hugging Face: Blog · Bài gốc

Robot Reachy Mini giờ đây có thể trò chuyện bằng giọng nói hoàn toàn cục bộ mà không cần kết nối đám mây, giúp bảo mật dữ liệu tuyệt đối và tiết kiệm chi phí API nhờ kiến trúc xử lý tại chỗ.

Sam Altman thừa nhận dự đoán sai về tác động của AI đối với nhân viên văn phòng

Nguồn: IT Home · Bài gốc

CEO OpenAI Sam Altman cho biết tác động của AI lên công việc văn phòng không nghiêm trọng như ông từng lo ngại, đồng thời bày tỏ sự nhẹ nhõm khi dự đoán trước đây của mình đã không xảy ra.

Khung bảo mật Zero Trust cho AI Agent từ Anthropic

Nguồn: Claude: Blog (Web) · Bài gốc

Anthropic giới thiệu khung bảo mật Zero Trust ba tầng nhằm đối phó với các rủi ro từ AI tự hành, giúp doanh nghiệp ngăn chặn các cuộc tấn công khai thác lỗ hổng được tăng tốc bởi AI.