Nhật báo AI ngày 18/06/2026
MolmoMotion sử dụng kiến trúc Molmo để dự đoán quỹ đạo 3D của vật thể dựa trên video và chỉ dẫn văn bản. Dự án đi kèm bộ dữ liệu khổng lồ 1,16 triệu video và bộ benchmark chuyên dụng, hỗ trợ phát triển robot và AI tương tác.
⚡ HÔM NAY CÓ GÌ HOT? (HIGHLIGHTS)
Phát hành / cập nhật mô hình
MolmoMotion: Mô hình AI dự đoán chuyển động 3D thông qua ngôn ngữ
MolmoMotion sử dụng kiến trúc Molmo để dự đoán quỹ đạo 3D của vật thể dựa trên video và chỉ dẫn văn bản. Dự án đi kèm bộ dữ liệu khổng lồ 1,16 triệu video và bộ benchmark chuyên dụng, hỗ trợ phát triển robot và AI tương tác.
Grok 4.3 chính thức có mặt trên Amazon Bedrock với hiệu suất vượt trội
xAI vừa ra mắt Grok 4.3 trên Amazon Bedrock, nổi bật với khả năng giảm thiểu ảo giác, cửa sổ ngữ cảnh 1 triệu token và dẫn đầu nhiều bảng xếp hạng AI quan trọng với mức giá cực kỳ cạnh tranh.
Sản phẩm / ứng dụng
Vercel ra mắt Eve: Framework mã nguồn mở giúp xây dựng AI Agent qua cấu trúc thư mục
Vercel giới thiệu Eve, framework cho phép định nghĩa AI Agent thông qua cấu trúc thư mục thay vì code phức tạp. Hệ thống hỗ trợ sẵn các tính năng cấp doanh nghiệp như lưu vết thực thi, bảo mật MCP và tích hợp đa kênh.
Omnigent: Meta-framework mã nguồn mở giúp điều phối đội ngũ AI Agent
Omnigent là meta-framework đột phá từ đội ngũ Databricks, cho phép vận hành đồng thời nhiều AI Agent như Claude Code, Cursor và các agent tùy chỉnh trong cùng một phiên làm việc để tối ưu hóa quy trình lập trình.
Google ra mắt loa thông minh tích hợp Gemini với giá 99 USD
Google vừa giới thiệu loa thông minh Google Home Speaker tích hợp Gemini, hỗ trợ hội thoại tự nhiên và đa nhiệm với giá 99,99 USD. Các tính năng cao cấp như Gemini Live yêu cầu gói đăng ký Google Home Premium.
Wolfram Language và Mathematica 15 ra mắt: Tích hợp AI trợ lý và hệ thống âm nhạc ký hiệu
Phiên bản 15 mang đến trợ lý AI tích hợp trực tiếp trong notebook, hỗ trợ xử lý dữ liệu quy mô lớn, cải tiến Python và GPU. Bản cập nhật này đánh dấu bước tiến lớn về khả năng tính toán biểu tượng và hiệu suất làm việc cho giới nghiên cứu.
Alibaba ra mắt HappyOyster 1.0: Tạo thế giới ảo tương tác thời gian thực chỉ bằng một câu lệnh
HappyOyster 1.0 là mô hình thế giới mở đa phương thức của Alibaba, cho phép người dùng điều khiển, thay đổi cốt truyện và tương tác trực tiếp với môi trường ảo trong thời gian thực với độ nhất quán cao.
Claude Design ra mắt: Đồng bộ hóa thương hiệu và tối ưu quy trình làm việc cùng Claude Code
Claude Design cập nhật tính năng quản lý hệ thống thiết kế tập trung, cho phép đồng bộ hóa thương hiệu trên nhiều dự án và tích hợp sâu với Claude Code. Người dùng có thể dễ dàng thiết kế, quản lý quyền truy cập và xuất file chuyên nghiệp, giúp tăng hiệu suất làm việc đáng kể.
Claude kết hợp cùng Replit: Biến ý tưởng thiết kế thành ứng dụng thực tế
Giờ đây bạn có thể chuyển trực tiếp các bản thiết kế từ Claude Design sang Replit để lập trình và vận hành ứng dụng ngay lập tức, giúp rút ngắn quy trình từ ý tưởng đến sản phẩm.
Strands Robots SDK: Kết nối Hugging Face Hub với robot vật lý qua một tác nhân duy nhất
Strands Robots SDK từ AWS giúp hợp nhất quy trình từ mô phỏng MuJoCo đến điều khiển robot thực tế. Công cụ này cho phép lưu trữ dữ liệu huấn luyện lên Hugging Face và triển khai các mô hình như GR00T trên nhiều robot thông qua giao thức Zenoh.
Tín hiệu ngành
CEO Anthropic và DeepMind đề xuất G7 lập liên minh AI loại trừ Trung Quốc
Lãnh đạo Anthropic và DeepMind kêu gọi G7 thiết lập liên minh kiểm soát hạ tầng AI toàn cầu, sử dụng quyền truy cập chip và mô hình tiên tiến làm công cụ để cô lập Trung Quốc.
Rò rỉ tài chính OpenAI: Doanh thu 13 tỷ USD nhưng lỗ ròng gần 39 tỷ USD năm 2025
Tài liệu IPO rò rỉ cho thấy OpenAI đạt doanh thu 13 tỷ USD năm 2025, nhưng chịu khoản lỗ khổng lồ do chi phí vận hành và tái cấu trúc. Công ty đang cắt giảm các dự án phụ để tập trung vào lợi nhuận vào năm 2030.
OpenAI đốt 3,7 tỷ USD trong quý 1/2026, chuẩn bị cho kế hoạch IPO nghìn tỷ đô
Tài liệu nội bộ tiết lộ OpenAI tiêu tốn 3,7 tỷ USD trong quý đầu năm 2026, tương đương hơn một nửa doanh thu. Công ty đang đẩy mạnh đầu tư hạ tầng và nhân sự, đồng thời chuẩn bị cho đợt IPO dự kiến vào tháng 9 với định giá lên tới 1.000 tỷ USD.
Trung Quốc đẩy nhanh tiến độ thành lập Tổ chức Hợp tác AI Thế giới
Trung Quốc đang tích cực xúc tiến thành lập Tổ chức Hợp tác AI Thế giới với trụ sở dự kiến tại Thượng Hải, nhằm thúc đẩy quản trị AI toàn cầu, thu hẹp khoảng cách số và đảm bảo sự phát triển công nghệ vì lợi ích chung.
Google công bố chuẩn mở Agentic Resource Discovery (ARD) cho AI Agent
Google giới thiệu ARD, một chuẩn mở giúp các AI Agent tự động tìm kiếm, xác thực và kết nối với các công cụ hoặc dịch vụ trên web thông qua giao thức chuẩn hóa, tăng cường khả năng tương tác cho hệ sinh thái AI.
Databricks nới rộng khoảng cách doanh thu với Snowflake nhờ đà tăng trưởng AI mạnh mẽ
Databricks đạt doanh thu định kỳ hàng năm (ARR) 6,9 tỷ USD với tốc độ tăng trưởng 80%, bỏ xa Snowflake. Đặc biệt, các sản phẩm AI đóng góp 1,7 tỷ USD, chiếm 25% tổng doanh thu, khẳng định vị thế dẫn đầu trong cuộc đua hạ tầng dữ liệu.
Công bố các dự án thắng giải tại Hackathon Claude Opus 4.8
Anthropic vừa vinh danh 3 dự án xuất sắc nhất từ cuộc thi hackathon 12 giờ, bao gồm công cụ tái tạo kiến trúc 3D, mô phỏng xã hội dựa trên dữ liệu dân số và trình chuyển đổi ảnh chụp thành vật thể 3D thời gian thực.
Anthropic mở văn phòng tại Seoul, đẩy mạnh hợp tác sâu rộng với hệ sinh thái AI Hàn Quốc
Anthropic chính thức đặt chân đến Seoul, triển khai Claude cho hàng loạt tập đoàn lớn như Samsung, LG, Nexon và NAVER, đồng thời hỗ trợ các startup và tổ chức nghiên cứu tại Hàn Quốc tối ưu hóa quy trình làm việc bằng AI.
Nghiên cứu / bài báo
NVIDIA GEAR ra mắt ENPIRE: Hệ thống 8 AI tự chủ điều khiển robot thực hiện thí nghiệm vật lý
NVIDIA GEAR giới thiệu ENPIRE, hệ thống cho phép 8 AI Codex phối hợp điều khiển robot thực hiện các nhiệm vụ vật lý phức tạp như lắp ráp linh kiện mà không cần con người giám sát, giúp tối ưu hóa đáng kể tốc độ nghiên cứu.
Tối ưu hóa Ling-2.6-1T trên TPU với SGLang-JAX: Đột phá hiệu năng MoE nhờ Pallas kernel
SGLang-JAX tích hợp Pallas kernel mới giúp tối ưu hóa mô hình MoE Ling-2.6-1T trên TPU v7x, giảm độ trễ prefill tới 53% và vượt trội hơn cụm H200 GPU trong các bài kiểm tra thực tế.
OpenAI ra mắt LifeSciBench: Bộ tiêu chuẩn đánh giá AI chuyên sâu cho lĩnh vực khoa học sự sống
OpenAI hợp tác cùng 173 tiến sĩ ra mắt LifeSciBench, bộ tiêu chuẩn đánh giá khả năng giải quyết 750 nhiệm vụ nghiên cứu thực tế, từ phân tích dữ liệu đến tối ưu hóa thiết kế trong sinh học.
Google nâng cấp AI y tế AMIE: Từ chẩn đoán đến quản lý bệnh dài hạn
Nghiên cứu mới trên Nature cho thấy AI AMIE của Google đã vượt qua các bác sĩ sơ cấp trong việc lập kế hoạch điều trị và tuân thủ hướng dẫn lâm sàng nhờ khả năng suy luận sâu và xử lý dữ liệu dài hạn.
OpenAI hợp tác cùng Molecule.one: GPT-5.4 tối ưu hóa phản ứng hóa học Chan-Lam
OpenAI tích hợp GPT-5.4 vào hệ thống Maria của Molecule.one để tự động tối ưu hóa phản ứng Chan-Lam, giúp tăng đáng kể hiệu suất tổng hợp thuốc thông qua các đề xuất hóa chất thông minh.
Thủ thuật / thực hành
Matt Pocock ra mắt skills v1: Tối ưu hóa chi phí Token cho kỹ năng AI lên tới 63%
Tác giả Total TypeScript vừa mở mã nguồn bộ công cụ skills v1, giúp tinh gọn quy trình gọi hàm của AI bằng cách phân loại kỹ năng thông minh, từ đó giảm 63% chi phí Token và biến các câu lệnh prompt thành quy trình kỹ thuật chuyên nghiệp.
Baoyu-design cập nhật tính năng xuất video hoạt họa chất lượng cao
Công cụ baoyu-design vừa bổ sung tính năng xuất video hoạt họa dựa trên cơ chế render từng khung hình qua Chromium và ffmpeg, đảm bảo độ chính xác tuyệt đối cho các chuyển động phức tạp.
Google công bố 3 mô hình kiến trúc tích hợp A2UI và MCP Apps
Google giới thiệu ba phương thức kết hợp A2UI và MCP Apps nhằm tối ưu hóa khả năng hiển thị giao diện người dùng trên các ứng dụng AI, giúp cân bằng giữa tính nhất quán của thành phần gốc và sự linh hoạt của công nghệ Web.
Pre-training vẫn chưa đủ 'đắng': Phá vỡ giới hạn của bài học cay đắng
Bài viết thách thức quan điểm 'Bài học cay đắng' của Richard Sutton, cho rằng quy trình tiền huấn luyện hiện nay vẫn phụ thuộc quá nhiều vào sự can thiệp thủ công của con người thay vì tự tối ưu hóa vòng lặp học tập.
Tương lai của Interconnects: Nathan Lambert chia sẻ định hướng blog AI năm 2026
Sau 3 năm hoạt động, Nathan Lambert tái định vị Interconnects là tiếng nói độc lập về mô hình AI, tập trung vào hệ sinh thái mở và đánh giá minh bạch thay vì trở thành nền tảng phân tích toàn thời gian.
Trump đưa ra yêu cầu 'bất khả thi' với Anthropic: Lời cảnh báo về giới hạn của AI
Việc Trump đặt ra những yêu cầu không tưởng cho Anthropic đã làm lộ rõ điểm yếu cốt lõi trong cơ chế kiểm soát an toàn của các mô hình ngôn ngữ lớn, vốn bản chất không được thiết kế để tuân thủ các rào cản nghiêm ngặt.