Nhật báo AI ngày 30/06/2026
Mô hình MoE 1.6 nghìn tỷ tham số Owl Alpha của Meituan đạt hiệu năng ngang ngửa Gemini/Opus, được huấn luyện hoàn toàn trên 50.000 chip ASIC nội địa và đang dẫn đầu xu hướng sử dụng trên OpenRouter.
⚡ HÔM NAY CÓ GÌ HOT? (HIGHLIGHTS)
Phát hành / cập nhật mô hình
Owl Alpha từ Meituan: Mô hình MoE 1.6 nghìn tỷ tham số gây sốt trên OpenRouter
Mô hình MoE 1.6 nghìn tỷ tham số Owl Alpha của Meituan đạt hiệu năng ngang ngửa Gemini/Opus, được huấn luyện hoàn toàn trên 50.000 chip ASIC nội địa và đang dẫn đầu xu hướng sử dụng trên OpenRouter.
Sản phẩm / ứng dụng
Cursor ra mắt phiên bản iOS: Lập trình AI mọi lúc mọi nơi
Cursor chính thức phát hành bản thử nghiệm trên iOS, cho phép lập trình viên điều khiển AI tạo mã, quản lý tác vụ và theo dõi tiến trình dự án trực tiếp từ điện thoại thông qua các tính năng thông minh.
EverOS: Runtime bộ nhớ cho AI Agent mã nguồn mở, hỗ trợ Markdown và tự tiến hóa kỹ năng
EverOS là runtime bộ nhớ mã nguồn mở sử dụng Markdown làm lõi, kết hợp SQLite và LanceDB để truy xuất dữ liệu thông minh. Hệ thống cho phép AI tự đúc kết kinh nghiệm thành kỹ năng tái sử dụng và hỗ trợ triển khai cục bộ với hiệu suất cao.
RedKnot: Công cụ suy luận từ Xiaohongshu giúp tăng tốc xử lý văn bản dài nhờ tối ưu KV Cache
RedKnot tối ưu hóa hiệu suất suy luận bằng cách phân tách KV Cache theo đầu chú ý (attention head), giúp tăng tốc TTFT lên tới 5,16 lần và cải thiện đáng kể khả năng xử lý đồng thời trên các mô hình lớn như DeepSeek-V4.
OpenClaw chính thức ra mắt ứng dụng di động cho iOS và Android
OpenClaw đã có mặt trên iOS và Android, cho phép người dùng quản lý và vận hành các tác vụ AI trực tiếp trên điện thoại mọi lúc mọi nơi.
Herdr: Trình quản lý đa nhiệm cho các AI Agent ngay trên giao diện Terminal
Herdr là công cụ cho phép người dùng quản lý và chuyển đổi linh hoạt giữa nhiều phiên làm việc của các AI Agent ngay trong một giao diện dòng lệnh duy nhất.
Anthropic ra mắt Claude Apps Gateway: Giải pháp quản lý tập trung cho doanh nghiệp
Claude Apps Gateway cho phép doanh nghiệp tự vận hành Claude Code trên Amazon Bedrock và Google Cloud với khả năng kiểm soát SSO, phân quyền và quản lý hạn mức sử dụng chặt chẽ mà không chia sẻ dữ liệu với Anthropic.
Anthropic chính thức đưa các mô hình Claude lên nền tảng Microsoft Azure Foundry
Các mô hình Claude 3.5 Opus và Haiku hiện đã có mặt trên Microsoft Azure Foundry, cho phép doanh nghiệp tận dụng hạ tầng NVIDIA GB200, bảo mật Azure và tích hợp thanh toán tập trung.
Claude Code cập nhật v2.1.196: Tối ưu hiệu suất, tăng cường bảo mật và cải thiện trải nghiệm lập trình
Bản cập nhật mới của Claude Code bổ sung hỗ trợ mô hình mặc định cho tổ chức, tối ưu hóa token cho tính năng code-review và thắt chặt bảo mật MCP, đồng thời sửa nhiều lỗi giao diện giúp trải nghiệm lập trình mượt mà hơn.
Tín hiệu ngành
Quốc vụ viện Trung Quốc ban hành quy hoạch giáo dục 5 năm, đẩy mạnh phổ cập AI toàn diện
Quy hoạch giáo dục giai đoạn 2026-2030 của Trung Quốc đặt mục tiêu tích hợp AI vào mọi cấp học, tập trung bồi dưỡng tư duy phản biện và năng lực giải quyết vấn đề cho học sinh nhằm xây dựng hệ thống giáo dục chất lượng cao.
NVIDIA hủy bỏ Rubin Ultra bản gốc, phiên bản mới bị cắt giảm một nửa hiệu năng
Chỉ 3 tháng sau khi công bố, NVIDIA đã hủy bỏ dự án Rubin Ultra 4-die do gặp khó khăn trong sản xuất. Phiên bản thay thế có kích thước và hiệu năng thực tế chỉ bằng một nửa so với thiết kế ban đầu.
AI quân sự Mỹ gây thảm kịch: Đề xuất tấn công trường học khiến 120 trẻ em thiệt mạng
Việc tích hợp Claude của Anthropic vào hệ thống Palantir khiến quân đội Mỹ nhầm lẫn mục tiêu do dữ liệu cũ kỹ, dẫn đến vụ không kích thảm khốc vào một trường học.
Samsung và SK Hynix đầu tư 590 tỷ USD mở rộng sản xuất chip, giá bộ nhớ dự báo tăng vọt do AI
Với sự hỗ trợ từ chính phủ Hàn Quốc, Samsung và SK Hynix sẽ đầu tư 590 tỷ USD xây dựng nhà máy và trung tâm đóng gói chip mới nhằm đáp ứng nhu cầu AI. Các chuyên gia dự báo giá bộ nhớ sẽ tăng mạnh liên tục đến năm 2028 do nguồn cung mới hạn chế.
Chủ tịch SK Group: Đầu tư 1.000 nghìn tỷ Won xây dựng trung tâm dữ liệu AI 15GW đến năm 2035
Chủ tịch SK Group công bố kế hoạch đầu tư 1.000 nghìn tỷ Won để xây dựng hạ tầng trung tâm dữ liệu AI công suất 15GW, nhằm chuyển đổi Hàn Quốc thành quốc gia dịch vụ thông minh.
Nghiên cứu / bài báo
Meta ra mắt Brain2Qwerty v2: Giải mã tín hiệu não thành văn bản theo thời gian thực
Meta giới thiệu Brain2Qwerty v2, bước tiến đột phá cho phép giải mã trực tiếp tín hiệu não bộ thành từ ngữ và ý nghĩa theo thời gian thực, mở ra hy vọng phục hồi khả năng giao tiếp cho người bị tổn thương não.
Cảnh báo: Claude Code tự động thực thi mã độc ẩn trong GitHub, chiếm quyền điều khiển máy tính
Các nhà nghiên cứu phát hiện lỗ hổng khiến AI như Claude Code tự động chạy tập lệnh độc hại ẩn trong GitHub. Mã độc này không nằm trong kho lưu trữ mà được tải từ DNS, cho phép kẻ tấn công đánh cắp khóa API và chiếm quyền kiểm soát hệ thống của lập trình viên.
Báo cáo OpenAI: Bản đồ chuyển dịch việc làm do AI tại châu Âu
OpenAI công bố báo cáo phân tích tác động của AI đối với thị trường lao động EU, xác định các nhóm ngành nghề chịu ảnh hưởng bởi tự động hóa, tiềm năng tăng trưởng và thay đổi quy trình làm việc.
DiScoFormer: Mô hình Transformer đơn nhất ước tính mật độ và điểm số phân phối dữ liệu
DiScoFormer là mô hình Transformer đột phá có khả năng ước tính đồng thời mật độ và điểm số phân phối mà không cần huấn luyện lại, vượt xa hiệu suất của phương pháp KDE truyền thống trong không gian nhiều chiều.
Thủ thuật / thực hành
Kỹ sư Anthropic chia sẻ: Kỹ thuật Prompt thực chiến - Đánh giá là chìa khóa duy nhất
Kỹ sư Margot Van Laar từ Anthropic nhấn mạnh việc tối ưu hóa prompt thực tế tập trung vào bảo trì và tinh chỉnh thay vì viết mới, đồng thời khẳng định đánh giá (Eval) là phương pháp duy nhất để đảm bảo tính chính xác cho các hệ thống AI.
Qwen 3.6 27B: Lựa chọn lý tưởng cho mô hình AI chạy cục bộ
Qwen 3.6 27B là mô hình ngôn ngữ lớn mạnh mẽ với ngữ cảnh 256k, đạt tốc độ ấn tượng trên cả MacBook M5 và RTX 5090. Đây được đánh giá là mô hình chạy offline đầu tiên sở hữu trí tuệ tổng quát thực thụ.
Chia sẻ 2 Prompt 'Vibe Coding' cực chất: Tư duy nguyên bản và Kiểm thử đối kháng
Tác giả giới thiệu hai Prompt giúp tối ưu hóa Vibe Coding: 'Tư duy nguyên bản' để AI giải quyết vấn đề từ gốc rễ và 'Kiểm thử đối kháng' để phát hiện các lỗi logic ẩn sâu, giúp dự án AIHOT xử lý hơn 10 triệu yêu cầu mỗi tuần.
Anthropic: Khi chi phí vận hành AI vượt xa lương kỹ sư
Chi phí tính toán của Anthropic lên tới 515.000 USD/kỹ sư mỗi năm, gấp 2,3 lần mức lương trung bình. Con số này cao gấp nhiều lần so với các công ty phần mềm hàng đầu, đặt ra bài toán lớn về hiệu quả kinh tế trong kỷ nguyên AI.