Nhật báo AI ngày 02/07/2026
Meituan chính thức phát hành mã nguồn mở LongCat-2.0, mô hình 1,6 nghìn tỷ tham số với khả năng xử lý ngữ cảnh 1 triệu token, được huấn luyện hoàn toàn trên cụm chip nội địa Trung Quốc với hiệu suất ấn tượng trong các bài kiểm tra lập trình.
⚡ HÔM NAY CÓ GÌ HOT? (HIGHLIGHTS)
Phát hành / cập nhật mô hình
Meituan ra mắt LongCat-2.0: Mô hình ngôn ngữ 1,6 nghìn tỷ tham số huấn luyện trên hạ tầng nội địa
Meituan chính thức phát hành mã nguồn mở LongCat-2.0, mô hình 1,6 nghìn tỷ tham số với khả năng xử lý ngữ cảnh 1 triệu token, được huấn luyện hoàn toàn trên cụm chip nội địa Trung Quốc với hiệu suất ấn tượng trong các bài kiểm tra lập trình.
NVIDIA ra mắt Nemotron-Labs-TwoTower: Mô hình ngôn ngữ khuếch tán kiến trúc hai tháp
NVIDIA giới thiệu Nemotron-Labs-TwoTower, mô hình ngôn ngữ khuếch tán sử dụng kiến trúc hai tháp giúp tăng tốc độ tạo văn bản lên gấp 2,42 lần mà vẫn giữ được 98,7% chất lượng so với mô hình tự hồi quy truyền thống.
Sản phẩm / ứng dụng
xAI ra mắt Voice Agent Builder: Tạo trợ lý giọng nói chuyên nghiệp chỉ trong 2 phút
xAI giới thiệu nền tảng không mã (no-code) cho phép tạo trợ lý giọng nói tích hợp Grok, hỗ trợ kết nối SIP và API với hiệu suất vượt trội so với GPT và Gemini trên các bài kiểm tra thực tế.
Google ra mắt tiện ích Workbench Notebooks: Kết nối môi trường Jupyter trên Cloud ngay trong VS Code
Tiện ích mới cho phép lập trình viên kết nối trực tiếp với môi trường Jupyter trên Google Cloud ngay trong VS Code, giúp tối ưu quy trình làm việc với hạ tầng AI mạnh mẽ mà không cần chuyển đổi ứng dụng.
Zhipu ra mắt ZCode: Môi trường phát triển chính thức cho GLM-5.2
ZCode là môi trường phát triển chuyên dụng cho GLM-5.2, hỗ trợ đa nền tảng (macOS, Windows, Linux) với ưu đãi 1,5 lần hạn mức cho người dùng gói GLM Coding Plan và tính năng BYOK linh hoạt.
Claude Code v2.1.198: Ra mắt tính năng Claude trên Chrome và nâng cấp mạnh mẽ cho AI Agent
Bản cập nhật mới mang đến Claude trên Chrome, bổ sung tính năng tự động hóa PR cho Agent, công cụ thiết kế biểu đồ /dataviz và cải thiện độ ổn định khi xử lý tác vụ nền.
Cloudflare ra mắt tính năng quản lý lưu lượng AI: Phân loại bot thông minh và bảo vệ doanh thu quảng cáo
Cloudflare cung cấp công cụ kiểm soát lưu lượng AI chi tiết, cho phép chủ sở hữu website phân biệt giữa bot tìm kiếm, bot AI và bot huấn luyện, đồng thời bảo vệ các trang quảng cáo khỏi bị khai thác dữ liệu.
Xây dựng ứng dụng AI Agent toàn diện với Genkit
Google ra mắt Agents API trong framework Genkit, giúp đơn giản hóa việc phát triển AI hội thoại thông qua giao diện thống nhất, hỗ trợ quản lý trạng thái và phối hợp đa tác nhân.
Cloudflare ra mắt Monetization Gateway: Kiếm tiền từ mọi tài nguyên qua giao thức x402
Cloudflare mở danh sách chờ cho Monetization Gateway, cho phép thu phí truy cập web, API hoặc công cụ MCP bằng stablecoin thông qua giao thức x402 mà không cần xây dựng hệ thống thanh toán riêng.
Tại sao Google quyết định xây dựng ADK 2.0?
Google chia sẻ lý do ra mắt ADK 2.0, nhấn mạnh vào các tính năng cốt lõi, cải tiến quan trọng và lý do tại sao các nhà phát triển nên sớm chuyển đổi sang phiên bản mới này.
Tín hiệu ngành
Cộng đồng mạng phẫn nộ: Anthropic bị tố cài cắm mã ẩn danh để nhận diện người dùng Trung Quốc trong Claude Code
Anthropic bị phát hiện cài đặt cơ chế ẩn danh trong Claude Code để nhận diện người dùng tại Trung Quốc thông qua múi giờ và danh sách tên miền. Hành vi thay đổi ký tự trong prompt để gửi dữ liệu về máy chủ đã gây ra làn sóng tranh cãi lớn về quyền riêng tư và sự tin tưởng của người dùng.
Meta học theo SpaceX, biến hạ tầng AI dư thừa thành cỗ máy in tiền
Meta chuẩn bị ra mắt dịch vụ Meta Compute để cho thuê hạ tầng tính toán và quyền truy cập mô hình AI, trực tiếp cạnh tranh với các ông lớn như AWS và Google Cloud.
OpenAI hé lộ 3 biến thể GPT-5.6 Pro: Chiến lược mới thay thế mô hình đơn lẻ
Nghiên cứu mới từ OpenAI giới thiệu ba phiên bản Luna, Terra và Sol Pro cho GPT-5.6, trong đó Sol Pro dẫn đầu về hiệu suất trong lĩnh vực di truyền học. Dù các bản Pro cải thiện độ chính xác đáng kể, mức độ nâng cấp lại giảm dần khi mô hình càng mạnh.
AWS đầu tư 1 tỷ USD, cử kỹ sư trực tiếp hỗ trợ doanh nghiệp triển khai AI
AWS thành lập bộ phận mới với ngân sách 1 tỷ USD, cử các đội kỹ sư chuyên trách đến làm việc trực tiếp tại doanh nghiệp khách hàng trong 45 ngày để đẩy nhanh tiến độ ứng dụng AI và các tác nhân thông minh.
Runway bắt tay cùng tập đoàn truyền thông Bertelsmann thúc đẩy sáng tạo nội dung
Runway vừa công bố quan hệ đối tác chiến lược với tập đoàn truyền thông Bertelsmann nhằm ứng dụng công nghệ AI vào lĩnh vực sáng tạo nội dung, dù các chi tiết cụ thể vẫn chưa được tiết lộ.
Tổng hợp các cập nhật AI quan trọng từ Google tháng 6/2026
Google vừa công bố loạt cải tiến AI mới, nổi bật là tính năng dịch thuật giọng nói thời gian thực Gemini 3.5 Live Translate.
Google tổ chức hội nghị thượng đỉnh về AI trong giáo dục tại New York
Google cùng các nhà lãnh đạo giáo dục thảo luận về việc ứng dụng AI như NotebookLM vào lớp học, nhấn mạnh tầm quan trọng của kỹ năng con người và sự hợp tác chặt chẽ giữa công nghệ với nhà trường.
Thủ thuật / thực hành
Hướng dẫn viết AI Skill ổn định và dễ dự đoán từ Matt Pocock
Matt Pocock chia sẻ kinh nghiệm tối ưu hóa AI Skill thông qua cấu trúc phân tầng, cách đặt mô tả thông minh và kỹ thuật kiểm soát sự tập trung của mô hình để giảm thiểu lỗi vận hành.
Chiến lược lưu trữ AI quy mô lớn của Meta: Tối ưu hóa hạ tầng cho kỷ nguyên GPU
Meta tái cấu trúc hệ thống lưu trữ BLOB dựa trên Tectonic để giảm độ trễ I/O, giúp tối đa hóa hiệu suất GPU và tăng tốc độ huấn luyện mô hình AI quy mô lớn.
Chiến lược tối ưu chi phí AI: Ưu tiên thiết kế hệ thống định tuyến (Router) thay vì chọn mô hình
Thay vì tập trung vào chọn mô hình, việc thiết kế hệ thống định tuyến thông minh giúp chuyển 70-80% lưu lượng sang các mô hình cục bộ miễn phí, từ đó cắt giảm hơn 90% chi phí vận hành AI.
Công bố kết quả cuộc thi viết về các vấn đề trọng yếu của AI từ Dwarkesh Patel
Cuộc thi của Dwarkesh Patel vinh danh 3 ý tưởng xuất sắc: ứng dụng AI để xóa sổ bệnh truyền nhiễm, chiến lược tăng trưởng cho các quốc gia ngoài chuỗi cung ứng AI và mô hình kinh doanh mới cho các phòng thí nghiệm AI.
Một năm 'Ngày độc lập nội dung': Định hình mô hình kinh doanh cho Internet của các AI Agent
Sau một năm, thị trường nội dung trả phí đã hình thành khi các AI Agent thay đổi cách tìm kiếm truyền thống. Việc xây dựng nền kinh tế mạng bền vững đòi hỏi một hạ tầng mới để hỗ trợ xu hướng này.