Nhật báo AI ngày 02/06/2026

MiniMax M3 là mô hình mã nguồn mở mới với kiến trúc MSA giúp tối ưu chi phí và tăng tốc độ xử lý vượt trội. Với khả năng xử lý 1 triệu token, mô hình đạt hiệu suất lập trình ấn tượng, vượt qua nhiều đối thủ sừng sỏ trên bảng xếp hạng SWE-Bench Pro.

⚡ HÔM NAY CÓ GÌ HOT? (HIGHLIGHTS)

1. Phát hành / cập nhật mô hình (7 tin)

MiniMax M3: Mô hình đa phương thức đột phá với ngữ cảnh 1 triệu token

2. Sản phẩm / ứng dụng (8 tin)

OpenBMB ra mắt bộ dữ liệu UltraData: Cột mốc mới cho AI mã nguồn mở

3. Tín hiệu ngành (8 tin)

Anthropic nộp hồ sơ IPO bí mật lên SEC, chuẩn bị lên sàn chứng khoán

4. Thủ thuật / thực hành (8 tin)

Tổng hợp các dự án mã nguồn mở thú vị được phát triển bằng Codex App

Phát hành / cập nhật mô hình

MiniMax M3: Mô hình đa phương thức đột phá với ngữ cảnh 1 triệu token

Nguồn: MiniMax: Blog (Web) · Bài gốc

xAI ra mắt Composer 2.5: Mô hình lập trình mạnh mẽ cho người dùng Grok

Nguồn: xAI: News (Web) · Bài gốc

xAI vừa phát hành Composer 2.5 trên nền tảng Grok, tối ưu hóa cho các tác vụ lập trình phức tạp và xử lý lệnh dài hạn, dành riêng cho người dùng SuperGrok và X Premium+.

Qwen3.7-Plus: Bước tiến mới về trí tuệ đa phương thức

Nguồn: Qwen: Blog Retrieval (API) · Bài gốc

Qwen3.7-Plus mang đến khả năng xử lý toàn diện từ chatbot, hiểu hình ảnh/video, tạo nội dung đến tích hợp công cụ và tìm kiếm web, tối ưu hóa hiệu suất cho các tác nhân AI thông minh.

NVIDIA Cosmos 3: Bước tiến mới trong phát triển mô hình AI vật lý, thế giới và hành động

Nguồn: NVIDIA Technical Blog (Blog - RSS) · Bài gốc

NVIDIA Cosmos 3 là mô hình nền tảng tiên phong giúp robot và xe tự lái hiểu thế giới thực, dự đoán sự kiện và tạo ra các hành động thích ứng với môi trường cụ thể.

SenseNova ra mắt mô hình AI chuyên biệt, giải quyết triệt để lỗi sai khi tạo biểu đồ

Nguồn: X: SenseTime SenseTime (@SenseTime_AI) · Bài gốc

Mô hình SenseNova-U1-8B-MoT-Infographic khắc phục các lỗi phổ biến như sai lệch số liệu hay bố cục khi tạo biểu đồ, cho phép người dùng tùy chỉnh thiết kế và bố cục theo thời gian thực.

JetBrains ra mắt Mellum2: Mô hình Mixture-of-Experts 12B hiệu năng cao

Nguồn: Hugging Face: Blog · Bài gốc

JetBrains giới thiệu Mellum2, mô hình ngôn ngữ 12B kiến trúc Mixture-of-Experts (MoE) được tối ưu hóa cho các tác vụ lập trình và xử lý ngôn ngữ, hứa hẹn hiệu suất vượt trội trong các ứng dụng thực tế.

NVIDIA sắp sửa trình làng mô hình Nemotron-3 Ultra trong tuần này

Nguồn: X: NVIDIA AI (@NVIDIAAI) · Bài gốc

NVIDIA vừa xác nhận sẽ chính thức ra mắt mô hình ngôn ngữ lớn Nemotron-3 Ultra trong tuần này, hứa hẹn mang đến những cải tiến đáng kể về hiệu suất cho cộng đồng AI.

Sản phẩm / ứng dụng

OpenBMB ra mắt bộ dữ liệu UltraData: Cột mốc mới cho AI mã nguồn mở

Nguồn: X: OpenBMB (@OpenBMB) · Bài gốc

OpenBMB công bố hai bộ dữ liệu UltraData quy mô lớn, bao gồm 600B tokens dữ liệu tổng hợp và 15 triệu mẫu SFT, hỗ trợ đắc lực cho việc huấn luyện mô hình ngôn ngữ lớn với khả năng tư duy chuyên sâu.

OpenRouter cập nhật Auto Router: Cho phép tùy chỉnh cân bằng giữa chi phí và chất lượng

Nguồn: X: OpenRouter (@OpenRouter) · Bài gốc

OpenRouter vừa bổ sung tham số 'cost_quality_tradeoff' (0-10), cho phép người dùng linh hoạt lựa chọn giữa mô hình mạnh nhất hoặc mô hình tiết kiệm nhất tùy theo nhu cầu thực tế.

OpenAI chính thức đưa các mô hình tiên tiến và Codex lên nền tảng AWS

Nguồn: OpenAI: Tin chính thức (RSS - lọc nội dung doanh nghiệp/khách hàng) · Bài gốc

Khách hàng doanh nghiệp hiện có thể truy cập trực tiếp các mô hình AI của OpenAI thông qua hạ tầng AWS, giúp đơn giản hóa quy trình từ thử nghiệm đến triển khai thực tế.

Replit ra mắt tính năng xây dựng doanh nghiệp trọn gói chỉ với một câu lệnh

Nguồn: X: Replit (@Replit) · Bài gốc

Replit cho phép người dùng tạo website, ứng dụng di động và video giới thiệu chỉ từ một câu lệnh duy nhất, đồng thời tích hợp sẵn các công cụ vận hành doanh nghiệp như Stripe, Mercury và Doola.

Tencent Hunyuan ra mắt Hy-Memory: Plugin bộ nhớ dài hạn cho AI Agent

Nguồn: X: Tencent Hunyuan (@TencentHunyuan) · Bài gốc

Tencent giới thiệu Hy-Memory, plugin giúp AI Agent tối ưu hóa khả năng ghi nhớ dài hạn với cấu trúc 6 tầng, giúp giảm 70% lượng dữ liệu lưu trữ và tiết kiệm 35% chi phí token trong các tác vụ ngữ cảnh dài.

NVIDIA ra mắt giải pháp FOX: Bước tiến mới trong quản lý nhà máy tự hành bằng AI

Nguồn: NVIDIA Blog: Agentic AI (Web) · Bài gốc

NVIDIA giới thiệu bản thiết kế FOX giúp xây dựng các tác nhân AI tự hành để tối ưu hóa vận hành nhà máy. Giải pháp này giúp các doanh nghiệp như Foxconn giảm 80% thời gian phân tích lỗi và tăng đáng kể năng suất lao động.

ChatGPT cập nhật chế độ toàn màn hình: Viết bài dài dễ dàng hơn

Nguồn: X: ChatGPT (@ChatGPTapp) · Bài gốc

ChatGPT vừa bổ sung chế độ toàn màn hình, cho phép người dùng soạn thảo các văn bản dài và lưu lại vào thư viện để tiếp tục chỉnh sửa sau này.

Perplexity ra mắt 'Search as Code': Kiến trúc tìm kiếm mới tối ưu cho AI Agent

Nguồn: X: Perplexity (@perplexity_ai) · Bài gốc

Perplexity giới thiệu kiến trúc tìm kiếm mới cho phép AI Agent tự viết mã Python để truy vấn dữ liệu thay vì gọi hàm tuần tự, giúp tăng hiệu suất và độ chính xác. Tính năng này hiện đã có sẵn trên Perplexity Agent API.

Tín hiệu ngành

Anthropic nộp hồ sơ IPO bí mật lên SEC, chuẩn bị lên sàn chứng khoán

Nguồn: Anthropic: Newsroom (Web) · Bài gốc

Anthropic vừa nộp dự thảo hồ sơ S-1 lên SEC để chuẩn bị cho đợt phát hành cổ phiếu lần đầu ra công chúng (IPO). Động thái này diễn ra ngay sau khi công ty huy động thành công 65 tỷ USD ở vòng gọi vốn H, nâng mức định giá lên 965 tỷ USD.

Zhipu AI lên kế hoạch IPO trên sàn chứng khoán Thượng Hải

Nguồn: IT Home · Bài gốc

Zhipu AI dự kiến phát hành cổ phiếu lần đầu ra công chúng (IPO) trên sàn STAR Market để huy động vốn phát triển mô hình ngôn ngữ lớn và nền tảng MaaS, đồng thời đổi tên thương hiệu thành Z.AI.

Alphabet huy động 80 tỷ USD qua phát hành cổ phiếu để chạy đua AI

Nguồn: Bloomberg: Technology · Bài gốc

Alphabet đang huy động 80 tỷ USD thông qua phát hành cổ phiếu, bao gồm thỏa thuận với Berkshire Hathaway, nhằm rót vốn mạnh mẽ cho các kế hoạch phát triển AI đầy tham vọng.

Florida kiện OpenAI và Sam Altman liên quan đến các vụ án mạng có dính líu tới ChatGPT

Nguồn: Ars Technica: AI · Bài gốc

Tiểu bang Florida đã đệ đơn kiện OpenAI và CEO Sam Altman, cáo buộc họ thờ ơ với tính mạng con người sau khi ChatGPT bị cho là có liên quan đến nhiều vụ án mạng nghiêm trọng.

Meituan hợp tác cùng Tencent Yuanbao: Tích hợp AI Agent 'Xiao Mei' vào hệ sinh thái dịch vụ

Nguồn: IT Home · Bài gốc

CEO Vương Hưng công bố kế hoạch đưa AI Agent 'Xiao Mei' của Meituan kết nối trực tiếp với Tencent Yuanbao, cho phép người dùng đặt đồ ăn và dịch vụ ngay trong giao diện chatbot.

NVIDIA và TSMC bắt tay đưa AI vào nhà máy sản xuất chip, thúc đẩy đột phá trong thiết kế và chế tạo

Nguồn: IT Home · Bài gốc

NVIDIA và TSMC đang tích hợp sâu trí tuệ nhân tạo vào quy trình sản xuất bán dẫn, giúp tối ưu hóa thiết kế và tăng tốc độ chế tạo chip thế hệ mới.

OpenAI khởi công xây dựng trung tâm dữ liệu Stargate 1GW tại Michigan

Nguồn: OpenAI: Tin chính thức (RSS - lọc nội dung doanh nghiệp/khách hàng) · Bài gốc

OpenAI chính thức triển khai dự án trung tâm dữ liệu Stargate với công suất 1GW tại Michigan, nhằm mở rộng hạ tầng AI, thúc đẩy kinh tế địa phương và tạo việc làm.

Chatbot AI của Meta bị lợi dụng để chiếm đoạt tài khoản Instagram

Nguồn: The Verge: · Bài gốc

Các hacker đã khai thác lỗ hổng trong chatbot hỗ trợ của Meta để thay đổi email và chiếm quyền kiểm soát tài khoản Instagram người dùng. Meta hiện đã khắc phục sự cố này.

Nhật báo AI ngày 02/06/2026

⚡ HÔM NAY CÓ GÌ HOT? (HIGHLIGHTS)

Phát hành / cập nhật mô hình

MiniMax M3: Mô hình đa phương thức đột phá với ngữ cảnh 1 triệu token

xAI ra mắt Composer 2.5: Mô hình lập trình mạnh mẽ cho người dùng Grok

Qwen3.7-Plus: Bước tiến mới về trí tuệ đa phương thức

NVIDIA Cosmos 3: Bước tiến mới trong phát triển mô hình AI vật lý, thế giới và hành động

SenseNova ra mắt mô hình AI chuyên biệt, giải quyết triệt để lỗi sai khi tạo biểu đồ

JetBrains ra mắt Mellum2: Mô hình Mixture-of-Experts 12B hiệu năng cao

NVIDIA sắp sửa trình làng mô hình Nemotron-3 Ultra trong tuần này

Sản phẩm / ứng dụng

OpenBMB ra mắt bộ dữ liệu UltraData: Cột mốc mới cho AI mã nguồn mở

OpenRouter cập nhật Auto Router: Cho phép tùy chỉnh cân bằng giữa chi phí và chất lượng

OpenAI chính thức đưa các mô hình tiên tiến và Codex lên nền tảng AWS

Replit ra mắt tính năng xây dựng doanh nghiệp trọn gói chỉ với một câu lệnh

Tencent Hunyuan ra mắt Hy-Memory: Plugin bộ nhớ dài hạn cho AI Agent

NVIDIA ra mắt giải pháp FOX: Bước tiến mới trong quản lý nhà máy tự hành bằng AI

ChatGPT cập nhật chế độ toàn màn hình: Viết bài dài dễ dàng hơn

Perplexity ra mắt 'Search as Code': Kiến trúc tìm kiếm mới tối ưu cho AI Agent

Tín hiệu ngành

Anthropic nộp hồ sơ IPO bí mật lên SEC, chuẩn bị lên sàn chứng khoán

Zhipu AI lên kế hoạch IPO trên sàn chứng khoán Thượng Hải

Alphabet huy động 80 tỷ USD qua phát hành cổ phiếu để chạy đua AI

Florida kiện OpenAI và Sam Altman liên quan đến các vụ án mạng có dính líu tới ChatGPT

Meituan hợp tác cùng Tencent Yuanbao: Tích hợp AI Agent 'Xiao Mei' vào hệ sinh thái dịch vụ

NVIDIA và TSMC bắt tay đưa AI vào nhà máy sản xuất chip, thúc đẩy đột phá trong thiết kế và chế tạo

OpenAI khởi công xây dựng trung tâm dữ liệu Stargate 1GW tại Michigan

Chatbot AI của Meta bị lợi dụng để chiếm đoạt tài khoản Instagram

Thủ thuật / thực hành

Tổng hợp các dự án mã nguồn mở thú vị được phát triển bằng Codex App

Hướng dẫn biến sách thành kỹ năng AI chuyên sâu với Claude Opus 4.8

Sam Altman: Phát triển AI phải lấy con người làm trung tâm

Hướng dẫn: Xây dựng AI Agent với ngân sách 1000 USD/tuần kèm cơ chế kiểm soát an toàn

Tạo bản sao kỹ thuật số của chính bạn với Gemini Omni: Hướng dẫn chi tiết

Tự động hóa quản lý tài liệu: Cách Antigravity dùng AI phân loại hàng trăm tệp tin marketing

Mô hình nguồn mở và nguồn đóng: Hai quỹ đạo tăng trưởng khác biệt

Microsoft Research: Đánh giá hành vi AI Agent và tầm quan trọng của mã nguồn so với tài liệu