Nhật báo AI ngày 02/06/2026
MiniMax M3 là mô hình mã nguồn mở mới với kiến trúc MSA giúp tối ưu chi phí và tăng tốc độ xử lý vượt trội. Với khả năng xử lý 1 triệu token, mô hình đạt hiệu suất lập trình ấn tượng, vượt qua nhiều đối thủ sừng sỏ trên bảng xếp hạng SWE-Bench Pro.
⚡ HÔM NAY CÓ GÌ HOT? (HIGHLIGHTS)
Phát hành / cập nhật mô hình
MiniMax M3: Mô hình đa phương thức đột phá với ngữ cảnh 1 triệu token
MiniMax M3 là mô hình mã nguồn mở mới với kiến trúc MSA giúp tối ưu chi phí và tăng tốc độ xử lý vượt trội. Với khả năng xử lý 1 triệu token, mô hình đạt hiệu suất lập trình ấn tượng, vượt qua nhiều đối thủ sừng sỏ trên bảng xếp hạng SWE-Bench Pro.
xAI ra mắt Composer 2.5: Mô hình lập trình mạnh mẽ cho người dùng Grok
xAI vừa phát hành Composer 2.5 trên nền tảng Grok, tối ưu hóa cho các tác vụ lập trình phức tạp và xử lý lệnh dài hạn, dành riêng cho người dùng SuperGrok và X Premium+.
Qwen3.7-Plus: Bước tiến mới về trí tuệ đa phương thức
Qwen3.7-Plus mang đến khả năng xử lý toàn diện từ chatbot, hiểu hình ảnh/video, tạo nội dung đến tích hợp công cụ và tìm kiếm web, tối ưu hóa hiệu suất cho các tác nhân AI thông minh.
NVIDIA Cosmos 3: Bước tiến mới trong phát triển mô hình AI vật lý, thế giới và hành động
NVIDIA Cosmos 3 là mô hình nền tảng tiên phong giúp robot và xe tự lái hiểu thế giới thực, dự đoán sự kiện và tạo ra các hành động thích ứng với môi trường cụ thể.
SenseNova ra mắt mô hình AI chuyên biệt, giải quyết triệt để lỗi sai khi tạo biểu đồ
Mô hình SenseNova-U1-8B-MoT-Infographic khắc phục các lỗi phổ biến như sai lệch số liệu hay bố cục khi tạo biểu đồ, cho phép người dùng tùy chỉnh thiết kế và bố cục theo thời gian thực.
JetBrains ra mắt Mellum2: Mô hình Mixture-of-Experts 12B hiệu năng cao
JetBrains giới thiệu Mellum2, mô hình ngôn ngữ 12B kiến trúc Mixture-of-Experts (MoE) được tối ưu hóa cho các tác vụ lập trình và xử lý ngôn ngữ, hứa hẹn hiệu suất vượt trội trong các ứng dụng thực tế.
NVIDIA sắp sửa trình làng mô hình Nemotron-3 Ultra trong tuần này
NVIDIA vừa xác nhận sẽ chính thức ra mắt mô hình ngôn ngữ lớn Nemotron-3 Ultra trong tuần này, hứa hẹn mang đến những cải tiến đáng kể về hiệu suất cho cộng đồng AI.
Sản phẩm / ứng dụng
OpenBMB ra mắt bộ dữ liệu UltraData: Cột mốc mới cho AI mã nguồn mở
OpenBMB công bố hai bộ dữ liệu UltraData quy mô lớn, bao gồm 600B tokens dữ liệu tổng hợp và 15 triệu mẫu SFT, hỗ trợ đắc lực cho việc huấn luyện mô hình ngôn ngữ lớn với khả năng tư duy chuyên sâu.
OpenRouter cập nhật Auto Router: Cho phép tùy chỉnh cân bằng giữa chi phí và chất lượng
OpenRouter vừa bổ sung tham số 'cost_quality_tradeoff' (0-10), cho phép người dùng linh hoạt lựa chọn giữa mô hình mạnh nhất hoặc mô hình tiết kiệm nhất tùy theo nhu cầu thực tế.
OpenAI chính thức đưa các mô hình tiên tiến và Codex lên nền tảng AWS
Khách hàng doanh nghiệp hiện có thể truy cập trực tiếp các mô hình AI của OpenAI thông qua hạ tầng AWS, giúp đơn giản hóa quy trình từ thử nghiệm đến triển khai thực tế.
Replit ra mắt tính năng xây dựng doanh nghiệp trọn gói chỉ với một câu lệnh
Replit cho phép người dùng tạo website, ứng dụng di động và video giới thiệu chỉ từ một câu lệnh duy nhất, đồng thời tích hợp sẵn các công cụ vận hành doanh nghiệp như Stripe, Mercury và Doola.
Tencent Hunyuan ra mắt Hy-Memory: Plugin bộ nhớ dài hạn cho AI Agent
Tencent giới thiệu Hy-Memory, plugin giúp AI Agent tối ưu hóa khả năng ghi nhớ dài hạn với cấu trúc 6 tầng, giúp giảm 70% lượng dữ liệu lưu trữ và tiết kiệm 35% chi phí token trong các tác vụ ngữ cảnh dài.
NVIDIA ra mắt giải pháp FOX: Bước tiến mới trong quản lý nhà máy tự hành bằng AI
NVIDIA giới thiệu bản thiết kế FOX giúp xây dựng các tác nhân AI tự hành để tối ưu hóa vận hành nhà máy. Giải pháp này giúp các doanh nghiệp như Foxconn giảm 80% thời gian phân tích lỗi và tăng đáng kể năng suất lao động.
ChatGPT cập nhật chế độ toàn màn hình: Viết bài dài dễ dàng hơn
ChatGPT vừa bổ sung chế độ toàn màn hình, cho phép người dùng soạn thảo các văn bản dài và lưu lại vào thư viện để tiếp tục chỉnh sửa sau này.
Perplexity ra mắt 'Search as Code': Kiến trúc tìm kiếm mới tối ưu cho AI Agent
Perplexity giới thiệu kiến trúc tìm kiếm mới cho phép AI Agent tự viết mã Python để truy vấn dữ liệu thay vì gọi hàm tuần tự, giúp tăng hiệu suất và độ chính xác. Tính năng này hiện đã có sẵn trên Perplexity Agent API.
Tín hiệu ngành
Anthropic nộp hồ sơ IPO bí mật lên SEC, chuẩn bị lên sàn chứng khoán
Anthropic vừa nộp dự thảo hồ sơ S-1 lên SEC để chuẩn bị cho đợt phát hành cổ phiếu lần đầu ra công chúng (IPO). Động thái này diễn ra ngay sau khi công ty huy động thành công 65 tỷ USD ở vòng gọi vốn H, nâng mức định giá lên 965 tỷ USD.
Zhipu AI lên kế hoạch IPO trên sàn chứng khoán Thượng Hải
Zhipu AI dự kiến phát hành cổ phiếu lần đầu ra công chúng (IPO) trên sàn STAR Market để huy động vốn phát triển mô hình ngôn ngữ lớn và nền tảng MaaS, đồng thời đổi tên thương hiệu thành Z.AI.
Alphabet huy động 80 tỷ USD qua phát hành cổ phiếu để chạy đua AI
Alphabet đang huy động 80 tỷ USD thông qua phát hành cổ phiếu, bao gồm thỏa thuận với Berkshire Hathaway, nhằm rót vốn mạnh mẽ cho các kế hoạch phát triển AI đầy tham vọng.
Florida kiện OpenAI và Sam Altman liên quan đến các vụ án mạng có dính líu tới ChatGPT
Tiểu bang Florida đã đệ đơn kiện OpenAI và CEO Sam Altman, cáo buộc họ thờ ơ với tính mạng con người sau khi ChatGPT bị cho là có liên quan đến nhiều vụ án mạng nghiêm trọng.
Meituan hợp tác cùng Tencent Yuanbao: Tích hợp AI Agent 'Xiao Mei' vào hệ sinh thái dịch vụ
CEO Vương Hưng công bố kế hoạch đưa AI Agent 'Xiao Mei' của Meituan kết nối trực tiếp với Tencent Yuanbao, cho phép người dùng đặt đồ ăn và dịch vụ ngay trong giao diện chatbot.
NVIDIA và TSMC bắt tay đưa AI vào nhà máy sản xuất chip, thúc đẩy đột phá trong thiết kế và chế tạo
NVIDIA và TSMC đang tích hợp sâu trí tuệ nhân tạo vào quy trình sản xuất bán dẫn, giúp tối ưu hóa thiết kế và tăng tốc độ chế tạo chip thế hệ mới.
OpenAI khởi công xây dựng trung tâm dữ liệu Stargate 1GW tại Michigan
OpenAI chính thức triển khai dự án trung tâm dữ liệu Stargate với công suất 1GW tại Michigan, nhằm mở rộng hạ tầng AI, thúc đẩy kinh tế địa phương và tạo việc làm.
Chatbot AI của Meta bị lợi dụng để chiếm đoạt tài khoản Instagram
Các hacker đã khai thác lỗ hổng trong chatbot hỗ trợ của Meta để thay đổi email và chiếm quyền kiểm soát tài khoản Instagram người dùng. Meta hiện đã khắc phục sự cố này.
Thủ thuật / thực hành
Tổng hợp các dự án mã nguồn mở thú vị được phát triển bằng Codex App
Tác giả chia sẻ bộ sưu tập 13 dự án thực tế bao gồm tiện ích Chrome, website và các kỹ năng AI, ứng dụng công nghệ từ GPT-Image-2, Suno và nhiều công cụ hỗ trợ khác.
Hướng dẫn biến sách thành kỹ năng AI chuyên sâu với Claude Opus 4.8
Bài viết hướng dẫn quy trình 6 bước sử dụng Claude Opus 4.8 để chuyển hóa nội dung sách thành các kỹ năng AI có thể áp dụng thực tế, giúp tối ưu hóa việc học tập và ứng dụng kiến thức với chi phí thấp.
Sam Altman: Phát triển AI phải lấy con người làm trung tâm
Sam Altman khẳng định AI cần phục vụ nhu cầu con người thay vì thay thế họ. Ông cho rằng ngành công nghiệp AI đang thất bại trong việc giải thích cách con người duy trì quyền kiểm soát và tìm thấy ý nghĩa cuộc sống trong kỷ nguyên mới.
Hướng dẫn: Xây dựng AI Agent với ngân sách 1000 USD/tuần kèm cơ chế kiểm soát an toàn
Video hướng dẫn cách thiết lập giới hạn ngân sách, danh sách chặn mô hình và quản lý dữ liệu tùy chỉnh cho AI Agent thông qua kiến trúc bảo mật phân tầng của OpenRouter.
Tạo bản sao kỹ thuật số của chính bạn với Gemini Omni: Hướng dẫn chi tiết
Khám phá cách sử dụng Gemini Omni để tạo ra một phiên bản kỹ thuật số có ngoại hình và giọng nói giống hệt bạn, giúp tối ưu hóa việc sáng tạo nội dung video.
Tự động hóa quản lý tài liệu: Cách Antigravity dùng AI phân loại hàng trăm tệp tin marketing
Khám phá cách các tác nhân AI song song của Antigravity tự động phân loại và đổi tên hàng trăm tài sản marketing, giúp loại bỏ hoàn toàn quy trình quản lý tệp thủ công.
Mô hình nguồn mở và nguồn đóng: Hai quỹ đạo tăng trưởng khác biệt
Khi những cải tiến nhỏ về trí tuệ AI tạo ra giá trị thực tế, các mô hình nguồn đóng tập trung vào việc tối ưu hóa hiệu suất chuyên sâu, trong khi nguồn mở lại tìm kiếm tăng trưởng ở các khía cạnh khác, tạo nên một cục diện cạnh tranh phân hóa.
Microsoft Research: Đánh giá hành vi AI Agent và tầm quan trọng của mã nguồn so với tài liệu
Microsoft đề xuất phương pháp đánh giá quy mô lớn cho AI Agent, khẳng định mã nguồn hiệu quả hơn tài liệu trong việc hiểu hành vi, đồng thời kêu gọi cộng đồng cùng giải quyết bài toán căn chỉnh giá trị.