Nhật báo AI ngày 29/05/2026
Anthropic vừa công bố phiên bản Claude Opus 4.8. Hiện tại, các thông số kỹ thuật chi tiết, hiệu năng và giá cả vẫn chưa được công bố chính thức.
⚡ HÔM NAY CÓ GÌ HOT? (HIGHLIGHTS)
Phát hành / cập nhật mô hình
Anthropic ra mắt mô hình Claude Opus 4.8 mới
Anthropic vừa công bố phiên bản Claude Opus 4.8. Hiện tại, các thông số kỹ thuật chi tiết, hiệu năng và giá cả vẫn chưa được công bố chính thức.
xAI ra mắt Grok Build 0.1: Mô hình chuyên biệt cho lập trình với tốc độ vượt trội
xAI vừa phát hành Grok Build 0.1 thông qua API, một mô hình tối ưu cho tác vụ lập trình, gỡ lỗi và hỗ trợ MCP với tốc độ xử lý ấn tượng trên 100 tokens/giây cùng mức giá cạnh tranh.
Google chính thức ra mắt Nano Banana Pro và Nano Banana 2
Google vừa phát hành bộ đôi mô hình Nano Banana Pro và Nano Banana 2 thông qua Gemini API, sẵn sàng cho các ứng dụng thực tế. Người dùng có thể khám phá các ví dụ từ cộng đồng để thấy rõ sức mạnh của hai mô hình này.
SenseTime nâng cấp mô hình tạo Infographic: Cải thiện độ chính xác văn bản và bố cục
SenseTime vừa cập nhật mô hình SenseNova-U1-8B-MoT-Infographic với khả năng xử lý văn bản chính xác hơn, tối ưu bố cục và hỗ trợ hiển thị nội dung học thuật chuyên sâu.
Sản phẩm / ứng dụng
Claude Code ra mắt tính năng 'Dynamic Workflows': Xử lý tác vụ phức tạp tự động
Claude Code giới thiệu tính năng 'Dynamic Workflows', cho phép AI tự động viết kịch bản và điều phối hàng trăm tác nhân con để giải quyết các tác vụ lập trình phức tạp từ đầu đến cuối.
Perplexity Computer chính thức tích hợp vào bộ ứng dụng Microsoft Office
Perplexity Computer hiện đã có mặt trên Excel, Word, PowerPoint và Outlook, cho phép người dùng soạn thảo văn bản, tạo slide và xử lý email trực tiếp từ thanh công cụ của ứng dụng.
Mistral AI ra mắt Search Toolkit: Công cụ tối ưu hóa quy trình tìm kiếm cho ứng dụng AI
Mistral AI vừa giới thiệu Search Toolkit, khung làm việc mã nguồn mở giúp hợp nhất quy trình thu thập, truy xuất và đánh giá dữ liệu, hỗ trợ doanh nghiệp xây dựng hệ thống RAG hiệu quả hơn.
Trải nghiệm lập trình AI miễn phí với MiniMax M2.7 trên OpenHands
MiniMax vừa thông báo mở quyền truy cập miễn phí có giới hạn cho mô hình M2.7 trên nền tảng OpenHands, cho phép người dùng trải nghiệm lập trình bằng AI một cách dễ dàng.
Replit Canvas: Công cụ thiết kế mới hỗ trợ bởi AI cho lập trình viên
Replit vừa ra mắt Replit Canvas, không gian làm việc chuyên dụng giúp người dùng xây dựng và tinh chỉnh website, ứng dụng hay tài liệu marketing một cách trực quan thay vì chỉ chat với AI.
Tăng tốc quy trình tích hợp với Google Pay & Wallet Developer MCP Server
Google ra mắt MCP Server cho Google Pay & Wallet, cho phép lập trình viên truy cập tài liệu, kiểm tra trạng thái tích hợp và quản lý tài khoản ngay trong môi trường IDE, giúp giảm thiểu việc chuyển đổi ngữ cảnh và tối ưu hóa hiệu suất làm việc.
Sesame: Startup AI đàm thoại của nhà sáng lập Oculus chính thức ra mắt ứng dụng iOS
Sesame vừa trình làng ứng dụng iOS, mang đến trải nghiệm AI đàm thoại tự nhiên, xóa bỏ cảm giác máy móc của các chatbot truyền thống để người dùng cảm thấy như đang trò chuyện với người thật.
MuleRun cập bến Alibaba Cloud: Giải pháp nhân sự AI hoạt động 24/7 cho doanh nghiệp
MuleRun cung cấp lực lượng lao động AI đa năng từ nghiên cứu, lập trình đến thiết kế, hỗ trợ đầy đủ các tính năng bảo mật doanh nghiệp như SSO, RBAC và quản lý tri thức tập trung.
Tín hiệu ngành
Anthropic huy động thành công 65 tỷ USD vòng Series H, định giá đạt 965 tỷ USD
Anthropic vừa gọi vốn thành công 65 tỷ USD, nâng mức định giá lên 965 tỷ USD nhờ đà tăng trưởng mạnh mẽ của dòng mô hình Claude với doanh thu hàng năm vượt 47 tỷ USD.
DeepSeek dự kiến IPO trên sàn chứng khoán Thượng Hải sau khi hoàn tất vòng gọi vốn 50 tỷ USD
Theo nguồn tin từ các quỹ đầu tư, DeepSeek đang lên kế hoạch niêm yết trên sàn STAR Market (Trung Quốc) ngay sau khi chốt vòng gọi vốn trị giá 50 tỷ USD.
Sam Altman và Dario Amodei rút lại dự báo về viễn cảnh AI gây khủng hoảng việc làm
Hai lãnh đạo hàng đầu của OpenAI và Anthropic đã thay đổi quan điểm, cho rằng AI sẽ không gây ra làn sóng thất nghiệp hàng loạt như những cảnh báo trước đây mà thay vào đó là sự chuyển dịch lao động.
Mistral AI công bố loạt đột phá tại AI Now Summit 2026: Từ giải pháp công nghiệp đến trung tâm dữ liệu mới
Mistral AI ra mắt giải pháp AI chuyên dụng cho kỹ thuật công nghiệp hợp tác cùng Airbus, BMW và ASML, đồng thời nâng cấp tác nhân AI Vibe và công bố kế hoạch xây dựng trung tâm dữ liệu 10MW vào năm 2026.
Qwen3.7-Max chính thức soán ngôi đầu bảng xếp hạng OpenRouter
Mô hình Qwen3.7-Max vừa vươn lên dẫn đầu danh sách các LLM phổ biến nhất trên OpenRouter với lưu lượng sử dụng đạt 77,3 tỷ token, khẳng định sức hút mạnh mẽ của AI từ Alibaba.
Nền tảng tổng hợp mô hình AI OpenRouter huy động thành công 113 triệu USD vòng Series B
OpenRouter vừa gọi vốn thành công 113 triệu USD từ các quỹ lớn như CapitalG, NVentures và ServiceNow Ventures để mở rộng nền tảng tổng hợp mô hình AI của mình.
Apple đàm phán đưa mô hình Gemini của Google vào iPhone để nâng cấp Siri
Apple đang tìm cách tối ưu hóa mô hình Gemini khổng lồ của Google để chạy trên iPhone, nhằm hỗ trợ các tính năng mới cho Siri thông qua sự kết hợp giữa xử lý cục bộ và điện toán đám mây.
OpenAI công bố Khung quản trị tiên phong cho các mô hình AI thế hệ mới
OpenAI vừa ra mắt 'Khung quản trị tiên phong' nhằm chuẩn hóa quy trình phát triển và triển khai AI, đảm bảo tuân thủ các quy định an toàn mới nhất từ EU và California.
Nghiên cứu / bài báo
HexoAI ra mắt khung SIA: AI tự cải tiến thông qua cập nhật trọng số mô hình
Khung SIA từ HexoAI cho phép các tác nhân AI tự tối ưu hóa trọng số mô hình dựa trên phản hồi nhiệm vụ, thay vì chỉ dựa vào prompt. Công nghệ này đã chứng minh hiệu suất vượt trội trong các bài kiểm tra về luật, tối ưu hóa GPU và xử lý dữ liệu sinh học.
SGLang hợp tác cùng AMD: Tối ưu hóa DeepSeek-R1 trên GPU MI355X với chi phí cực thấp
SGLang và AMD đã tối ưu hóa toàn diện để đưa GPU MI355X đạt hiệu suất vượt trội khi chạy DeepSeek-R1, với chi phí mỗi triệu token chỉ 0,169 USD, thấp hơn đáng kể so với các giải pháp từ NVIDIA.
Thủ thuật / thực hành
Huawei hé lộ chip Kirin mới: Bước nhảy vọt về hiệu năng nhờ định luật 'Tau' đột phá
Huawei giới thiệu định luật 'Tau' (τ) thay thế thu nhỏ hình học truyền thống, giúp tối ưu hóa hiệu năng chip. Con chip Kirin mới ra mắt mùa thu này là sản phẩm đầu tiên áp dụng triết lý này, hứa hẹn mang lại bước nhảy vọt về sức mạnh và khả năng tích hợp.
NVIDIA ra mắt khung AI Polar: Đưa hiệu suất Codex tăng vọt gần 600%
NVIDIA giới thiệu Polar, khung học tăng cường cho tác nhân AI giúp tối ưu hóa quy trình huấn luyện GRPO mà không cần thay đổi mã nguồn hiện có. Công nghệ này giúp mô hình Qwen3.5-4B tăng điểm pass@1 trên SWE-Bench lên 594% và cải thiện đáng kể hiệu suất sử dụng GPU.
Hướng dẫn xây dựng hệ thống tìm kiếm vector với pgvector: Từ ngữ nghĩa đến lai và lượng tử hóa
Hướng dẫn thực hành xây dựng môi trường vector database trên PostgreSQL bằng pgvector, tích hợp Python và SentenceTransformers để triển khai các kỹ thuật tìm kiếm vector hiện đại.
OpenRouter ra mắt tùy chọn phân cấp dịch vụ Flex và Priority cho các mô hình AI
OpenRouter vừa bổ sung tùy chọn cấp độ dịch vụ Flex và Priority cho các mô hình như OpenAI và Google Vertex, cho phép người dùng linh hoạt lựa chọn giữa chi phí và độ ưu tiên. Thông tin chi tiết về giá cước đã được cập nhật trên trang chủ của từng mô hình.
4 bước bảo mật ứng dụng được tạo bởi AI
Hướng dẫn 4 bước thiết yếu để đảm bảo an toàn cho các ứng dụng 'vibecoded' trên Replit, giúp bạn loại bỏ các lỗ hổng bảo mật tiềm ẩn khi triển khai sản phẩm.
Cộng đồng AI đã huấn luyện Gemma 'biết tư duy' như thế nào với Tunix và TPU?
Thông qua cuộc thi Tunix của Google, các nhà phát triển đã chứng minh khả năng biến mô hình nhỏ thành cỗ máy suy luận mạnh mẽ bằng cách kết hợp kỹ thuật tinh chỉnh SFT với các phương pháp căn chỉnh tiên tiến như GRPO và SimPO.
Kỷ nguyên AI Agent: Cuộc cách mạng bảo mật và thách thức quản trị danh tính
CISO của Lemonade nhận định AI Agent đang thay đổi cuộc chơi bảo mật, đòi hỏi các đội ngũ an ninh phải chuyển mình thành kỹ sư và xây dựng hệ thống quản lý danh tính mới cho hàng nghìn tác nhân AI hoạt động cùng lúc.
Cách Cloudflare xây dựng nền tảng dữ liệu Town Lake và phát triển AI Agent nội bộ
Cloudflare chia sẻ quy trình xây dựng nền tảng phân tích dữ liệu hợp nhất mang tên Town Lake, làm nền tảng cốt lõi để phát triển Skipper - trợ lý AI thông minh phục vụ vận hành nội bộ.