04/07 03/07 02/07 01/07 30/06 29/06 28/06 27/06 26/06 25/06

Nhật báo AI ngày 29/05/2026

Anthropic vừa công bố phiên bản Claude Opus 4.8. Hiện tại, các thông số kỹ thuật chi tiết, hiệu năng và giá cả vẫn chưa được công bố chính thức.

⚡ HÔM NAY CÓ GÌ HOT? (HIGHLIGHTS)

1. Phát hành / cập nhật mô hình (4 tin)

Anthropic ra mắt mô hình Claude Opus 4.8 mới

2. Sản phẩm / ứng dụng (8 tin)

Claude Code ra mắt tính năng 'Dynamic Workflows': Xử lý tác vụ phức tạp tự động

3. Tín hiệu ngành (8 tin)

Anthropic huy động thành công 65 tỷ USD vòng Series H, định giá đạt 965 tỷ USD

4. Nghiên cứu / bài báo (2 tin)

HexoAI ra mắt khung SIA: AI tự cải tiến thông qua cập nhật trọng số mô hình

5. Thủ thuật / thực hành (8 tin)

Huawei hé lộ chip Kirin mới: Bước nhảy vọt về hiệu năng nhờ định luật 'Tau' đột phá

Phát hành / cập nhật mô hình

Anthropic ra mắt mô hình Claude Opus 4.8 mới

Nguồn: Anthropic: Newsroom (Web) · Bài gốc

Anthropic vừa công bố phiên bản Claude Opus 4.8. Hiện tại, các thông số kỹ thuật chi tiết, hiệu năng và giá cả vẫn chưa được công bố chính thức.

xAI ra mắt Grok Build 0.1: Mô hình chuyên biệt cho lập trình với tốc độ vượt trội

Nguồn: xAI: News (Web) · Bài gốc

xAI vừa phát hành Grok Build 0.1 thông qua API, một mô hình tối ưu cho tác vụ lập trình, gỡ lỗi và hỗ trợ MCP với tốc độ xử lý ấn tượng trên 100 tokens/giây cùng mức giá cạnh tranh.

Google chính thức ra mắt Nano Banana Pro và Nano Banana 2

Nguồn: X: Google AI for Developers (@googleaidevs) · Bài gốc

Google vừa phát hành bộ đôi mô hình Nano Banana Pro và Nano Banana 2 thông qua Gemini API, sẵn sàng cho các ứng dụng thực tế. Người dùng có thể khám phá các ví dụ từ cộng đồng để thấy rõ sức mạnh của hai mô hình này.

SenseTime nâng cấp mô hình tạo Infographic: Cải thiện độ chính xác văn bản và bố cục

Nguồn: X: SenseTime SenseTime (@SenseTime_AI) · Bài gốc

SenseTime vừa cập nhật mô hình SenseNova-U1-8B-MoT-Infographic với khả năng xử lý văn bản chính xác hơn, tối ưu bố cục và hỗ trợ hiển thị nội dung học thuật chuyên sâu.

Sản phẩm / ứng dụng

Claude Code ra mắt tính năng 'Dynamic Workflows': Xử lý tác vụ phức tạp tự động

Nguồn: Claude: Blog (Web) · Bài gốc

Claude Code giới thiệu tính năng 'Dynamic Workflows', cho phép AI tự động viết kịch bản và điều phối hàng trăm tác nhân con để giải quyết các tác vụ lập trình phức tạp từ đầu đến cuối.

Perplexity Computer chính thức tích hợp vào bộ ứng dụng Microsoft Office

Nguồn: X: Perplexity (@perplexity_ai) · Bài gốc

Perplexity Computer hiện đã có mặt trên Excel, Word, PowerPoint và Outlook, cho phép người dùng soạn thảo văn bản, tạo slide và xử lý email trực tiếp từ thanh công cụ của ứng dụng.

Mistral AI ra mắt Search Toolkit: Công cụ tối ưu hóa quy trình tìm kiếm cho ứng dụng AI

Nguồn: Mistral AI: News (Web) · Bài gốc

Mistral AI vừa giới thiệu Search Toolkit, khung làm việc mã nguồn mở giúp hợp nhất quy trình thu thập, truy xuất và đánh giá dữ liệu, hỗ trợ doanh nghiệp xây dựng hệ thống RAG hiệu quả hơn.

Trải nghiệm lập trình AI miễn phí với MiniMax M2.7 trên OpenHands

Nguồn: X: MiniMax (@MiniMax_AI) · Bài gốc

MiniMax vừa thông báo mở quyền truy cập miễn phí có giới hạn cho mô hình M2.7 trên nền tảng OpenHands, cho phép người dùng trải nghiệm lập trình bằng AI một cách dễ dàng.

Replit Canvas: Công cụ thiết kế mới hỗ trợ bởi AI cho lập trình viên

Nguồn: X: Replit (@Replit) · Bài gốc

Replit vừa ra mắt Replit Canvas, không gian làm việc chuyên dụng giúp người dùng xây dựng và tinh chỉnh website, ứng dụng hay tài liệu marketing một cách trực quan thay vì chỉ chat với AI.

Tăng tốc quy trình tích hợp với Google Pay & Wallet Developer MCP Server

Nguồn: Google Developers Blog · Bài gốc

Google ra mắt MCP Server cho Google Pay & Wallet, cho phép lập trình viên truy cập tài liệu, kiểm tra trạng thái tích hợp và quản lý tài khoản ngay trong môi trường IDE, giúp giảm thiểu việc chuyển đổi ngữ cảnh và tối ưu hóa hiệu suất làm việc.

Sesame: Startup AI đàm thoại của nhà sáng lập Oculus chính thức ra mắt ứng dụng iOS

Nguồn: TechCrunch: AI · Bài gốc

Sesame vừa trình làng ứng dụng iOS, mang đến trải nghiệm AI đàm thoại tự nhiên, xóa bỏ cảm giác máy móc của các chatbot truyền thống để người dùng cảm thấy như đang trò chuyện với người thật.

MuleRun cập bến Alibaba Cloud: Giải pháp nhân sự AI hoạt động 24/7 cho doanh nghiệp

Nguồn: X: Alibaba Cloud / Alibaba Cloud (@alibaba_cloud) · Bài gốc

MuleRun cung cấp lực lượng lao động AI đa năng từ nghiên cứu, lập trình đến thiết kế, hỗ trợ đầy đủ các tính năng bảo mật doanh nghiệp như SSO, RBAC và quản lý tri thức tập trung.

Tín hiệu ngành

Anthropic huy động thành công 65 tỷ USD vòng Series H, định giá đạt 965 tỷ USD

Nguồn: Anthropic: Newsroom (Web) · Bài gốc

Anthropic vừa gọi vốn thành công 65 tỷ USD, nâng mức định giá lên 965 tỷ USD nhờ đà tăng trưởng mạnh mẽ của dòng mô hình Claude với doanh thu hàng năm vượt 47 tỷ USD.

DeepSeek dự kiến IPO trên sàn chứng khoán Thượng Hải sau khi hoàn tất vòng gọi vốn 50 tỷ USD

Nguồn: X: X.PIN (@thexpin) · Bài gốc

Theo nguồn tin từ các quỹ đầu tư, DeepSeek đang lên kế hoạch niêm yết trên sàn STAR Market (Trung Quốc) ngay sau khi chốt vòng gọi vốn trị giá 50 tỷ USD.

Sam Altman và Dario Amodei rút lại dự báo về viễn cảnh AI gây khủng hoảng việc làm

Nguồn: Hacker News Nổi bật (buzzing.cc bản dịch tiếng Trung) · Bài gốc

Hai lãnh đạo hàng đầu của OpenAI và Anthropic đã thay đổi quan điểm, cho rằng AI sẽ không gây ra làn sóng thất nghiệp hàng loạt như những cảnh báo trước đây mà thay vào đó là sự chuyển dịch lao động.

Mistral AI công bố loạt đột phá tại AI Now Summit 2026: Từ giải pháp công nghiệp đến trung tâm dữ liệu mới

Nguồn: Mistral AI: News (Web) · Bài gốc

Mistral AI ra mắt giải pháp AI chuyên dụng cho kỹ thuật công nghiệp hợp tác cùng Airbus, BMW và ASML, đồng thời nâng cấp tác nhân AI Vibe và công bố kế hoạch xây dựng trung tâm dữ liệu 10MW vào năm 2026.

Qwen3.7-Max chính thức soán ngôi đầu bảng xếp hạng OpenRouter

Nguồn: X: Alibaba Cloud / Alibaba Cloud (@alibaba_cloud) · Bài gốc

Mô hình Qwen3.7-Max vừa vươn lên dẫn đầu danh sách các LLM phổ biến nhất trên OpenRouter với lưu lượng sử dụng đạt 77,3 tỷ token, khẳng định sức hút mạnh mẽ của AI từ Alibaba.

Nền tảng tổng hợp mô hình AI OpenRouter huy động thành công 113 triệu USD vòng Series B

Nguồn: OpenRouter: Announcements · Bài gốc

OpenRouter vừa gọi vốn thành công 113 triệu USD từ các quỹ lớn như CapitalG, NVentures và ServiceNow Ventures để mở rộng nền tảng tổng hợp mô hình AI của mình.

Apple đàm phán đưa mô hình Gemini của Google vào iPhone để nâng cấp Siri

Nguồn: Ars Technica: AI · Bài gốc

Apple đang tìm cách tối ưu hóa mô hình Gemini khổng lồ của Google để chạy trên iPhone, nhằm hỗ trợ các tính năng mới cho Siri thông qua sự kết hợp giữa xử lý cục bộ và điện toán đám mây.

OpenAI công bố Khung quản trị tiên phong cho các mô hình AI thế hệ mới

Nguồn: OpenAI: Tin chính thức (RSS - lọc nội dung doanh nghiệp/khách hàng) · Bài gốc

OpenAI vừa ra mắt 'Khung quản trị tiên phong' nhằm chuẩn hóa quy trình phát triển và triển khai AI, đảm bảo tuân thủ các quy định an toàn mới nhất từ EU và California.

Nghiên cứu / bài báo

HexoAI ra mắt khung SIA: AI tự cải tiến thông qua cập nhật trọng số mô hình

Nguồn: X: Rohan Paul (@rohanpaul_ai) · Bài gốc

Khung SIA từ HexoAI cho phép các tác nhân AI tự tối ưu hóa trọng số mô hình dựa trên phản hồi nhiệm vụ, thay vì chỉ dựa vào prompt. Công nghệ này đã chứng minh hiệu suất vượt trội trong các bài kiểm tra về luật, tối ưu hóa GPU và xử lý dữ liệu sinh học.

SGLang hợp tác cùng AMD: Tối ưu hóa DeepSeek-R1 trên GPU MI355X với chi phí cực thấp

Nguồn: LMSYS: Blog (Chatbot Arena ) · Bài gốc

SGLang và AMD đã tối ưu hóa toàn diện để đưa GPU MI355X đạt hiệu suất vượt trội khi chạy DeepSeek-R1, với chi phí mỗi triệu token chỉ 0,169 USD, thấp hơn đáng kể so với các giải pháp từ NVIDIA.

Thủ thuật / thực hành

Huawei hé lộ chip Kirin mới: Bước nhảy vọt về hiệu năng nhờ định luật 'Tau' đột phá

Nguồn: IT Home · Bài gốc

Huawei giới thiệu định luật 'Tau' (τ) thay thế thu nhỏ hình học truyền thống, giúp tối ưu hóa hiệu năng chip. Con chip Kirin mới ra mắt mùa thu này là sản phẩm đầu tiên áp dụng triết lý này, hứa hẹn mang lại bước nhảy vọt về sức mạnh và khả năng tích hợp.

NVIDIA ra mắt khung AI Polar: Đưa hiệu suất Codex tăng vọt gần 600%

Nguồn: IT Home · Bài gốc

NVIDIA giới thiệu Polar, khung học tăng cường cho tác nhân AI giúp tối ưu hóa quy trình huấn luyện GRPO mà không cần thay đổi mã nguồn hiện có. Công nghệ này giúp mô hình Qwen3.5-4B tăng điểm pass@1 trên SWE-Bench lên 594% và cải thiện đáng kể hiệu suất sử dụng GPU.

Hướng dẫn xây dựng hệ thống tìm kiếm vector với pgvector: Từ ngữ nghĩa đến lai và lượng tử hóa

Nguồn: MarkTechPost · Bài gốc

Hướng dẫn thực hành xây dựng môi trường vector database trên PostgreSQL bằng pgvector, tích hợp Python và SentenceTransformers để triển khai các kỹ thuật tìm kiếm vector hiện đại.

OpenRouter ra mắt tùy chọn phân cấp dịch vụ Flex và Priority cho các mô hình AI

Nguồn: X: OpenRouter (@OpenRouter) · Bài gốc

OpenRouter vừa bổ sung tùy chọn cấp độ dịch vụ Flex và Priority cho các mô hình như OpenAI và Google Vertex, cho phép người dùng linh hoạt lựa chọn giữa chi phí và độ ưu tiên. Thông tin chi tiết về giá cước đã được cập nhật trên trang chủ của từng mô hình.

Nhật báo AI ngày 29/05/2026

⚡ HÔM NAY CÓ GÌ HOT? (HIGHLIGHTS)

Phát hành / cập nhật mô hình

Anthropic ra mắt mô hình Claude Opus 4.8 mới

xAI ra mắt Grok Build 0.1: Mô hình chuyên biệt cho lập trình với tốc độ vượt trội

Google chính thức ra mắt Nano Banana Pro và Nano Banana 2

SenseTime nâng cấp mô hình tạo Infographic: Cải thiện độ chính xác văn bản và bố cục

Sản phẩm / ứng dụng

Claude Code ra mắt tính năng 'Dynamic Workflows': Xử lý tác vụ phức tạp tự động

Perplexity Computer chính thức tích hợp vào bộ ứng dụng Microsoft Office

Mistral AI ra mắt Search Toolkit: Công cụ tối ưu hóa quy trình tìm kiếm cho ứng dụng AI

Trải nghiệm lập trình AI miễn phí với MiniMax M2.7 trên OpenHands

Replit Canvas: Công cụ thiết kế mới hỗ trợ bởi AI cho lập trình viên

Tăng tốc quy trình tích hợp với Google Pay & Wallet Developer MCP Server

Sesame: Startup AI đàm thoại của nhà sáng lập Oculus chính thức ra mắt ứng dụng iOS

MuleRun cập bến Alibaba Cloud: Giải pháp nhân sự AI hoạt động 24/7 cho doanh nghiệp

Tín hiệu ngành

Anthropic huy động thành công 65 tỷ USD vòng Series H, định giá đạt 965 tỷ USD

DeepSeek dự kiến IPO trên sàn chứng khoán Thượng Hải sau khi hoàn tất vòng gọi vốn 50 tỷ USD

Sam Altman và Dario Amodei rút lại dự báo về viễn cảnh AI gây khủng hoảng việc làm

Mistral AI công bố loạt đột phá tại AI Now Summit 2026: Từ giải pháp công nghiệp đến trung tâm dữ liệu mới

Qwen3.7-Max chính thức soán ngôi đầu bảng xếp hạng OpenRouter

Nền tảng tổng hợp mô hình AI OpenRouter huy động thành công 113 triệu USD vòng Series B

Apple đàm phán đưa mô hình Gemini của Google vào iPhone để nâng cấp Siri

OpenAI công bố Khung quản trị tiên phong cho các mô hình AI thế hệ mới

Nghiên cứu / bài báo

HexoAI ra mắt khung SIA: AI tự cải tiến thông qua cập nhật trọng số mô hình

SGLang hợp tác cùng AMD: Tối ưu hóa DeepSeek-R1 trên GPU MI355X với chi phí cực thấp

Thủ thuật / thực hành

Huawei hé lộ chip Kirin mới: Bước nhảy vọt về hiệu năng nhờ định luật 'Tau' đột phá

NVIDIA ra mắt khung AI Polar: Đưa hiệu suất Codex tăng vọt gần 600%

Hướng dẫn xây dựng hệ thống tìm kiếm vector với pgvector: Từ ngữ nghĩa đến lai và lượng tử hóa

OpenRouter ra mắt tùy chọn phân cấp dịch vụ Flex và Priority cho các mô hình AI

4 bước bảo mật ứng dụng được tạo bởi AI

Cộng đồng AI đã huấn luyện Gemma 'biết tư duy' như thế nào với Tunix và TPU?

Kỷ nguyên AI Agent: Cuộc cách mạng bảo mật và thách thức quản trị danh tính

Cách Cloudflare xây dựng nền tảng dữ liệu Town Lake và phát triển AI Agent nội bộ