Nhật báo AI ngày 10/05/2026
Baidu vừa phát hành ERNIE 5.1 với khả năng tìm kiếm, suy luận và viết sáng tạo vượt trội, đồng thời tối ưu hóa chi phí huấn luyện xuống mức cực thấp.
⚡ HÔM NAY CÓ GÌ HOT? (HIGHLIGHTS)
Phát hành / cập nhật mô hình
Ra mắt ERNIE 5.1 với chi phí huấn luyện chỉ bằng 6% so với các mô hình đối thủ
Baidu vừa phát hành ERNIE 5.1 với khả năng tìm kiếm, suy luận và viết sáng tạo vượt trội, đồng thời tối ưu hóa chi phí huấn luyện xuống mức cực thấp.
HappyHorse ra mắt trên Alibaba Cloud, tạo video AI không cần chờ đợi
HappyHorse đã có mặt trên Alibaba Cloud Model Studio, mang lại tốc độ tạo video siêu nhanh với khả năng đồng bộ âm thanh và hình ảnh gốc.
StepAudio 2.5 TTS lọt top 3 thế giới trong bảng xếp hạng giọng nói
Mô hình StepAudio 2.5 của StepFun đạt vị trí thứ 3 toàn cầu trên bảng xếp hạng Artificial Analysis nhờ độ tự nhiên cao và khả năng kiểm soát cảm xúc linh hoạt.
Sản phẩm / ứng dụng
Google ra mắt Health API hoàn toàn mới cho Fitbit Air
Google vừa phát hành Health API mới cho Fitbit Air, cung cấp 31 loại dữ liệu sức khỏe như vận động, giấc ngủ, nhịp tim và nồng độ oxy trong máu. API này hỗ trợ Webhooks thời gian thực, cho phép các nhà phát triển xây dựng AI Agent, MCP Server hoặc hệ thống giám sát sức khỏe cá nhân hóa.
Pareto Code: Công cụ định tuyến lập trình thử nghiệm miễn phí
OpenRouter giới thiệu Pareto Code, công cụ cho phép định tuyến yêu cầu đến các mô hình lập trình có chi phí thấp nhất dựa trên tiêu chuẩn 'min_coding_score'. Bảng xếp hạng được cung cấp bởi Artificial Analysis, giúp người dùng tối ưu hóa hiệu suất và chi phí lập trình.
Peekaboo 3.0 ra mắt: Tập trung vào thao tác và phát hiện giao diện
Peekaboo 3.0 mang đến trải nghiệm sử dụng macOS ưu tiên thao tác, tích hợp tính năng chụp màn hình và phát hiện giao diện thống nhất. Phiên bản này cải thiện tương tác JSON giữa CLI và MCP, đồng thời nâng cấp tính năng chụp ảnh nhanh.
Dòng mô hình Qwen đa kích thước cập bến nền tảng SiliconFlow
SiliconFlow đã bổ sung các dòng mô hình Qwen 3.5 và Qwen 3.6 lên nền tảng, bao gồm các phiên bản từ 9B đến 397B với kiến trúc MoE và Dense. Người dùng hiện có thể lựa chọn đa dạng các mô hình Qwen để phục vụ nhu cầu phát triển ứng dụng.
Claude Code phiên bản v2.1.137
Bản cập nhật v2.1.137 tập trung sửa lỗi khiến tiện ích mở rộng Visual Studio Code không thể kích hoạt trên hệ điều hành Windows, giúp cải thiện tính tương thích và ổn định.
Claude Code phiên bản v2.1.138
Phiên bản v2.1.138 thực hiện một loạt các sửa lỗi nội bộ nhằm tối ưu hóa hiệu suất hệ thống và hoàn thiện mã nguồn nền tảng.
Tín hiệu ngành
Đánh giá Claude Mythos cho thấy khoảng thời gian rủi ro 16 giờ
Các đánh giá sớm về Claude Mythos Preview cho thấy khoảng thời gian rủi ro 50% là ít nhất 16 giờ, mức cao nhất mà các chuyên gia có thể đo lường được mà không cần các bài kiểm tra mới.
DeepSeek huy động kỷ lục 7 tỷ USD, nhà sáng lập đóng góp cá nhân 3 tỷ USD
DeepSeek đang huy động 7 tỷ USD với mức định giá 50 tỷ USD. Nhà sáng lập Liang Wenfeng đóng góp 40% số vốn này và vẫn giữ 90% quyền sở hữu công ty để tập trung vào tài nguyên tính toán và phát triển mô hình V4.1.
Bộ Công nghiệp và Công nghệ thông tin Trung Quốc khởi động chương trình thí điểm đánh giá đạo đức AI
Chương trình này nhằm thiết lập các tiêu chuẩn đạo đức, hướng dẫn các đơn vị đổi mới xây dựng ủy ban đạo đức và xây dựng mạng lưới giám sát rủi ro để thúc đẩy sự phát triển AI có trách nhiệm.
Hermes Agent đứng đầu bảng xếp hạng token toàn cầu trên OpenRouter
Nous Research thông báo Hermes Agent đã vươn lên vị trí số 1 về lưu lượng sử dụng token trên nền tảng OpenRouter, đánh dấu cột mốc quan trọng cho sự phát triển của dự án.
Hy3 Preview kết thúc giai đoạn miễn phí, dẫn đầu ba chỉ số quan trọng
Sau hai tuần miễn phí, Hy3 Preview của Tencent Hunyuan đã đạt vị trí số 1 về tổng lượng token, tạo mã và gọi công cụ, chiếm 15,4% thị phần trên OpenRouter.
Nghiên cứu / bài báo
Người đoạt giải Fields cho biết ChatGPT 5.5 Pro thực hiện nghiên cứu toán học cấp tiến sĩ trong hai giờ
Timothy Gowers xác nhận ChatGPT 5.5 Pro đã giải quyết thành công một vấn đề mở trong lý thuyết số với ý tưởng hoàn toàn mới, đặt ra thách thức về vai trò của AI trong nghiên cứu toán học tương lai.
Dạy Claude cách 'Tại sao'
Anthropic công bố nghiên cứu mới giúp Claude học cách giải thích lý do đằng sau các suy luận của mình, từ đó cải thiện đáng kể độ chính xác và tính minh bạch trong logic phản hồi.
OncoAgent: Khung đa tác nhân hai tầng hỗ trợ quyết định lâm sàng ung thư bảo mật
Hệ thống mã nguồn mở này sử dụng quy trình RAG bốn giai đoạn và các mô hình chuyên biệt để hỗ trợ bác sĩ, đảm bảo quyền riêng tư dữ liệu bệnh nhân thông qua triển khai cục bộ hoàn toàn.
Thủ thuật / thực hành
Người sáng lập Redis dùng công cụ C để 'nhét' mô hình lớn vào máy tính cá nhân
Antirez đã phát triển công cụ suy luận ds4, cho phép chạy mô hình DeepSeek V4 Flash với cửa sổ ngữ cảnh 1M trên MacBook Pro nhờ kỹ thuật lượng tử hóa 2-bit và tối ưu hóa Metal.
AI khuếch đại sự khác biệt về năng lực chủ động, gây ra sự phân cực người dùng
AI đang làm trầm trọng thêm khoảng cách: người dùng có tính chủ động thấp sẽ càng phụ thuộc, trong khi người dùng có tính chủ động cao lại càng trở nên mạnh mẽ hơn.
CEO của Y Combinator mở mã nguồn hệ điều hành AI cá nhân GBrain
Garry Tan giới thiệu GBrain, một hệ thống giúp xây dựng 'bộ não thứ hai' bằng cách kết hợp các mô-đun AI để xử lý kiến thức và quản lý công việc một cách hiệu quả.
GPT Image 2 Prompt: Công cụ tạo ảnh bìa tin tức công nghệ
Khung gợi ý (prompt) này giúp AI thiết kế ảnh bìa chuyên nghiệp, bắt mắt cho các bài viết công nghệ, tối ưu hóa bố cục và hình ảnh để thu hút người xem trong 3 giây đầu tiên.
Giải pháp tích hợp điều khiển giọng nói CRM bằng GPT-Realtime-2
Bài viết giới thiệu cách tích hợp GPT-Realtime-2 để bổ sung tính năng điều khiển bằng giọng nói vào quy trình làm việc của CRM.
Sử dụng Codex để gỡ lỗi song song và xác thực bản sửa lỗi
Tác giả sử dụng Codex để tái tạo trạng thái chính xác trong môi trường crabbox nhằm xác thực và sửa lỗi song song, giúp tăng tốc độ và tránh làm ô nhiễm hệ thống cục bộ.
Công nghệ quét 3D bằng điện thoại và AI Agent đang thay đổi ngành bất động sản
Công nghệ 3D Gaussian Splatting cho phép tạo mô hình 3D từ điện thoại với chi phí thấp, đồng thời các AI Agent chuyên biệt đang mở ra hướng đi mới cho các lĩnh vực đòi hỏi quy tắc khắt khe như luật pháp và y học.
Chia sẻ kinh nghiệm cài đặt và sử dụng tiện ích mở rộng Codex trên Chrome
Hướng dẫn cài đặt Codex trên Chrome, lưu ý về việc cập nhật phiên bản mới nhất, sử dụng tài khoản đăng ký chính thức và cách kích hoạt bằng lệnh @Chrome.