Nhật báo AI ngày 26/05/2026
ModelMind phối hợp cùng Đại học Thanh Hoa giới thiệu BitCPM-CANN, mô hình ngôn ngữ lớn 1.58-bit tối ưu cho thiết bị đầu cuối, đánh dấu bước tiến quan trọng trong việc chạy AI trên nền tảng phần cứng Huawei Ascend.
⚡ HÔM NAY CÓ GÌ HOT? (HIGHLIGHTS)
Phát hành / cập nhật mô hình
ModelMind và Đại học Thanh Hoa ra mắt BitCPM-CANN: Mô hình 1.58-bit đầu tiên tại Trung Quốc chạy trên chip Huawei Ascend
ModelMind phối hợp cùng Đại học Thanh Hoa giới thiệu BitCPM-CANN, mô hình ngôn ngữ lớn 1.58-bit tối ưu cho thiết bị đầu cuối, đánh dấu bước tiến quan trọng trong việc chạy AI trên nền tảng phần cứng Huawei Ascend.
Sản phẩm / ứng dụng
xAI ra mắt Grok Build bản Beta cho người dùng SuperGrok
Grok Build hiện đã có mặt dưới dạng Beta cho người dùng SuperGrok và X Premium+. Công cụ này cho phép người dùng tạo hình ảnh, video và xây dựng các quy trình tự động hóa thông qua giao diện dòng lệnh (CLI).
Qwen3.7-Max ra mắt tính năng bộ nhớ đệm ẩn (Implicit Cache)
Qwen3.7-Max vừa cập nhật tính năng bộ nhớ đệm ẩn tự động, giúp tăng tốc độ phản hồi và tối ưu chi phí mà không cần cấu hình. Người dùng có thể tùy chọn bộ nhớ đệm tường minh nếu cần độ chính xác cao hơn.
Tín hiệu ngành
Apple được cho là đang dùng mô hình Google 1.2 nghìn tỷ tham số để nâng cấp Siri
Apple được đồn đoán đang tùy chỉnh mô hình AI 1.2 nghìn tỷ tham số của Google để làm lõi cho Siri thế hệ mới, tập trung vào việc cân bằng giữa hiệu suất xử lý cục bộ và tốc độ phản hồi.
Giáo hoàng kêu gọi giữ vững 'tính nhân bản sâu sắc' trong kỷ nguyên AI
Trong thông điệp 'Magnifica Humanitas', Giáo hoàng cảnh báo về những rủi ro từ AI đối với nhân phẩm, lao động và chiến tranh, đồng thời kêu gọi thiết lập khung pháp lý đạo đức để bảo vệ con người trước sự bùng nổ của công nghệ.
Lộ diện OpenAI GPT-5.6: Cửa sổ ngữ cảnh lên tới 1,5 triệu token, dự kiến ra mắt tháng 6
Các nhà phát triển phát hiện dấu vết của GPT-5.6 (mã iris-alpha) với khả năng xử lý 1,5 triệu token, tăng 43% so với bản tiền nhiệm. Model này hứa hẹn cải thiện đáng kể hiệu suất phản hồi và khả năng tạo giao diện người dùng.
OpenAI hợp tác chiến lược với Grupo Folha và Grupo UOL để đưa tin tức Brazil vào ChatGPT
OpenAI bắt tay với hai tập đoàn truyền thông lớn tại Brazil nhằm tích hợp nguồn tin tức uy tín vào ChatGPT, đồng thời đảm bảo tính minh bạch và quyền sở hữu nội dung cho các đơn vị báo chí.
Nghiên cứu / bài báo
Lỗ hổng bảo mật trên Microsoft Copilot: Nguy cơ rò rỉ dữ liệu từ tệp tin người dùng
Nghiên cứu mới chỉ ra rằng tính năng Copilot Cowork của Microsoft có thể vô tình làm rò rỉ dữ liệu nhạy cảm từ các tệp tin của người dùng ra bên ngoài, đặt ra thách thức lớn về bảo mật doanh nghiệp.
Huawei công bố 'Định luật Thao' và công nghệ Logic Folding: Đột phá hiệu năng chip không cần quang khắc mới
Tại ISCAS 2026, Huawei giới thiệu công nghệ Logic Folding giúp tăng mật độ bóng bán dẫn và hiệu năng chip đáng kể mà không phụ thuộc vào máy quang khắc tiên tiến. Công nghệ này sẽ được áp dụng trên dòng chip Kirin và Ascend trong tương lai.
Thủ thuật / thực hành
Đồng sáng lập Anthropic: Cần sự giám sát độc lập để định hướng AI phát triển vì lợi ích nhân loại
Tại Vatican, Chris Olah cảnh báo về áp lực thương mại và địa chính trị trong phát triển AI, đồng thời nhấn mạnh tầm quan trọng của việc giám sát từ xã hội để đảm bảo công nghệ này phục vụ sự thịnh vượng chung.
Phân biệt thuật ngữ Harness và Scaffold trong phát triển AI Agent
Bài viết làm rõ cấu trúc của một AI Agent thông qua công thức Agent = Model + Harness, giải thích cách Scaffolding định hình hành vi và Harness điều phối vòng lặp thực thi để biến mô hình ngôn ngữ thành tác nhân thông minh.