Nhật báo AI ngày 01/05/2026
Đội ngũ AntLingAGI đã phát hành mô hình Ling-2.6-1T với kiến trúc hỗn hợp chuyên gia (MoE), sở hữu 1 nghìn tỷ tham số, tập trung tối ưu hóa hiệu suất token để đáp ứng các nhu cầu sản xuất thực tế.
⚡ HÔM NAY CÓ GÌ HOT? (HIGHLIGHTS)
Phát hành / cập nhật mô hình
AntLingAGI ra mắt mã nguồn mở mô hình Ling-2.6-1T trên Hugging Face
Đội ngũ AntLingAGI đã phát hành mô hình Ling-2.6-1T với kiến trúc hỗn hợp chuyên gia (MoE), sở hữu 1 nghìn tỷ tham số, tập trung tối ưu hóa hiệu suất token để đáp ứng các nhu cầu sản xuất thực tế.
DeepSeek công bố báo cáo kỹ thuật về mô hình đa phương thức
DeepSeek giới thiệu khung tư duy dựa trên các nguyên tố thị giác, giúp mô hình giải quyết vấn đề tham chiếu không gian và đạt hiệu suất cạnh tranh với các mô hình hàng đầu dù có kích thước nhỏ gọn.
Grok-4.3 ra mắt trên OpenRouter với hiệu năng vượt trội
Mô hình Grok-4.3 của xAI đã có mặt trên OpenRouter với mức giá thấp hơn nhưng đạt điểm ELO ấn tượng 1500 trên bảng xếp hạng GDPval-AA, vượt qua nhiều đối thủ cạnh tranh.
Qwen3.6-Plus chính thức có mặt trên nền tảng Together AI
Alibaba Cloud thông báo mô hình Qwen3.6-Plus hiện đã sẵn sàng để người dùng trải nghiệm trên nền tảng Together AI.
Baidu ra mắt ERNIE 5.1 Preview với kiến trúc tinh gọn và hiệu suất mạnh mẽ
ERNIE 5.1 Preview sở hữu kiến trúc nhẹ hơn đáng kể so với thế hệ trước nhưng vẫn đạt thứ hạng cao trên bảng xếp hạng Text Arena, đặc biệt dẫn đầu trong lĩnh vực pháp luật và chính phủ.
Sản phẩm / ứng dụng
Replit kỷ niệm 10 năm, mở miễn phí tính năng Agent
Nhân dịp kỷ niệm 10 năm thành lập, Replit cung cấp miễn phí tính năng Agent và tổ chức cuộc thi lập trình phối hợp cùng Anthropic.
Codex đơn giản hóa quy trình làm việc hàng ngày
Việc xử lý công việc hàng ngày trở nên dễ dàng hơn bao giờ hết với Codex. Chỉ cần chọn vai trò, kết nối các ứng dụng quen thuộc và sử dụng gợi ý để Codex hỗ trợ bạn từ lập kế hoạch nghiên cứu, soạn thảo tài liệu, làm slide cho đến bảng tính.
Alibaba Cloud ra mắt HappyHorse, tạo video AI trong vài giây
Alibaba Cloud giới thiệu mô hình tạo video AI mới HappyHorse với khả năng tạo video 1080p chất lượng điện ảnh, đồng bộ âm thanh và khẩu hình chính xác, đồng thời duy trì tính nhất quán của nhân vật qua nhiều cảnh quay.
AI Agents hiện có thể tạo tài khoản Cloudflare, mua tên miền và triển khai dự án
Cloudflare thông báo các AI agent giờ đây có thể tự vận hành như một khách hàng độc lập, từ việc tạo tài khoản, đăng ký tên miền đến triển khai mã nguồn mà không cần sự can thiệp thủ công của con người.
Nâng cấp chất lượng hình ảnh V8.1 và mở rộng kênh phát hành
Midjourney vừa tung bản cập nhật V8.1 giúp cải thiện độ sắc nét và chất lượng hình ảnh, đồng thời chính thức phát hành trên cả website chính thức và Discord.
Wan2.7-Image mang đến khả năng kiểm soát màu sắc chính xác
Wan2.7-Image cho phép người dùng sử dụng hình ảnh tham chiếu hoặc mã màu cụ thể để đảm bảo tính nhất quán của thương hiệu, giải quyết triệt để vấn đề sai lệch màu sắc thường gặp trong ảnh AI.
Tính năng giọng nói tùy chỉnh và thư viện giọng nói trên xAI
xAI ra mắt tính năng cho phép người dùng sao chép giọng nói chỉ với 1 phút ghi âm để sử dụng trong Grok và API giọng nói, đi kèm thư viện hơn 80 giọng nói hỗ trợ 28 ngôn ngữ với bảo mật nghiêm ngặt.
Response Caching: Yêu cầu trùng lặp với chi phí bằng không
Tính năng Response Caching mới cho phép lưu trữ phản hồi cho các yêu cầu API giống hệt nhau, giúp giảm đáng kể thời gian phản hồi mà không phát sinh thêm chi phí.
Tín hiệu ngành
Meta lần đầu ghi nhận sụt giảm người dùng hoạt động hàng ngày, cổ phiếu lao dốc do chi phí đầu tư tăng vọt
Trong quý 1/2026, Meta chứng kiến lượng người dùng hàng ngày giảm 20 triệu, đồng thời nâng dự báo chi tiêu vốn lên tới 145 tỷ USD để đầu tư vào hạ tầng AI, khiến cổ phiếu giảm hơn 7%.
Vốn hóa Alphabet tăng vọt 420 tỷ USD trong một ngày, áp sát NVIDIA
Cổ phiếu Alphabet tăng 9% nhờ sự bùng nổ của Google Cloud với mức tăng trưởng doanh thu 63%, chủ yếu nhờ nhu cầu sử dụng các giải pháp AI dựa trên Gemini và chip TPU.
Chính phủ Anh cảnh báo: Khả năng tấn công mạng bằng AI đang tăng tốc vượt dự kiến
Viện An toàn AI của Anh cho biết chu kỳ tăng gấp đôi năng lực của các mô hình AI tiên tiến đã rút ngắn từ 8 tháng xuống còn 4 tháng, gây ra rủi ro an ninh mạng nghiêm trọng.
Softbank lên kế hoạch IPO công ty AI và robot mới mang tên Roze với định giá 100 tỷ USD
Softbank dự định đưa công ty AI và robot mới thành lập là Roze lên sàn chứng khoán Mỹ với mức định giá kỳ vọng lên tới 100 tỷ USD.
Hội nghị Quốc tế về Âm thanh, Giọng nói và Xử lý tín hiệu (ICASSP) 2026
Apple sẽ tham gia tài trợ và trình bày các nghiên cứu mới nhất tại hội nghị ICASSP 2026 diễn ra ở Barcelona, khẳng định cam kết đầu tư vào công nghệ xử lý tín hiệu.
Nghiên cứu / bài báo
Nghiên cứu của Microsoft tiết lộ các trợ lý AI thường làm hỏng nội dung khi chỉnh sửa tài liệu dài
Nghiên cứu cho thấy các mô hình AI hiện nay thường gây ra lỗi nghiêm trọng khi xử lý các tác vụ chỉnh sửa tài liệu dài, với tỷ lệ làm hỏng nội dung trung bình lên tới 25%, cho thấy chúng vẫn chưa đủ tin cậy để làm đại diện ủy quyền trong công việc thực tế.
Đội ngũ DeepSeek đề xuất mô hình 'Tư duy bằng các nguyên tử thị giác' để giải quyết khoảng cách tham chiếu trong suy luận không gian của mô hình đa phương thức
DeepSeek giới thiệu một mô hình đa phương thức mới sử dụng các ký hiệu không gian làm đơn vị tư duy cơ bản, giúp cải thiện đáng kể hiệu suất suy luận không gian và tối ưu hóa bộ nhớ đệm KV.
Nghiên cứu của Microsoft tiết lộ rủi ro mạng khi các tác nhân AI tương tác với nhau
Microsoft Research cảnh báo rằng sự an toàn của từng tác nhân AI riêng lẻ không đảm bảo tính bảo mật cho toàn bộ hệ sinh thái khi chúng kết nối và tương tác ở quy mô lớn.
Phân tích 1 triệu cuộc hội thoại tiết lộ cách người dùng tìm kiếm sự hướng dẫn từ Claude
Anthropic đã phân tích 1 triệu cuộc hội thoại để hiểu cách người dùng đặt câu hỏi và cách Claude phản hồi, từ đó cải thiện quy trình đào tạo cho các phiên bản Opus 4.7 và Mythos Preview.
STARFlow-V: Mô hình tạo video đầu cuối dựa trên dòng chuẩn hóa
Nhóm nghiên cứu giới thiệu STARFlow-V, một mô hình tạo video dựa trên dòng chuẩn hóa (normalizing flows), mang lại khả năng dự báo nhân quả mạnh mẽ và ước tính xác suất trực tiếp cho các cấu trúc không gian-thời gian phức tạp.
Sử dụng mô hình ngôn ngữ ký hiệu để tự động gắn nhãn chú thích
Nhóm nghiên cứu đã phát triển quy trình gắn nhãn giả cho ngôn ngữ ký hiệu nhằm giải quyết tình trạng thiếu hụt dữ liệu chất lượng cao, giúp cải thiện hiệu quả khai thác dữ liệu quy mô lớn cho AI.
Khởi động mô hình chăm sóc sức khỏe mới với AI đồng hành cùng bác sĩ lâm sàng
Nhóm nghiên cứu đang phát triển một AI đóng vai trò cộng sự của bác sĩ lâm sàng để nâng cao chất lượng và hiệu quả điều trị. Công trình này đánh dấu bước chuyển dịch từ việc dùng AI làm công cụ hỗ trợ sang vai trò cộng tác viên cốt lõi trong quy trình y tế.
Thủ thuật / thực hành
Ra mắt bộ công cụ mã nguồn mở Qwen-Scope: Tối ưu hóa thao tác đặc trưng bên trong mô hình
Đội ngũ Qwen giới thiệu bộ công cụ SAE (Sparse Autoencoder) giúp người dùng trực tiếp điều khiển các đặc trưng bên trong mô hình, hỗ trợ phân loại dữ liệu, sửa lỗi mã nguồn và tối ưu hóa hiệu suất mà không cần kỹ thuật gợi ý phức tạp.
Lỗi API DeepSeek-V4 do thiếu trường nội dung suy luận
Người dùng gặp lỗi HTTP 400 khi sử dụng DeepSeek-V4 do các công cụ lập trình tự động loại bỏ trường 'reasoning_content' khi nó rỗng. Giải pháp là phải giữ nguyên trường này dưới dạng chuỗi rỗng thay vì lược bỏ để tránh gián đoạn quá trình xử lý.
Quản lý dự án không chuyên lập trình tự tay phát triển ứng dụng trong 6 tuần nhờ Claude Code
Một quản lý dự án không có kinh nghiệm lập trình đã sử dụng Claude Code để xây dựng và đưa ứng dụng quản lý căng thẳng Respiro lên App Store chỉ trong 6 tuần, thông qua hệ thống gồm 15 tác nhân AI chuyên biệt.
Trào lưu sử dụng câu lệnh 'vẽ nguệch ngoạc' cho GPT Image 2
Một câu lệnh yêu cầu GPT Image 2 vẽ lại hình ảnh theo phong cách cực kỳ cẩu thả, giống như vẽ bằng chuột trong MS Paint, đang trở nên phổ biến trên mạng xã hội nhờ hiệu ứng hình ảnh hài hước và kỳ quặc.
Hướng dẫn sử dụng GitHub Copilot CLI: Chế độ tương tác và không tương tác
GitHub Copilot CLI cung cấp hai chế độ hoạt động: tương tác để khám phá lệnh qua đối thoại và không tương tác để thực thi nhanh các lệnh đã biết, giúp lập trình viên tối ưu hóa hiệu suất làm việc trên dòng lệnh.
Tối ưu hóa liên tục chuỗi công cụ tác nhân: Sự tiến hóa của ngữ cảnh và đánh giá hiệu quả
Đội ngũ Cursor tối ưu hóa chuỗi công cụ tác nhân bằng cách tập trung vào việc mở rộng cửa sổ ngữ cảnh, chuyển từ các cơ chế tĩnh sang phương thức lấy ngữ cảnh động. Họ sử dụng kết hợp các bài kiểm tra chuẩn như CursorBench và thử nghiệm A/B thực tế để đo lường chất lượng và phản hồi từ người dùng.
Thúc đẩy tác động khoa học thông qua hợp tác toàn cầu và tài nguyên mở
Google Research nhấn mạnh tầm quan trọng của phần mềm và dữ liệu mở trong việc thúc đẩy các đột phá khoa học liên ngành như y học, di truyền học và năng lượng. Thông qua hệ sinh thái cộng tác, họ hướng tới việc đẩy nhanh tiến bộ khoa học toàn cầu.
Sự phân bổ vốn sai lầm lớn nhất trong lịch sử?
Việc đổ hàng trăm tỷ USD vào các mô hình AI lớn như GPT, Claude và LLaMA đang gây ra lo ngại về hiệu quả sử dụng vốn và nguy cơ bong bóng công nghệ. Các nhà phân tích cảnh báo rằng sự tập trung quá mức này có thể làm cạn kiệt nguồn lực cho các lĩnh vực đổi mới quan trọng khác.