04/07 03/07 02/07 01/07 30/06 29/06 28/06 27/06 26/06 25/06

Nhật báo AI ngày 01/05/2026

Đội ngũ AntLingAGI đã phát hành mô hình Ling-2.6-1T với kiến trúc hỗn hợp chuyên gia (MoE), sở hữu 1 nghìn tỷ tham số, tập trung tối ưu hóa hiệu suất token để đáp ứng các nhu cầu sản xuất thực tế.

⚡ HÔM NAY CÓ GÌ HOT? (HIGHLIGHTS)

1. Phát hành / cập nhật mô hình (5 tin)

AntLingAGI ra mắt mã nguồn mở mô hình Ling-2.6-1T trên Hugging Face

2. Sản phẩm / ứng dụng (8 tin)

Replit kỷ niệm 10 năm, mở miễn phí tính năng Agent

3. Tín hiệu ngành (5 tin)

Meta lần đầu ghi nhận sụt giảm người dùng hoạt động hàng ngày, cổ phiếu lao dốc do chi phí đầu tư tăng vọt

4. Nghiên cứu / bài báo (7 tin)

Nghiên cứu của Microsoft tiết lộ các trợ lý AI thường làm hỏng nội dung khi chỉnh sửa tài liệu dài

5. Thủ thuật / thực hành (8 tin)

Ra mắt bộ công cụ mã nguồn mở Qwen-Scope: Tối ưu hóa thao tác đặc trưng bên trong mô hình

Phát hành / cập nhật mô hình

AntLingAGI ra mắt mã nguồn mở mô hình Ling-2.6-1T trên Hugging Face

Nguồn: X: Ant Ling (@AntLingAGI) · Bài gốc

DeepSeek công bố báo cáo kỹ thuật về mô hình đa phương thức

Nguồn: IT Home · Bài gốc

DeepSeek giới thiệu khung tư duy dựa trên các nguyên tố thị giác, giúp mô hình giải quyết vấn đề tham chiếu không gian và đạt hiệu suất cạnh tranh với các mô hình hàng đầu dù có kích thước nhỏ gọn.

Grok-4.3 ra mắt trên OpenRouter với hiệu năng vượt trội

Nguồn: X: OpenRouter (@OpenRouter) · Bài gốc

Mô hình Grok-4.3 của xAI đã có mặt trên OpenRouter với mức giá thấp hơn nhưng đạt điểm ELO ấn tượng 1500 trên bảng xếp hạng GDPval-AA, vượt qua nhiều đối thủ cạnh tranh.

Qwen3.6-Plus chính thức có mặt trên nền tảng Together AI

Nguồn: X: Alibaba Cloud / Alibaba Cloud (@alibaba_cloud) · Bài gốc

Alibaba Cloud thông báo mô hình Qwen3.6-Plus hiện đã sẵn sàng để người dùng trải nghiệm trên nền tảng Together AI.

Baidu ra mắt ERNIE 5.1 Preview với kiến trúc tinh gọn và hiệu suất mạnh mẽ

Nguồn: X: Baidu Baidu (@Baidu_Inc) · Bài gốc

ERNIE 5.1 Preview sở hữu kiến trúc nhẹ hơn đáng kể so với thế hệ trước nhưng vẫn đạt thứ hạng cao trên bảng xếp hạng Text Arena, đặc biệt dẫn đầu trong lĩnh vực pháp luật và chính phủ.

Sản phẩm / ứng dụng

Replit kỷ niệm 10 năm, mở miễn phí tính năng Agent

Nguồn: X: Replit (@Replit) · Bài gốc

Nhân dịp kỷ niệm 10 năm thành lập, Replit cung cấp miễn phí tính năng Agent và tổ chức cuộc thi lập trình phối hợp cùng Anthropic.

Codex đơn giản hóa quy trình làm việc hàng ngày

Nguồn: X: OpenAI (@OpenAI) · Bài gốc

Việc xử lý công việc hàng ngày trở nên dễ dàng hơn bao giờ hết với Codex. Chỉ cần chọn vai trò, kết nối các ứng dụng quen thuộc và sử dụng gợi ý để Codex hỗ trợ bạn từ lập kế hoạch nghiên cứu, soạn thảo tài liệu, làm slide cho đến bảng tính.

Alibaba Cloud ra mắt HappyHorse, tạo video AI trong vài giây

Nguồn: X: Alibaba Cloud / Alibaba Cloud (@alibaba_cloud) · Bài gốc

Alibaba Cloud giới thiệu mô hình tạo video AI mới HappyHorse với khả năng tạo video 1080p chất lượng điện ảnh, đồng bộ âm thanh và khẩu hình chính xác, đồng thời duy trì tính nhất quán của nhân vật qua nhiều cảnh quay.

AI Agents hiện có thể tạo tài khoản Cloudflare, mua tên miền và triển khai dự án

Nguồn: Cloudflare Blog · Bài gốc

Cloudflare thông báo các AI agent giờ đây có thể tự vận hành như một khách hàng độc lập, từ việc tạo tài khoản, đăng ký tên miền đến triển khai mã nguồn mà không cần sự can thiệp thủ công của con người.

Nâng cấp chất lượng hình ảnh V8.1 và mở rộng kênh phát hành

Nguồn: X: Midjourney (@midjourney) · Bài gốc

Midjourney vừa tung bản cập nhật V8.1 giúp cải thiện độ sắc nét và chất lượng hình ảnh, đồng thời chính thức phát hành trên cả website chính thức và Discord.

Wan2.7-Image mang đến khả năng kiểm soát màu sắc chính xác

Nguồn: X: Alibaba Cloud / Alibaba Cloud (@alibaba_cloud) · Bài gốc

Wan2.7-Image cho phép người dùng sử dụng hình ảnh tham chiếu hoặc mã màu cụ thể để đảm bảo tính nhất quán của thương hiệu, giải quyết triệt để vấn đề sai lệch màu sắc thường gặp trong ảnh AI.

Tính năng giọng nói tùy chỉnh và thư viện giọng nói trên xAI

Nguồn: xAI: News (Web) · Bài gốc

xAI ra mắt tính năng cho phép người dùng sao chép giọng nói chỉ với 1 phút ghi âm để sử dụng trong Grok và API giọng nói, đi kèm thư viện hơn 80 giọng nói hỗ trợ 28 ngôn ngữ với bảo mật nghiêm ngặt.

Response Caching: Yêu cầu trùng lặp với chi phí bằng không

Nguồn: OpenRouter: Announcements · Bài gốc

Tính năng Response Caching mới cho phép lưu trữ phản hồi cho các yêu cầu API giống hệt nhau, giúp giảm đáng kể thời gian phản hồi mà không phát sinh thêm chi phí.

Tín hiệu ngành

Meta lần đầu ghi nhận sụt giảm người dùng hoạt động hàng ngày, cổ phiếu lao dốc do chi phí đầu tư tăng vọt

Nguồn: X: Kim (@kimmonismus) · Bài gốc

Trong quý 1/2026, Meta chứng kiến lượng người dùng hàng ngày giảm 20 triệu, đồng thời nâng dự báo chi tiêu vốn lên tới 145 tỷ USD để đầu tư vào hạ tầng AI, khiến cổ phiếu giảm hơn 7%.

Vốn hóa Alphabet tăng vọt 420 tỷ USD trong một ngày, áp sát NVIDIA

Nguồn: X: Rohan Paul (@rohanpaul_ai) · Bài gốc

Cổ phiếu Alphabet tăng 9% nhờ sự bùng nổ của Google Cloud với mức tăng trưởng doanh thu 63%, chủ yếu nhờ nhu cầu sử dụng các giải pháp AI dựa trên Gemini và chip TPU.

Chính phủ Anh cảnh báo: Khả năng tấn công mạng bằng AI đang tăng tốc vượt dự kiến

Nguồn: X: AI Safety Memes (@AISafetyMemes) · Bài gốc

Viện An toàn AI của Anh cho biết chu kỳ tăng gấp đôi năng lực của các mô hình AI tiên tiến đã rút ngắn từ 8 tháng xuống còn 4 tháng, gây ra rủi ro an ninh mạng nghiêm trọng.

Softbank lên kế hoạch IPO công ty AI và robot mới mang tên Roze với định giá 100 tỷ USD

Nguồn: The Decoder: AI News · Bài gốc

Softbank dự định đưa công ty AI và robot mới thành lập là Roze lên sàn chứng khoán Mỹ với mức định giá kỳ vọng lên tới 100 tỷ USD.

Hội nghị Quốc tế về Âm thanh, Giọng nói và Xử lý tín hiệu (ICASSP) 2026

Nguồn: Apple Machine Learning Research · Bài gốc

Apple sẽ tham gia tài trợ và trình bày các nghiên cứu mới nhất tại hội nghị ICASSP 2026 diễn ra ở Barcelona, khẳng định cam kết đầu tư vào công nghệ xử lý tín hiệu.

Nghiên cứu / bài báo

Nghiên cứu của Microsoft tiết lộ các trợ lý AI thường làm hỏng nội dung khi chỉnh sửa tài liệu dài

Nguồn: X: Rohan Paul (@rohanpaul_ai) · Bài gốc

Nghiên cứu cho thấy các mô hình AI hiện nay thường gây ra lỗi nghiêm trọng khi xử lý các tác vụ chỉnh sửa tài liệu dài, với tỷ lệ làm hỏng nội dung trung bình lên tới 25%, cho thấy chúng vẫn chưa đủ tin cậy để làm đại diện ủy quyền trong công việc thực tế.

Đội ngũ DeepSeek đề xuất mô hình 'Tư duy bằng các nguyên tử thị giác' để giải quyết khoảng cách tham chiếu trong suy luận không gian của mô hình đa phương thức

Nguồn: DeepSeek: GitHub · Bài gốc

DeepSeek giới thiệu một mô hình đa phương thức mới sử dụng các ký hiệu không gian làm đơn vị tư duy cơ bản, giúp cải thiện đáng kể hiệu suất suy luận không gian và tối ưu hóa bộ nhớ đệm KV.

Nghiên cứu của Microsoft tiết lộ rủi ro mạng khi các tác nhân AI tương tác với nhau

Nguồn: X: Microsoft Research (@MSFTResearch) · Bài gốc

Microsoft Research cảnh báo rằng sự an toàn của từng tác nhân AI riêng lẻ không đảm bảo tính bảo mật cho toàn bộ hệ sinh thái khi chúng kết nối và tương tác ở quy mô lớn.

Phân tích 1 triệu cuộc hội thoại tiết lộ cách người dùng tìm kiếm sự hướng dẫn từ Claude

Nguồn: X: Anthropic (@AnthropicAI) · Bài gốc

Anthropic đã phân tích 1 triệu cuộc hội thoại để hiểu cách người dùng đặt câu hỏi và cách Claude phản hồi, từ đó cải thiện quy trình đào tạo cho các phiên bản Opus 4.7 và Mythos Preview.

STARFlow-V: Mô hình tạo video đầu cuối dựa trên dòng chuẩn hóa

Nguồn: Apple Machine Learning Research · Bài gốc

Nhóm nghiên cứu giới thiệu STARFlow-V, một mô hình tạo video dựa trên dòng chuẩn hóa (normalizing flows), mang lại khả năng dự báo nhân quả mạnh mẽ và ước tính xác suất trực tiếp cho các cấu trúc không gian-thời gian phức tạp.

Sử dụng mô hình ngôn ngữ ký hiệu để tự động gắn nhãn chú thích

Nguồn: Apple Machine Learning Research · Bài gốc

Nhóm nghiên cứu đã phát triển quy trình gắn nhãn giả cho ngôn ngữ ký hiệu nhằm giải quyết tình trạng thiếu hụt dữ liệu chất lượng cao, giúp cải thiện hiệu quả khai thác dữ liệu quy mô lớn cho AI.

Khởi động mô hình chăm sóc sức khỏe mới với AI đồng hành cùng bác sĩ lâm sàng

Nguồn: Google DeepMind: Blog · Bài gốc

Nhóm nghiên cứu đang phát triển một AI đóng vai trò cộng sự của bác sĩ lâm sàng để nâng cao chất lượng và hiệu quả điều trị. Công trình này đánh dấu bước chuyển dịch từ việc dùng AI làm công cụ hỗ trợ sang vai trò cộng tác viên cốt lõi trong quy trình y tế.

Thủ thuật / thực hành

Ra mắt bộ công cụ mã nguồn mở Qwen-Scope: Tối ưu hóa thao tác đặc trưng bên trong mô hình

Nguồn: X: / Qwen (@Alibaba_Qwen) · Bài gốc

Đội ngũ Qwen giới thiệu bộ công cụ SAE (Sparse Autoencoder) giúp người dùng trực tiếp điều khiển các đặc trưng bên trong mô hình, hỗ trợ phân loại dữ liệu, sửa lỗi mã nguồn và tối ưu hóa hiệu suất mà không cần kỹ thuật gợi ý phức tạp.

Lỗi API DeepSeek-V4 do thiếu trường nội dung suy luận

Nguồn: X: karminski (@karminski3) · Bài gốc

Người dùng gặp lỗi HTTP 400 khi sử dụng DeepSeek-V4 do các công cụ lập trình tự động loại bỏ trường 'reasoning_content' khi nó rỗng. Giải pháp là phải giữ nguyên trường này dưới dạng chuỗi rỗng thay vì lược bỏ để tránh gián đoạn quá trình xử lý.

Quản lý dự án không chuyên lập trình tự tay phát triển ứng dụng trong 6 tuần nhờ Claude Code

Nguồn: Claude: Blog (Web) · Bài gốc

Một quản lý dự án không có kinh nghiệm lập trình đã sử dụng Claude Code để xây dựng và đưa ứng dụng quản lý căng thẳng Respiro lên App Store chỉ trong 6 tuần, thông qua hệ thống gồm 15 tác nhân AI chuyên biệt.

Trào lưu sử dụng câu lệnh 'vẽ nguệch ngoạc' cho GPT Image 2

Nguồn: X: ChatGPT (@ChatGPTapp) · Bài gốc

Một câu lệnh yêu cầu GPT Image 2 vẽ lại hình ảnh theo phong cách cực kỳ cẩu thả, giống như vẽ bằng chuột trong MS Paint, đang trở nên phổ biến trên mạng xã hội nhờ hiệu ứng hình ảnh hài hước và kỳ quặc.

Hướng dẫn sử dụng GitHub Copilot CLI: Chế độ tương tác và không tương tác

Nguồn: GitHub Blog · Bài gốc

GitHub Copilot CLI cung cấp hai chế độ hoạt động: tương tác để khám phá lệnh qua đối thoại và không tương tác để thực thi nhanh các lệnh đã biết, giúp lập trình viên tối ưu hóa hiệu suất làm việc trên dòng lệnh.

Tối ưu hóa liên tục chuỗi công cụ tác nhân: Sự tiến hóa của ngữ cảnh và đánh giá hiệu quả

Nguồn: Cursor Blog · Bài gốc

Đội ngũ Cursor tối ưu hóa chuỗi công cụ tác nhân bằng cách tập trung vào việc mở rộng cửa sổ ngữ cảnh, chuyển từ các cơ chế tĩnh sang phương thức lấy ngữ cảnh động. Họ sử dụng kết hợp các bài kiểm tra chuẩn như CursorBench và thử nghiệm A/B thực tế để đo lường chất lượng và phản hồi từ người dùng.

Thúc đẩy tác động khoa học thông qua hợp tác toàn cầu và tài nguyên mở

Nguồn: Google Research: Blog (Web) · Bài gốc

Google Research nhấn mạnh tầm quan trọng của phần mềm và dữ liệu mở trong việc thúc đẩy các đột phá khoa học liên ngành như y học, di truyền học và năng lượng. Thông qua hệ sinh thái cộng tác, họ hướng tới việc đẩy nhanh tiến bộ khoa học toàn cầu.

Sự phân bổ vốn sai lầm lớn nhất trong lịch sử?

Nguồn: Gary Marcus: The Road to AI We Can Trust · Bài gốc

Việc đổ hàng trăm tỷ USD vào các mô hình AI lớn như GPT, Claude và LLaMA đang gây ra lo ngại về hiệu quả sử dụng vốn và nguy cơ bong bóng công nghệ. Các nhà phân tích cảnh báo rằng sự tập trung quá mức này có thể làm cạn kiệt nguồn lực cho các lĩnh vực đổi mới quan trọng khác.