Nhật báo AI ngày 29/04/2026
Mistral AI giới thiệu mô hình 128B tham số với cửa sổ ngữ cảnh 256K, hỗ trợ tác nhân Vibe giúp thực thi các tác vụ lập trình bất đồng bộ trên đám mây. Cập nhật này nhằm giải phóng lập trình viên khỏi các tác vụ tuần tự cục bộ, nâng cao hiệu suất làm việc.
⚡ HÔM NAY CÓ GÌ HOT? (HIGHLIGHTS)
Phát hành / cập nhật mô hình
Mistral AI ra mắt mô hình Mistral Medium 3.5 và tác nhân lập trình từ xa Vibe
Mistral AI giới thiệu mô hình 128B tham số với cửa sổ ngữ cảnh 256K, hỗ trợ tác nhân Vibe giúp thực thi các tác vụ lập trình bất đồng bộ trên đám mây. Cập nhật này nhằm giải phóng lập trình viên khỏi các tác vụ tuần tự cục bộ, nâng cao hiệu suất làm việc.
Giới thiệu NVIDIA Nemotron 3 Nano Omni: Mô hình đa phương thức ngữ cảnh dài cho tài liệu, âm thanh và video
NVIDIA ra mắt Nemotron 3 Nano Omni, một mô hình nhẹ được thiết kế để xử lý đồng thời tài liệu, âm thanh và video. Mô hình này kết hợp khả năng ngữ cảnh dài với hiểu biết đa phương thức, giúp tăng cường hiệu suất cho thế hệ tác nhân AI mới.
Ra mắt mô hình đa phương thức gốc SenseNova-U1 với khả năng hiểu và tạo nội dung thống nhất
SenseNova-U1 được phát hành mã nguồn mở trên ModelScope, sử dụng kiến trúc NEO-Unify để xử lý ngôn ngữ và hình ảnh như các tín hiệu thống nhất. Mô hình đạt hiệu suất SOTA trong các bài kiểm tra hiểu và tạo nội dung đa phương thức.
Poolside ra mắt các mô hình nền tảng công khai đầu tiên
Poolside vừa phát hành các mô hình nền tảng Laguna M.1 và Laguna XS.2 trên OpenRouter, được xây dựng chuyên biệt cho việc lập trình bởi AI và các tác vụ dài hạn. Hiện đang được cung cấp miễn phí trong thời gian giới hạn.
AntLingAGI hợp tác với đội ngũ SGLang ra mắt mô hình phản hồi tức thì Ling-2.6-flash
Mô hình Ling-2.6-flash (còn gọi là Elephant-alpha) với 104B tham số (7.4B tham số hoạt động) được tối ưu hóa cho các tác vụ AI có độ trễ thấp, mang lại hiệu suất cao trong lập trình và xử lý tài liệu.
Ra mắt mô hình inclusionAI/Ling-2.6-flash
InclusionAI phát hành mô hình Ling-2.6-flash mới nhất trong dòng mô hình ngôn ngữ mã nguồn mở, nhằm thúc đẩy sự phát triển và dân chủ hóa trí tuệ nhân tạo thông qua khoa học mở.
Ra mắt mô hình inclusionAI/Ling-2.6-flash-fp8
Đội ngũ inclusionAI phát hành phiên bản Ling-2.6-flash-fp8, sử dụng độ chính xác FP8 để tối ưu hóa hiệu suất suy luận và giảm thiểu tài nguyên tính toán.
InclusionAI phát hành mô hình Ling-2.6-flash-int4
Phiên bản Ling-2.6-flash-int4 được ra mắt nhằm tối ưu hóa hiệu suất và triển khai nhẹ nhàng, tiếp tục sứ mệnh hạ thấp rào cản tiếp cận công nghệ AI của đội ngũ inclusionAI.
Sản phẩm / ứng dụng
Devin for Terminal: Đưa trợ lý lập trình AI từ đám mây về thiết bị cục bộ
Cognition ra mắt Devin for Terminal, cho phép chuyển đổi liền mạch giữa môi trường cục bộ và máy ảo trên đám mây. Công cụ này hỗ trợ đa mô hình từ OpenAI, Anthropic, Google và SWE-1.6, giúp tối ưu hóa quy trình làm việc của lập trình viên.
Bộ công cụ sáng tạo Claude for Creative Work
Anthropic ra mắt bộ công cụ kết nối cho phép Claude tích hợp trực tiếp với các phần mềm sáng tạo phổ biến như Blender, Autodesk và Adobe, giúp tự động hóa quy trình làm việc và hỗ trợ lập trình thông qua ngôn ngữ tự nhiên.
Microsoft VibeVoice: Dự án AI giọng nói mã nguồn mở tiên phong
Microsoft vừa phát hành mã nguồn mở cho dự án VibeVoice trên GitHub, mang đến khả năng tạo giọng nói AI tự nhiên, giàu cảm xúc và hỗ trợ đa ngôn ngữ nhằm thúc đẩy sự đổi mới trong lĩnh vực âm thanh.
Claude Code bổ sung tính năng thông báo hoàn thành tác vụ qua điện thoại
Claude Code hiện đã hỗ trợ gửi thông báo đẩy đến điện thoại của bạn khi các tác vụ dài hoàn tất hoặc khi cần người dùng nhập liệu, giúp bạn không cần phải túc trực tại terminal.
NVIDIA ra mắt mô hình đa phương thức mã nguồn mở Nemotron 3 Nano Omni
NVIDIA phát hành mô hình đa phương thức 30B-A3B trên OpenRouter, hỗ trợ đầu vào văn bản, hình ảnh, video và âm thanh với cửa sổ ngữ cảnh 256k, tối ưu cho các tác vụ suy luận và làm việc với máy tính.
Hướng dẫn triển khai doanh nghiệp: Tận dụng Claude Cowork để thúc đẩy cộng tác AI
Anthropic công bố hướng dẫn triển khai Claude Cowork cho doanh nghiệp, cung cấp lộ trình chi tiết giúp nhân viên không chuyên về kỹ thuật ứng dụng AI vào các công việc như tài chính, pháp lý và bán hàng.
Kỹ năng Claude API hiện đã tích hợp vào CodeRabbit, JetBrains, Resolve AI và Warp
Việc tích hợp Claude API vào các công cụ phát triển giúp lập trình viên dễ dàng áp dụng các phương pháp tối ưu, quản lý bộ nhớ đệm và nâng cấp mô hình trực tiếp trong môi trường làm việc quen thuộc.
Claude ra mắt trình kết nối Blender, hỗ trợ quy trình làm việc sáng tạo
Claude hiện đã tích hợp với các công cụ chuyên nghiệp. Thông qua trình kết nối Blender mới, người dùng có thể gỡ lỗi cảnh, xây dựng công cụ mới hoặc áp dụng thay đổi hàng loạt cho các đối tượng trực tiếp từ Claude.
Tín hiệu ngành
Elon Musk kiện OpenAI, cáo buộc phản bội mục tiêu phi lợi nhuận ban đầu
Elon Musk đã đệ đơn kiện OpenAI và CEO Sam Altman tại tòa án California, yêu cầu hủy bỏ quá trình chuyển đổi sang mô hình lợi nhuận năm 2019 và đòi bồi thường 134 tỷ USD. Musk cho rằng hành động này đe dọa niềm tin vào các tổ chức từ thiện, trong khi OpenAI bác bỏ cáo buộc là vô căn cứ.
OpenAI không đạt mục tiêu doanh thu và người dùng ChatGPT năm 2025
OpenAI gặp khó khăn trong việc đạt mục tiêu doanh thu và 1 tỷ người dùng hàng tuần do sự cạnh tranh từ Gemini và Anthropic. Công ty đang đối mặt với áp lực tài chính lớn từ chi phí trung tâm dữ liệu và các vụ kiện pháp lý, gây thách thức cho lộ trình IPO.
EU yêu cầu Android mở quyền truy cập AI, Google đối mặt mức phạt 10% doanh thu toàn cầu
Ủy ban châu Âu yêu cầu Google mở quyền truy cập các tính năng AI trên Android cho bên thứ ba thay vì ưu tiên Gemini. Nếu không tuân thủ trước ngày 27/7, Google có thể bị phạt tới 10% doanh thu hàng năm trên toàn cầu.
Các mô hình OpenAI, Codex và tác nhân thông minh đã có mặt trên AWS
Các mô hình GPT, Codex và tác nhân thông minh của OpenAI đã chính thức lên nền tảng AWS. Người dùng doanh nghiệp hiện có thể tích hợp trực tiếp các dịch vụ AI này vào hạ tầng đám mây để xây dựng ứng dụng tùy chỉnh an toàn.
Google ký thỏa thuận AI với Lầu Năm Góc cho mục đích quân sự mật
Google đã ký thỏa thuận cho phép sử dụng các mô hình AI của mình cho mục đích quân sự mật, bất chấp sự phản đối từ nhân viên. Thỏa thuận này đánh dấu sự thay đổi lớn trong lập trường của công ty so với năm 2018.
Nghiên cứu / bài báo
VLAA-GUI: Giúp các tác nhân GUI biết cách 'dừng lại, khôi phục và tìm kiếm'
Nghiên cứu chỉ ra rằng nút thắt của các tác nhân GUI nằm ở thiết kế hệ thống thay vì năng lực mô hình. Khung VLAA-GUI giải quyết vấn đề này bằng cách tích hợp bộ xác thực STOP, bộ ngắt vòng lặp RECOVER và tác nhân SEARCH, giúp mô hình Opus 4.6 đạt tỷ lệ thành công 77,5%, vượt qua mức trung bình của con người.
Cập nhật 1 nghìn tỷ tham số trong vài giây: Công nghệ truyền trọng số ngang hàng trong học tăng cường phân tán quy mô lớn
Nhóm LMSYS đã phát triển cơ chế truyền trọng số ngang hàng (P2P) dựa trên RDMA cho SGLang, giúp rút ngắn thời gian truyền trọng số của mô hình Kimi-K2 từ 53 giây xuống còn 7,2 giây. Phương pháp này tối ưu hóa mạng lưới và cho phép máy chủ suy luận khôi phục quá trình triển khai nhanh hơn.
Alibaba DAMO Academy lần đầu tiên đạt được khả năng phát hiện ung thư ruột 'không cảm giác' trên toàn cầu
Mô hình AI DAMO COCA của Alibaba đã đạt được bước tiến trong việc sàng lọc ung thư ruột thông qua ảnh chụp CT mà không cần chuẩn bị ruột trước. Trong thử nghiệm trên 27.000 người, mô hình đạt độ nhạy 86,6% và độ đặc hiệu 99,8%, vượt trội hơn đáng kể so với các bác sĩ chẩn đoán hình ảnh.
Đánh giá năng lực nghiên cứu tin sinh học của Claude với BioMysteryBench
Anthropic đã phát triển BioMysteryBench để đánh giá khả năng phân tích dữ liệu thực tế và giải quyết các vấn đề nghiên cứu mở của Claude. Kết quả cho thấy năng lực khoa học của Claude đã đạt trình độ tương đương chuyên gia con người, thậm chí giải quyết được các vấn đề mà nhóm chuyên gia trước đó chưa tìm ra lời giải.
LaDiR: Tăng cường khả năng suy luận văn bản của LLM bằng mô hình khuếch tán tiềm ẩn
Nhóm nghiên cứu giới thiệu khung suy luận LaDiR, kết hợp khả năng biểu diễn của không gian tiềm ẩn với sự tối ưu hóa lặp lại của mô hình khuếch tán. Phương pháp này cho phép mô hình xem xét và sửa đổi các lộ trình suy luận từ sớm, vượt qua giới hạn của giải mã tự hồi quy truyền thống.
Hình ảnh siêu âm thích ứng với AI NV-Raw2Insights-US dựa trên vật lý của NVIDIA
NVIDIA đã ra mắt mô hình AI NV-Raw2Insights-US trên Hugging Face, cho phép xử lý dữ liệu siêu âm thô để tạo ra hình ảnh chẩn đoán chất lượng cao theo thời gian thực. Bằng cách kết hợp các định luật vật lý với học sâu, mô hình giúp cải thiện đáng kể độ phân giải và hiệu suất tính toán cho thiết bị siêu âm.
FlashQLA: Nhân chú ý tuyến tính hợp nhất tối ưu cho GDN
FlashQLA giới thiệu các nhân chú ý tuyến tính được tối ưu hóa cho mạng giảm độ dốc, giúp cải thiện hiệu suất tính toán và quá trình lan truyền ngược, từ đó tăng tốc độ huấn luyện mô hình quy mô lớn.
Thực trạng và tương lai của các mô hình nền tảng AI trong quản lý ung thư
Các mô hình AI nền tảng đang cách mạng hóa việc tầm soát và điều trị ung thư. Tương lai của lĩnh vực này tập trung vào tích hợp đa phương thức, tăng cường khả năng suy luận và thúc đẩy tính mở để hỗ trợ chuyên gia y tế.
Thủ thuật / thực hành
Tối ưu hóa CLAUDE.md: Tập trung vào các quy tắc then chốt để nâng cao hiệu suất cộng tác AI
Thay vì viết các tệp CLAUDE.md dài dòng, người dùng nên tinh gọn nội dung trong khoảng 60-80 dòng, tập trung vào các lệnh quan trọng, sơ đồ kiến trúc và các quy tắc cấm để Claude hoạt động chính xác hơn.
Từ container đến AI: Lịch sử lặp lại của việc 'nhà đầu tư thua lỗ'
Nhà đầu tư mạo hiểm Jerry Neumann cho rằng AI tạo sinh đang đi vào vết xe đổ của các làn sóng công nghệ trước đây, nơi quyền kiểm soát tập trung vào các tập đoàn lớn, khiến các nhà đầu tư nhỏ lẻ đối mặt với rủi ro thua lỗ cao.
Hướng dẫn tạo nhạc đệm trong 60 giây
Hướng dẫn nhanh cách tạo các bản nhạc đệm chỉ trong vòng 60 giây.
Ba câu hỏi cốt lõi trong kinh doanh giải pháp AI
Chiến lược bán hàng AI hiện đại chuyển dịch từ việc hỏi ngân sách phần mềm sang phân tích ngân sách lao động, nhằm chứng minh tiềm năng thay thế và tối ưu chi phí nhân sự của AI trong doanh nghiệp.
Chi phí mô hình Opus 4.7 tăng phổ biến từ 12-27%
Nghiên cứu dữ liệu thị trường cho thấy chi phí của Opus 4.7 tăng từ 12-27%, ngoại trừ các câu lệnh ngắn thực tế lại có hiệu quả chi phí cao hơn.
Bốn lĩnh vực mà nhóm nghiên cứu Google ứng dụng công cụ hỗ trợ nghiên cứu thực nghiệm
Kể từ khi ra mắt công cụ Hỗ trợ Nghiên cứu Thực nghiệm (ERA), Google đã ứng dụng nó vào dịch tễ học, vũ trụ học, giám sát khí quyển và khoa học thần kinh, giúp các nhà khoa học tạo ra phần mềm chuyên gia có khả năng giải thích tốt hơn các mô hình hộp đen.
Cam kết của chúng tôi đối với sự an toàn của cộng đồng
OpenAI bảo vệ an toàn cho cộng đồng ChatGPT thông qua các cơ chế phòng thủ đa tầng, bao gồm rào chắn an toàn tích hợp, giám sát lạm dụng thời gian thực và hợp tác với các chuyên gia an ninh bên ngoài.