04/07 03/07 02/07 01/07 30/06 29/06 28/06 27/06 26/06 25/06

Nhật báo AI ngày 29/04/2026

Mistral AI giới thiệu mô hình 128B tham số với cửa sổ ngữ cảnh 256K, hỗ trợ tác nhân Vibe giúp thực thi các tác vụ lập trình bất đồng bộ trên đám mây. Cập nhật này nhằm giải phóng lập trình viên khỏi các tác vụ tuần tự cục bộ, nâng cao hiệu suất làm việc.

⚡ HÔM NAY CÓ GÌ HOT? (HIGHLIGHTS)

1. Phát hành / cập nhật mô hình (8 tin)

Mistral AI ra mắt mô hình Mistral Medium 3.5 và tác nhân lập trình từ xa Vibe

2. Sản phẩm / ứng dụng (8 tin)

Devin for Terminal: Đưa trợ lý lập trình AI từ đám mây về thiết bị cục bộ

3. Tín hiệu ngành (5 tin)

Elon Musk kiện OpenAI, cáo buộc phản bội mục tiêu phi lợi nhuận ban đầu

4. Nghiên cứu / bài báo (8 tin)

VLAA-GUI: Giúp các tác nhân GUI biết cách 'dừng lại, khôi phục và tìm kiếm'

5. Thủ thuật / thực hành (7 tin)

Tối ưu hóa CLAUDE.md: Tập trung vào các quy tắc then chốt để nâng cao hiệu suất cộng tác AI

Phát hành / cập nhật mô hình

Mistral AI ra mắt mô hình Mistral Medium 3.5 và tác nhân lập trình từ xa Vibe

Nguồn: Mistral AI: News (Web) · Bài gốc

Giới thiệu NVIDIA Nemotron 3 Nano Omni: Mô hình đa phương thức ngữ cảnh dài cho tài liệu, âm thanh và video

Nguồn: Hugging Face: Blog · Bài gốc

NVIDIA ra mắt Nemotron 3 Nano Omni, một mô hình nhẹ được thiết kế để xử lý đồng thời tài liệu, âm thanh và video. Mô hình này kết hợp khả năng ngữ cảnh dài với hiểu biết đa phương thức, giúp tăng cường hiệu suất cho thế hệ tác nhân AI mới.

Ra mắt mô hình đa phương thức gốc SenseNova-U1 với khả năng hiểu và tạo nội dung thống nhất

Nguồn: X: ModelScope (@ModelScope2022) · Bài gốc

SenseNova-U1 được phát hành mã nguồn mở trên ModelScope, sử dụng kiến trúc NEO-Unify để xử lý ngôn ngữ và hình ảnh như các tín hiệu thống nhất. Mô hình đạt hiệu suất SOTA trong các bài kiểm tra hiểu và tạo nội dung đa phương thức.

Poolside ra mắt các mô hình nền tảng công khai đầu tiên

Nguồn: X: OpenRouter (@OpenRouter) · Bài gốc

Poolside vừa phát hành các mô hình nền tảng Laguna M.1 và Laguna XS.2 trên OpenRouter, được xây dựng chuyên biệt cho việc lập trình bởi AI và các tác vụ dài hạn. Hiện đang được cung cấp miễn phí trong thời gian giới hạn.

AntLingAGI hợp tác với đội ngũ SGLang ra mắt mô hình phản hồi tức thì Ling-2.6-flash

Nguồn: X: Ant Ling (@AntLingAGI) · Bài gốc

Mô hình Ling-2.6-flash (còn gọi là Elephant-alpha) với 104B tham số (7.4B tham số hoạt động) được tối ưu hóa cho các tác vụ AI có độ trễ thấp, mang lại hiệu suất cao trong lập trình và xử lý tài liệu.

Ra mắt mô hình inclusionAI/Ling-2.6-flash

Nguồn: Ant Group inclusionAI: HuggingFace mô hình mới · Bài gốc

InclusionAI phát hành mô hình Ling-2.6-flash mới nhất trong dòng mô hình ngôn ngữ mã nguồn mở, nhằm thúc đẩy sự phát triển và dân chủ hóa trí tuệ nhân tạo thông qua khoa học mở.

Ra mắt mô hình inclusionAI/Ling-2.6-flash-fp8

Nguồn: Ant Group inclusionAI: HuggingFace mô hình mới · Bài gốc

Đội ngũ inclusionAI phát hành phiên bản Ling-2.6-flash-fp8, sử dụng độ chính xác FP8 để tối ưu hóa hiệu suất suy luận và giảm thiểu tài nguyên tính toán.

InclusionAI phát hành mô hình Ling-2.6-flash-int4

Nguồn: Ant Group inclusionAI: HuggingFace mô hình mới · Bài gốc

Phiên bản Ling-2.6-flash-int4 được ra mắt nhằm tối ưu hóa hiệu suất và triển khai nhẹ nhàng, tiếp tục sứ mệnh hạ thấp rào cản tiếp cận công nghệ AI của đội ngũ inclusionAI.

Sản phẩm / ứng dụng

Devin for Terminal: Đưa trợ lý lập trình AI từ đám mây về thiết bị cục bộ

Nguồn: X: Shao Meng (@shao__meng) · Bài gốc

Cognition ra mắt Devin for Terminal, cho phép chuyển đổi liền mạch giữa môi trường cục bộ và máy ảo trên đám mây. Công cụ này hỗ trợ đa mô hình từ OpenAI, Anthropic, Google và SWE-1.6, giúp tối ưu hóa quy trình làm việc của lập trình viên.

Bộ công cụ sáng tạo Claude for Creative Work

Nguồn: Anthropic: Newsroom (Web) · Bài gốc

Anthropic ra mắt bộ công cụ kết nối cho phép Claude tích hợp trực tiếp với các phần mềm sáng tạo phổ biến như Blender, Autodesk và Adobe, giúp tự động hóa quy trình làm việc và hỗ trợ lập trình thông qua ngôn ngữ tự nhiên.

Microsoft VibeVoice: Dự án AI giọng nói mã nguồn mở tiên phong

Nguồn: Hacker News Nổi bật (buzzing.cc bản dịch tiếng Trung) · Bài gốc

Microsoft vừa phát hành mã nguồn mở cho dự án VibeVoice trên GitHub, mang đến khả năng tạo giọng nói AI tự nhiên, giàu cảm xúc và hỗ trợ đa ngôn ngữ nhằm thúc đẩy sự đổi mới trong lĩnh vực âm thanh.

Claude Code bổ sung tính năng thông báo hoàn thành tác vụ qua điện thoại

Nguồn: X: Claude Devs (@ClaudeDevs) · Bài gốc

Claude Code hiện đã hỗ trợ gửi thông báo đẩy đến điện thoại của bạn khi các tác vụ dài hoàn tất hoặc khi cần người dùng nhập liệu, giúp bạn không cần phải túc trực tại terminal.

NVIDIA ra mắt mô hình đa phương thức mã nguồn mở Nemotron 3 Nano Omni

Nguồn: X: OpenRouter (@OpenRouter) · Bài gốc

NVIDIA phát hành mô hình đa phương thức 30B-A3B trên OpenRouter, hỗ trợ đầu vào văn bản, hình ảnh, video và âm thanh với cửa sổ ngữ cảnh 256k, tối ưu cho các tác vụ suy luận và làm việc với máy tính.

Hướng dẫn triển khai doanh nghiệp: Tận dụng Claude Cowork để thúc đẩy cộng tác AI

Nguồn: Claude: Blog (Web) · Bài gốc

Anthropic công bố hướng dẫn triển khai Claude Cowork cho doanh nghiệp, cung cấp lộ trình chi tiết giúp nhân viên không chuyên về kỹ thuật ứng dụng AI vào các công việc như tài chính, pháp lý và bán hàng.

Kỹ năng Claude API hiện đã tích hợp vào CodeRabbit, JetBrains, Resolve AI và Warp

Nguồn: Claude: Blog (Web) · Bài gốc

Việc tích hợp Claude API vào các công cụ phát triển giúp lập trình viên dễ dàng áp dụng các phương pháp tối ưu, quản lý bộ nhớ đệm và nâng cấp mô hình trực tiếp trong môi trường làm việc quen thuộc.

Claude ra mắt trình kết nối Blender, hỗ trợ quy trình làm việc sáng tạo

Nguồn: X: Claude (@claudeai) · Bài gốc

Claude hiện đã tích hợp với các công cụ chuyên nghiệp. Thông qua trình kết nối Blender mới, người dùng có thể gỡ lỗi cảnh, xây dựng công cụ mới hoặc áp dụng thay đổi hàng loạt cho các đối tượng trực tiếp từ Claude.

Tín hiệu ngành

Elon Musk kiện OpenAI, cáo buộc phản bội mục tiêu phi lợi nhuận ban đầu

Nguồn: X: Kim (@kimmonismus) · Bài gốc

Elon Musk đã đệ đơn kiện OpenAI và CEO Sam Altman tại tòa án California, yêu cầu hủy bỏ quá trình chuyển đổi sang mô hình lợi nhuận năm 2019 và đòi bồi thường 134 tỷ USD. Musk cho rằng hành động này đe dọa niềm tin vào các tổ chức từ thiện, trong khi OpenAI bác bỏ cáo buộc là vô căn cứ.

OpenAI không đạt mục tiêu doanh thu và người dùng ChatGPT năm 2025

Nguồn: IT Home · Bài gốc

OpenAI gặp khó khăn trong việc đạt mục tiêu doanh thu và 1 tỷ người dùng hàng tuần do sự cạnh tranh từ Gemini và Anthropic. Công ty đang đối mặt với áp lực tài chính lớn từ chi phí trung tâm dữ liệu và các vụ kiện pháp lý, gây thách thức cho lộ trình IPO.

EU yêu cầu Android mở quyền truy cập AI, Google đối mặt mức phạt 10% doanh thu toàn cầu

Nguồn: IT Home · Bài gốc

Ủy ban châu Âu yêu cầu Google mở quyền truy cập các tính năng AI trên Android cho bên thứ ba thay vì ưu tiên Gemini. Nếu không tuân thủ trước ngày 27/7, Google có thể bị phạt tới 10% doanh thu hàng năm trên toàn cầu.

Các mô hình OpenAI, Codex và tác nhân thông minh đã có mặt trên AWS

Nguồn: OpenAI: Tin chính thức (RSS - lọc nội dung doanh nghiệp/khách hàng) · Bài gốc

Các mô hình GPT, Codex và tác nhân thông minh của OpenAI đã chính thức lên nền tảng AWS. Người dùng doanh nghiệp hiện có thể tích hợp trực tiếp các dịch vụ AI này vào hạ tầng đám mây để xây dựng ứng dụng tùy chỉnh an toàn.

Google ký thỏa thuận AI với Lầu Năm Góc cho mục đích quân sự mật

Nguồn: X: Kim (@kimmonismus) · Bài gốc

Google đã ký thỏa thuận cho phép sử dụng các mô hình AI của mình cho mục đích quân sự mật, bất chấp sự phản đối từ nhân viên. Thỏa thuận này đánh dấu sự thay đổi lớn trong lập trường của công ty so với năm 2018.

Nghiên cứu / bài báo

VLAA-GUI: Giúp các tác nhân GUI biết cách 'dừng lại, khôi phục và tìm kiếm'

Nguồn: X: Shao Meng (@shao__meng) · Bài gốc

Nghiên cứu chỉ ra rằng nút thắt của các tác nhân GUI nằm ở thiết kế hệ thống thay vì năng lực mô hình. Khung VLAA-GUI giải quyết vấn đề này bằng cách tích hợp bộ xác thực STOP, bộ ngắt vòng lặp RECOVER và tác nhân SEARCH, giúp mô hình Opus 4.6 đạt tỷ lệ thành công 77,5%, vượt qua mức trung bình của con người.

Cập nhật 1 nghìn tỷ tham số trong vài giây: Công nghệ truyền trọng số ngang hàng trong học tăng cường phân tán quy mô lớn

Nguồn: LMSYS: Blog (Chatbot Arena ) · Bài gốc

Nhóm LMSYS đã phát triển cơ chế truyền trọng số ngang hàng (P2P) dựa trên RDMA cho SGLang, giúp rút ngắn thời gian truyền trọng số của mô hình Kimi-K2 từ 53 giây xuống còn 7,2 giây. Phương pháp này tối ưu hóa mạng lưới và cho phép máy chủ suy luận khôi phục quá trình triển khai nhanh hơn.

Alibaba DAMO Academy lần đầu tiên đạt được khả năng phát hiện ung thư ruột 'không cảm giác' trên toàn cầu

Nguồn: IT Home · Bài gốc

Mô hình AI DAMO COCA của Alibaba đã đạt được bước tiến trong việc sàng lọc ung thư ruột thông qua ảnh chụp CT mà không cần chuẩn bị ruột trước. Trong thử nghiệm trên 27.000 người, mô hình đạt độ nhạy 86,6% và độ đặc hiệu 99,8%, vượt trội hơn đáng kể so với các bác sĩ chẩn đoán hình ảnh.

Đánh giá năng lực nghiên cứu tin sinh học của Claude với BioMysteryBench

Nguồn: Anthropic: Research ( - Web) · Bài gốc

Anthropic đã phát triển BioMysteryBench để đánh giá khả năng phân tích dữ liệu thực tế và giải quyết các vấn đề nghiên cứu mở của Claude. Kết quả cho thấy năng lực khoa học của Claude đã đạt trình độ tương đương chuyên gia con người, thậm chí giải quyết được các vấn đề mà nhóm chuyên gia trước đó chưa tìm ra lời giải.

LaDiR: Tăng cường khả năng suy luận văn bản của LLM bằng mô hình khuếch tán tiềm ẩn

Nguồn: Apple Machine Learning Research · Bài gốc

Nhóm nghiên cứu giới thiệu khung suy luận LaDiR, kết hợp khả năng biểu diễn của không gian tiềm ẩn với sự tối ưu hóa lặp lại của mô hình khuếch tán. Phương pháp này cho phép mô hình xem xét và sửa đổi các lộ trình suy luận từ sớm, vượt qua giới hạn của giải mã tự hồi quy truyền thống.

Hình ảnh siêu âm thích ứng với AI NV-Raw2Insights-US dựa trên vật lý của NVIDIA

Nguồn: Hugging Face: Blog · Bài gốc

NVIDIA đã ra mắt mô hình AI NV-Raw2Insights-US trên Hugging Face, cho phép xử lý dữ liệu siêu âm thô để tạo ra hình ảnh chẩn đoán chất lượng cao theo thời gian thực. Bằng cách kết hợp các định luật vật lý với học sâu, mô hình giúp cải thiện đáng kể độ phân giải và hiệu suất tính toán cho thiết bị siêu âm.

FlashQLA: Nhân chú ý tuyến tính hợp nhất tối ưu cho GDN

Nguồn: Qwen: Blog Retrieval (API) · Bài gốc

FlashQLA giới thiệu các nhân chú ý tuyến tính được tối ưu hóa cho mạng giảm độ dốc, giúp cải thiện hiệu suất tính toán và quá trình lan truyền ngược, từ đó tăng tốc độ huấn luyện mô hình quy mô lớn.

Thực trạng và tương lai của các mô hình nền tảng AI trong quản lý ung thư

Nguồn: Nature: Machine Learning · Bài gốc

Các mô hình AI nền tảng đang cách mạng hóa việc tầm soát và điều trị ung thư. Tương lai của lĩnh vực này tập trung vào tích hợp đa phương thức, tăng cường khả năng suy luận và thúc đẩy tính mở để hỗ trợ chuyên gia y tế.

Thủ thuật / thực hành

Tối ưu hóa CLAUDE.md: Tập trung vào các quy tắc then chốt để nâng cao hiệu suất cộng tác AI

Nguồn: X: AI Notes (@AYi_AInotes) · Bài gốc

Thay vì viết các tệp CLAUDE.md dài dòng, người dùng nên tinh gọn nội dung trong khoảng 60-80 dòng, tập trung vào các lệnh quan trọng, sơ đồ kiến trúc và các quy tắc cấm để Claude hoạt động chính xác hơn.

Từ container đến AI: Lịch sử lặp lại của việc 'nhà đầu tư thua lỗ'

Nguồn: X: Vista (@vista8) · Bài gốc

Nhà đầu tư mạo hiểm Jerry Neumann cho rằng AI tạo sinh đang đi vào vết xe đổ của các làn sóng công nghệ trước đây, nơi quyền kiểm soát tập trung vào các tập đoàn lớn, khiến các nhà đầu tư nhỏ lẻ đối mặt với rủi ro thua lỗ cao.

Hướng dẫn tạo nhạc đệm trong 60 giây

Nguồn: X: Suno (@suno) · Bài gốc

Hướng dẫn nhanh cách tạo các bản nhạc đệm chỉ trong vòng 60 giây.

Ba câu hỏi cốt lõi trong kinh doanh giải pháp AI

Nguồn: Tomer Tunguz Blog (phân tích VC) · Bài gốc

Chiến lược bán hàng AI hiện đại chuyển dịch từ việc hỏi ngân sách phần mềm sang phân tích ngân sách lao động, nhằm chứng minh tiềm năng thay thế và tối ưu chi phí nhân sự của AI trong doanh nghiệp.

Chi phí mô hình Opus 4.7 tăng phổ biến từ 12-27%

Nguồn: X: OpenRouter (@OpenRouter) · Bài gốc

Nghiên cứu dữ liệu thị trường cho thấy chi phí của Opus 4.7 tăng từ 12-27%, ngoại trừ các câu lệnh ngắn thực tế lại có hiệu quả chi phí cao hơn.

Bốn lĩnh vực mà nhóm nghiên cứu Google ứng dụng công cụ hỗ trợ nghiên cứu thực nghiệm

Nguồn: Google Research: Blog (Web) · Bài gốc

Kể từ khi ra mắt công cụ Hỗ trợ Nghiên cứu Thực nghiệm (ERA), Google đã ứng dụng nó vào dịch tễ học, vũ trụ học, giám sát khí quyển và khoa học thần kinh, giúp các nhà khoa học tạo ra phần mềm chuyên gia có khả năng giải thích tốt hơn các mô hình hộp đen.

Cam kết của chúng tôi đối với sự an toàn của cộng đồng

Nguồn: OpenAI: Tin chính thức (RSS - lọc nội dung doanh nghiệp/khách hàng) · Bài gốc

OpenAI bảo vệ an toàn cho cộng đồng ChatGPT thông qua các cơ chế phòng thủ đa tầng, bao gồm rào chắn an toàn tích hợp, giám sát lạm dụng thời gian thực và hợp tác với các chuyên gia an ninh bên ngoài.