04/07 03/07 02/07 01/07 30/06 29/06 28/06 27/06 26/06 25/06

Nhật báo AI ngày 15/05/2026

Đội ngũ của SenseTime do Tiến sĩ Li Mu dẫn dắt đã công bố báo cáo kỹ thuật và mở mã nguồn mô hình SenseNova U1 dựa trên kiến trúc hỗn hợp chuyên gia (MoE). Động thái này nhằm thúc đẩy tính minh bạch và khả năng tái lập trong cộng đồng nghiên cứu AI.

⚡ HÔM NAY CÓ GÌ HOT? (HIGHLIGHTS)

1. Phát hành / cập nhật mô hình (4 tin)

Công bố báo cáo kỹ thuật SenseNova U1, mở mã nguồn mô hình kiến trúc MoE

2. Sản phẩm / ứng dụng (8 tin)

Kimi ra mắt tiện ích mở rộng Web Bridge, hỗ trợ tương tác đa nền tảng

3. Tín hiệu ngành (7 tin)

Anthropic hợp tác 200 triệu USD với Quỹ Gates vì sức khỏe và giáo dục toàn cầu

4. Nghiên cứu / bài báo (2 tin)

NousResearch ra mắt công nghệ Token Superposition Training giúp tăng tốc huấn luyện LLM

5. Thủ thuật / thực hành (8 tin)

Bổ sung tính năng tóm tắt nhóm chat WeChat thông qua baoyu-skills

Phát hành / cập nhật mô hình

Công bố báo cáo kỹ thuật SenseNova U1, mở mã nguồn mô hình kiến trúc MoE

Nguồn: X: SenseTime SenseTime (@SenseTime_AI) · Bài gốc

Granite Embedding Multilingual R2: Mô hình nhúng đa ngôn ngữ với ngữ cảnh 32K

Nguồn: Hugging Face: Blog · Bài gốc

IBM Granite ra mắt mô hình nhúng văn bản đa ngôn ngữ mới trên Hugging Face với dung lượng dưới 100 triệu tham số. Mô hình đạt hiệu suất dẫn đầu trong các bài kiểm tra MTEB, hỗ trợ ngữ cảnh 32K và được phát hành theo giấy phép Apache 2.0.

Ra mắt mô hình inclusionAI/Ring-2.6-1T

Nguồn: Ant Group inclusionAI: HuggingFace mô hình mới · Bài gốc

InclusionAI giới thiệu mô hình Ring-2.6-1T với kết quả ấn tượng trên bảng xếp hạng Claw-Eval, đạt 58,4 điểm về năng lực tổng quát và 86,8 điểm trong các bài kiểm tra hội thoại đa vòng.

Kimi K2.6 dẫn đầu bảng xếp hạng tác tử tài chính

Nguồn: X: Kimi.ai (@Kimi_Moonshot) · Bài gốc

Mô hình Kimi K2.6 của Moonshot AI đã vươn lên vị trí số 1 trên bảng xếp hạng Finance Agent Benchmark V2, khẳng định năng lực vượt trội trong các tác vụ phân tích tài chính.

Sản phẩm / ứng dụng

Kimi ra mắt tiện ích mở rộng Web Bridge, hỗ trợ tương tác đa nền tảng

Nguồn: X: Kimi.ai (@Kimi_Moonshot) · Bài gốc

Kimi Web Bridge cho phép các tác nhân AI tương tác với trang web như con người, bao gồm tìm kiếm, cuộn, nhấp chuột và nhập liệu. Tiện ích hiện hỗ trợ các nền tảng như Claude Code, Cursor, Codex và đã có mặt trên Chrome Web Store.

Sử dụng Codex mọi lúc mọi nơi

Nguồn: OpenAI: Tin chính thức (RSS - lọc nội dung doanh nghiệp/khách hàng) · Bài gốc

Người dùng hiện có thể truy cập Codex thông qua ứng dụng di động ChatGPT, hỗ trợ giám sát, hướng dẫn và phê duyệt các tác vụ lập trình theo thời gian thực trên nhiều thiết bị.

OpenCode và Qwen 3.6 Plus tiếp tục mở miễn phí

Nguồn: X: opencode (@opencode) · Bài gốc

Sau khi nhận được phản hồi tích cực từ người dùng, OpenCode đã bổ sung thêm tài nguyên GPU để tiếp tục cung cấp miễn phí phiên bản OpenCode x Qwen 3.6 Plus.

Codex ra mắt tính năng tự động hóa Hooks và mã thông báo lập trình

Nguồn: X: OpenAI Developers (@OpenAIDevs) · Bài gốc

Codex bổ sung tính năng 'Hooks' để chạy tập lệnh tại các điểm quan trọng và 'Mã thông báo truy cập lập trình' giúp doanh nghiệp tích hợp CI/CD, tự động hóa quy trình làm việc một cách bảo mật.

Luma Agents tối ưu hóa quy trình tạo nội dung thương mại điện tử

Nguồn: X: Luma AI (@LumaLabsAI) · Bài gốc

Luma Agents giúp tự động hóa toàn bộ quy trình tạo tài liệu quảng cáo thương mại điện tử từ khâu xác định nhu cầu đến thiết lập phong cách, loại bỏ các rào cản sản xuất.

SuperGrok Heavy giảm giá 60%, Grok Build mở bản thử nghiệm

Nguồn: X: cb_doge (@cb_doge) · Bài gốc

SuperGrok Heavy hiện có ưu đãi giảm giá 60% cho gói 6 tháng (còn 99 USD/tháng) và người dùng có thể bắt đầu trải nghiệm phiên bản thử nghiệm của Grok Build.

xAI ra mắt phiên bản thử nghiệm sớm Grok Build

Nguồn: xAI: News (Web) · Bài gốc

xAI giới thiệu Grok Build, một công cụ dòng lệnh và tác nhân lập trình chạy trực tiếp trên terminal dành cho người dùng SuperGrok Heavy, hỗ trợ lập kế hoạch chi tiết và tích hợp quy trình làm việc chuyên nghiệp.

Công cụ mã nguồn mở html-anything hỗ trợ AI tạo HTML chất lượng cao

Nguồn: X: Xiaohu (@xiaohu) · Bài gốc

Dự án mã nguồn mở html-anything giúp các tác nhân AI chuyển đổi dữ liệu thành mã HTML chuyên nghiệp, hỗ trợ 75 kỹ năng và tương thích với nhiều tác nhân tạo mã như Claude Code, Codex.

Tín hiệu ngành

Anthropic hợp tác 200 triệu USD với Quỹ Gates vì sức khỏe và giáo dục toàn cầu

Nguồn: Anthropic: Newsroom (Web) · Bài gốc

Anthropic và Quỹ Gates ký thỏa thuận 4 năm nhằm ứng dụng Claude vào y tế, nghiên cứu vắc-xin và phát triển công cụ giảng dạy AI cho học sinh tại Mỹ, châu Phi và Ấn Độ.

OpenEvidence đạt độ phủ 65% bác sĩ Mỹ, mô hình 'AI bóng tối' gây chú ý

Nguồn: X: Xiaobei (@frxiaobei) · Bài gốc

Nền tảng OpenEvidence đã được 65% bác sĩ tại Mỹ tự nguyện sử dụng trong lâm sàng, tạo ra một làn sóng 'AI bóng tối' khi các bệnh viện chỉ bắt đầu hợp tác chính thức sau khi công nghệ này đã phổ biến ở cấp cơ sở.

OpenAI đối mặt với vụ kiện tập thể vì cáo buộc rò rỉ dữ liệu người dùng cho Meta

Nguồn: X: AI Notes (@AYi_AInotes) · Bài gốc

OpenAI bị kiện vì cáo buộc nhúng mã theo dõi Facebook Pixel, khiến các truy vấn nhạy cảm của người dùng bị gửi tới Meta, làm dấy lên lo ngại về quyền riêng tư trên các dịch vụ AI miễn phí.

Baidu đẩy mạnh phát triển hệ sinh thái tác nhân AI với chỉ số người dùng hàng ngày

Nguồn: X: Baidu Baidu (@Baidu_Inc) · Bài gốc

Baidu tập trung vào kỷ nguyên tác nhân AI và coi số lượng tác nhân hoạt động hàng ngày là chỉ số đo lường hiệu quả quan trọng nhất.

Cơn sốt AI gây phẫn nộ: 70% người Mỹ phản đối xây dựng trung tâm dữ liệu gần khu dân cư

Nguồn: IT Home · Bài gốc

Khảo sát của Gallup cho thấy đa số người dân Mỹ phản đối việc đặt trung tâm dữ liệu gần nhà do lo ngại về chi phí điện năng, ô nhiễm và tiêu thụ tài nguyên, khiến nhiều dự án bị đình trệ.

MiMo V2.5 Pro giành giải ba tại Design Arena

Nguồn: X: Xiaomi MiMo (@XiaomiMiMo) · Bài gốc

MiMo V2.5 Pro đã thăng hạng đáng kể trên bảng xếp hạng tổng thể và đạt hiệu suất ngang ngửa Claude Sonnet 4.6 trong các tác vụ lập trình giao diện.

Runway tiến quân vào thị trường Nhật Bản với khoản đầu tư 40 triệu USD

Nguồn: X: Runway (@runwayml) · Bài gốc

Runway mở văn phòng tại Tokyo sau khi chứng kiến sự tăng trưởng mạnh mẽ tại Nhật Bản, nhằm hợp tác sâu rộng hơn với các doanh nghiệp trong ngành game và truyền thông.

Nghiên cứu / bài báo

NousResearch ra mắt công nghệ Token Superposition Training giúp tăng tốc huấn luyện LLM

Nguồn: X: SiliconFlow SiliconFlow (@SiliconFlowAI) · Bài gốc

Công nghệ mới này cho phép tăng tốc quá trình tiền huấn luyện mô hình ngôn ngữ lớn gấp 2-3 lần mà không cần thay đổi kiến trúc hay dữ liệu đầu vào.

Dạy các mô hình thị giác - ngôn ngữ sử dụng 'ngôn ngữ điện ảnh'

Nguồn: CMU: Machine Learning Blog · Bài gốc

Nghiên cứu đạt giải tại CVPR 2026 đề xuất phương pháp cải thiện khả năng hiểu và tạo video chuyên nghiệp thông qua việc nâng cao chất lượng giám sát từ con người.

Thủ thuật / thực hành

Bổ sung tính năng tóm tắt nhóm chat WeChat thông qua baoyu-skills

Nguồn: X: Baoyu (@dotey) · Bài gốc

Công cụ mới cho phép tóm tắt nội dung nhóm chat WeChat bằng cách kết hợp với wx-cli, đạt hiệu quả tối ưu khi sử dụng cùng Claude Code và Claude Opus 4.6.

UnslothAI phát hành mô hình Qwen3.6 MTP GGUF, tăng tốc độ suy luận đáng kể

Nguồn: X: Berry Xia (@berryxia) · Bài gốc

UnslothAI đã ra mắt mô hình Qwen3.6 MTP GGUF thử nghiệm, giúp tăng tốc độ suy luận lên gấp 1,4 lần mà không làm giảm độ chính xác. Phiên bản 35B-A3B đạt tốc độ ấn tượng 220 token mỗi giây trên một GPU duy nhất nhờ tối ưu hóa kỹ thuật giải mã dự đoán.

Claude Code và kỹ năng 'Codebook': Phương pháp rèn luyện kỹ năng lập trình mục tiêu

Nguồn: Hacker News Nổi bật (buzzing.cc bản dịch tiếng Trung) · Bài gốc

Một công cụ GitHub mới giúp lập trình viên rèn luyện kỹ năng thông qua việc sử dụng AI để tạo ra các ví dụ và giải thích mã nguồn cụ thể. Dự án này chuyển đổi việc học tập truyền thống thành mô hình luyện tập có cấu trúc, giúp nâng cao hiệu quả đào tạo kỹ năng.

Cẩm nang sáng lập: Xây dựng công ty khởi nghiệp AI-native

Nguồn: Claude: Blog (Web) · Bài gốc

Anthropic phát hành hướng dẫn thực tế cho các startup AI, tập trung vào việc tối ưu hóa quy trình từ khâu ý tưởng đến quy mô hóa. Tài liệu cung cấp các chiến lược sử dụng Claude để xác thực vấn đề và xây dựng quy trình làm việc thông minh thay vì thao tác thủ công.

Tencent mở mã nguồn Agent Memory: Giảm 61% mức tiêu thụ Token

Nguồn: IT Home · Bài gốc

Tencent Cloud giới thiệu giải pháp TencentDB Agent Memory giúp giải quyết vấn đề đầy cửa sổ ngữ cảnh và chi phí Token cao. Bằng cách sử dụng kỹ thuật 'giải phóng ngữ cảnh' và sơ đồ tác vụ Mermaid, hệ thống giúp giảm đáng kể lượng Token tiêu thụ trong các tác vụ dài.

Sử dụng Claude Code hiệu quả trong các kho mã nguồn lớn: Hướng dẫn và thực tiễn tốt nhất

Nguồn: Claude: Blog (Web) · Bài gốc

Claude Code hỗ trợ điều hướng các kho mã nguồn khổng lồ thông qua bộ công cụ chuyên dụng thay vì chỉ dựa vào mô hình AI. Hệ thống hoạt động trực tiếp trên mã nguồn cục bộ, giúp tránh các vấn đề về chỉ mục lỗi thời thường gặp trong các hệ thống RAG truyền thống.

Dự án mã nguồn mở OpenSquilla: Định tuyến thông minh và truy xuất cục bộ giúp giảm chi phí sử dụng LLM

Nguồn: X: Vista (@vista8) · Bài gốc

OpenSquilla tối ưu hóa chi phí LLM bằng cách tự động định tuyến các tác vụ đơn giản đến mô hình giá rẻ và chỉ dùng mô hình mạnh cho tác vụ phức tạp. Hệ thống giúp giảm hơn 90% lượng Token truyền tải nhờ cơ chế bộ nhớ thông minh và truy xuất cục bộ.

Nhà sáng lập Moonshot AI chia sẻ video 40 phút về quá trình huấn luyện mô hình

Nguồn: X: Berry Xia (@berryxia) · Bài gốc

Yang Zhilin tiết lộ cách Kimi K2 đánh bại các đối thủ như GPT-5.5 với chi phí chỉ 4,6 triệu USD nhờ tối ưu hóa kiến trúc, chứng minh các đội ngũ nhỏ có thể vượt mặt các tập đoàn lớn bằng tư duy thiết kế thông minh.