Nhật báo AI ngày 07/05/2026

SenseNova-U1 cập nhật tính năng chưng cất LoRA 8 bước, giảm NFE từ 100 xuống 8, giúp rút ngắn thời gian suy luận trên H100 từ 23 giây xuống còn 2 giây. Đồng thời, dự án hiện đã hỗ trợ ComfyUI với các quy trình làm việc sẵn có cho chỉnh sửa hình ảnh và tạo nội dung.

⚡ HÔM NAY CÓ GÌ HOT? (HIGHLIGHTS)

1. Phát hành / cập nhật mô hình (2 tin)
SenseNova-U1 ra mắt LoRA chưng cất 8 bước, tăng tốc độ suy luận đáng kể
2. Sản phẩm / ứng dụng (8 tin)
Grok Web ra mắt tính năng Connectors, tích hợp sâu với các ứng dụng hàng ngày
3. Tín hiệu ngành (8 tin)
DeepSeek được quỹ nhà nước dẫn đầu vòng gọi vốn, định giá vọt lên 45 tỷ USD
4. Nghiên cứu / bài báo (1 tin)
Từ nhận thức vị trí đến hiểu chức năng: Thiết lập chuẩn mực trí tuệ không gian cho mô hình ngôn ngữ đa phương thức
5. Thủ thuật / thực hành (8 tin)
Đội ngũ Warp mã nguồn mở 15 công cụ tăng tốc quy trình làm việc nội bộ 'Oz Skills'

Phát hành / cập nhật mô hình

SenseNova-U1 ra mắt LoRA chưng cất 8 bước, tăng tốc độ suy luận đáng kể

Nguồn: X: SenseTime SenseTime (@SenseTime_AI) · Bài gốc

SenseNova-U1 cập nhật tính năng chưng cất LoRA 8 bước, giảm NFE từ 100 xuống 8, giúp rút ngắn thời gian suy luận trên H100 từ 23 giây xuống còn 2 giây. Đồng thời, dự án hiện đã hỗ trợ ComfyUI với các quy trình làm việc sẵn có cho chỉnh sửa hình ảnh và tạo nội dung.

Doubao-Seed-2.0-lite: Mô hình hiểu toàn diện đầu tiên của gia đình AI Doubao

Nguồn: IT Home · Bài gốc

ByteDance ra mắt phiên bản nâng cấp Doubao-Seed-2.0-lite, mô hình đầu tiên hỗ trợ hiểu đồng nhất video, hình ảnh, âm thanh và văn bản. Mô hình này vượt trội hơn các phiên bản trước trong suy luận khoa học và đa phương thức, đồng thời hỗ trợ phiên dịch 19 ngôn ngữ với hiệu suất cạnh tranh so với Gemini-3.1-Pro.

Sản phẩm / ứng dụng

Grok Web ra mắt tính năng Connectors, tích hợp sâu với các ứng dụng hàng ngày

Nguồn: xAI: News (Web) · Bài gốc

xAI chính thức ra mắt tính năng Connectors trên Grok Web, cho phép tích hợp với các công cụ như SharePoint, Outlook, Google Workspace, Notion và GitHub. Người dùng có thể thực hiện các tác vụ như tóm tắt email, cập nhật slide hay quản lý lịch trực tiếp trong Grok mà không cần chuyển đổi ứng dụng.

Claude nâng giới hạn sử dụng và hợp tác tính toán với SpaceX

Nguồn: Anthropic: Newsroom (Web) · Bài gốc

Anthropic hợp tác với SpaceX để tận dụng siêu máy tính Colossus 1 với hơn 220.000 GPU NVIDIA, giúp tăng gấp đôi giới hạn sử dụng cho người dùng Claude Pro và Max. Công ty cũng đang mở rộng hạ tầng tính toán toàn cầu thông qua các thỏa thuận với Amazon, Google và Microsoft.

xAI ra mắt tính năng tạo và chỉnh sửa ảnh 'Quality Mode' cho Grok Imagine API

Nguồn: xAI: News (Web) · Bài gốc

xAI giới thiệu 'Quality Mode' cho Grok Imagine API, giúp cải thiện độ chân thực, khả năng hiển thị văn bản và kiểm soát sáng tạo. Dịch vụ này có giá từ 0,05 đến 0,07 USD mỗi ảnh, phù hợp cho các nhu cầu trực quan hóa sản phẩm và tạo nội dung tiếp thị.

Giới thiệu Tilde.run: Sandbox đại lý với hệ thống tệp có tính giao dịch và kiểm soát phiên bản

Nguồn: Hacker News Nổi bật (buzzing.cc bản dịch tiếng Trung) · Bài gốc

Tilde.run ra mắt sandbox cho phép thực thi mã trong môi trường an toàn với hệ thống tệp hỗ trợ giao dịch nguyên tử và lưu trữ lịch sử phiên bản đầy đủ, giúp tăng độ tin cậy cho các tác vụ tự động hóa.

Mã nguồn mở OrcaRouter-Lite: Công cụ định tuyến LLM tự lưu trữ giúp tối ưu chi phí

Nguồn: X: Kim (@kimmonismus) · Bài gốc

OrcaRouter-Lite là công cụ định tuyến LLM mã nguồn mở cho phép tự động chọn mô hình có chi phí thấp nhất và hỗ trợ bộ nhớ đệm cho các yêu cầu trùng lặp, giúp nhà phát triển tiết kiệm chi phí và thời gian xử lý.

Perplexity Agent API bổ sung tính năng tìm kiếm tài chính

Nguồn: X: Perplexity (@perplexity_ai) · Bài gốc

Perplexity Agent API hiện đã hỗ trợ tìm kiếm dữ liệu tài chính, cho phép các tác nhân AI truy cập vào bộ dữ liệu tài chính được cấp phép và dữ liệu thị trường thời gian thực chỉ với một lần gọi công cụ.

Ra mắt điểm số năng lực chuyên biệt và tính năng ECI tùy chỉnh

Nguồn: X: Epoch AI (@EpochAIResearch) · Bài gốc

Epoch AI giới thiệu hệ thống chấm điểm năng lực chuyên biệt cho các mô hình AI trong lĩnh vực kỹ thuật phần mềm và toán học, đồng thời hỗ trợ người dùng tạo các biến thể ECI tùy chỉnh.

Đại lý hiện có thể tạo tài khoản Cloudflare, mua tên miền và triển khai dự án

Nguồn: Hacker News Nổi bật (buzzing.cc bản dịch tiếng Trung) · Bài gốc

Cloudflare cho phép các đối tác đại lý quản lý toàn diện từ việc tạo tài khoản, đăng ký tên miền đến triển khai dịch vụ, giúp đơn giản hóa quy trình vận hành và tăng cường hiệu suất làm việc.

Tín hiệu ngành

DeepSeek được quỹ nhà nước dẫn đầu vòng gọi vốn, định giá vọt lên 45 tỷ USD

Nguồn: X: Berry Xia (@berryxia) · Bài gốc

Định giá của DeepSeek tăng từ 20 tỷ lên 45 tỷ USD chỉ trong vài tuần với sự tham gia của quỹ đầu tư quốc gia, đánh dấu bước ngoặt quan trọng khi AI được đưa vào chiến lược bán dẫn quốc gia.

xAI sẽ sáp nhập vào SpaceX để trở thành SpaceXAI

Nguồn: X: Rohan Paul (@rohanpaul_ai) · Bài gốc

Công ty xAI đang trong quá trình chuyển đổi để trở thành một phần của SpaceX dưới tên gọi SpaceXAI.

Moonshot AI hoàn tất vòng gọi vốn 2 tỷ USD, định giá vượt mốc 20 tỷ USD

Nguồn: X: Nathan Lambert (@natolambert) · Bài gốc

Moonshot AI trở thành startup AI huy động vốn cao nhất Trung Quốc với định giá tăng gấp 4 lần, nhờ sự tăng trưởng mạnh mẽ của sản phẩm Kimi và doanh thu định kỳ.

Hy3 bản xem trước dẫn đầu bảng xếp hạng tuần với mức tăng trưởng 298%

Nguồn: X: Tencent Hunyuan (@TencentHunyuan) · Bài gốc

Chỉ sau hai tuần ra mắt, Hy3 đã chiếm vị trí số 1 trên OpenRouter về lưu lượng xử lý, trở thành công cụ được ưa chuộng trong các ứng dụng lập trình và đại lý AI.

PayPal khởi động kế hoạch tái cấu trúc bằng AI, dự kiến cắt giảm 20% nhân sự

Nguồn: IT Home · Bài gốc

PayPal đặt mục tiêu tiết kiệm 1,5 tỷ USD trong 3 năm tới thông qua việc tinh gọn bộ máy và ứng dụng AI để hiện đại hóa hạ tầng công nghệ.

Uber hợp tác với OpenAI để tối ưu hóa thu nhập cho tài xế và trải nghiệm đặt xe

Nguồn: OpenAI: Tin chính thức (RSS - lọc nội dung doanh nghiệp/khách hàng) · Bài gốc

Uber tích hợp công nghệ của OpenAI vào nền tảng để hỗ trợ tài xế lập kế hoạch đón khách thông minh hơn và giúp hành khách đặt xe nhanh chóng hơn.

Google DeepMind hợp tác với EVE Online để nghiên cứu các hệ thống thông minh phức tạp

Nguồn: X: Testing Catalog (@testingcatalog) · Bài gốc

Google DeepMind hợp tác với Fenris Creations để sử dụng môi trường trò chơi EVE Online làm nơi thử nghiệm AI, tập trung vào việc nghiên cứu trí tuệ trong các hệ thống năng động và do người chơi điều khiển.

Sinh viên khóa 2026 của 'Lớp học tương lai ChatGPT' công bố các thành tựu ứng dụng AI

Nguồn: X: OpenAI (@OpenAI) · Bài gốc

Nhóm 26 sinh viên tốt nghiệp đại học đã sử dụng ChatGPT trong suốt 4 năm học để đạt được các thành tựu như: phát hiện 1,5 triệu thiên thể mới, hỗ trợ tìm kiếm người sống sót sau thảm họa và bảo tồn các ngôn ngữ đang bị đe dọa.

Nghiên cứu / bài báo

Từ nhận thức vị trí đến hiểu chức năng: Thiết lập chuẩn mực trí tuệ không gian cho mô hình ngôn ngữ đa phương thức

Nguồn: Apple Machine Learning Research · Bài gốc

Nhóm nghiên cứu giới thiệu SFI-Bench, một bộ tiêu chuẩn đánh giá khả năng suy luận không gian cao cấp của các mô hình đa phương thức, giúp chuyển đổi việc đánh giá từ mức độ hình học sang mức độ hiểu ý định chức năng.

Thủ thuật / thực hành

Đội ngũ Warp mã nguồn mở 15 công cụ tăng tốc quy trình làm việc nội bộ 'Oz Skills'

Nguồn: X: Shao Meng (@shao__meng) · Bài gốc

Warp đã chia sẻ 15 công cụ tối ưu hóa quy trình làm việc cho cộng đồng, bao gồm các lĩnh vực như cộng tác Git/GitHub, phân tích dữ liệu, kiểm định chất lượng web và quản lý hạ tầng.

Boris Cherny, người tạo ra Claude Code, công khai quy trình làm việc và trình diễn lập trình trên điện thoại

Nguồn: X: AI Notes (@AYi_AInotes) · Bài gốc

Boris Cherny chia sẻ phương pháp lập trình hiệu quả bằng cách sử dụng các mô hình AI mạnh nhất, duy trì cơ sở tri thức tập trung và cho phép AI tự kiểm tra kết quả thực thi mã nguồn ngay trên thiết bị di động.

Ranh giới lập trình mờ nhạt: Sự hòa trộn và những lo ngại giữa 'lập trình cảm tính' và 'kỹ thuật đại lý'

Nguồn: Simon Willison Blog · Bài gốc

Tác giả phân tích sự giao thoa giữa việc tin tưởng hoàn toàn vào AI và kỹ thuật phần mềm chuyên nghiệp, đồng thời cảnh báo về rủi ro tiềm ẩn khi các chỉ số đánh giá chất lượng phần mềm truyền thống không còn đáng tin cậy.

Thầy Yao chia sẻ bộ sưu tập hơn 100 câu lệnh AI thực tế cho công việc

Nguồn: X: Vista (@vista8) · Bài gốc

Thầy Yao đã tổng hợp và công khai bộ sưu tập hơn 100 câu lệnh (prompt) thực chiến, bao gồm 9 lĩnh vực như công việc, học tập, lập trình và marketing, giúp người dùng dễ dàng áp dụng vào các tình huống kinh doanh thực tế.

Hướng dẫn di chuyển chính thức của OpenAI Codex: Nhập dữ liệu Agent chỉ với một cú nhấp chuột

Nguồn: X: Shao Meng (@shao__meng) · Bài gốc

OpenAI ra mắt giải pháp di chuyển dữ liệu từ các AI Coding Agent khác sang Codex, hỗ trợ tự động hóa cấu hình và lịch sử hội thoại. Người dùng cần kiểm tra kỹ quyền truy cập công cụ và các thiết lập chuyên biệt sau khi di chuyển.

Kiến trúc LLM mã nguồn mở năm 2026: 90% thiết kế đã được chuẩn hóa

Nguồn: X: Berry Xia (@berryxia) · Bài gốc

Khóa học CS336 của Stanford chỉ ra rằng kiến trúc LLM đã đạt đến sự đồng nhất cao với các tiêu chuẩn như RoPE, SwiGLU và GQA, tạo thành một khuôn mẫu mặc định cho các mô hình trong tương lai.

Qt ra mắt kỹ năng phân tích mã nguồn bằng AI để chẩn đoán lỗi giật lag phần mềm

Nguồn: IT Home · Bài gốc

Qt giới thiệu công cụ phân tích QML giúp AI tự động chẩn đoán các vấn đề về hiệu năng, render và bộ nhớ cho ứng dụng Qt Quick, tương thích tốt với các mô hình như Claude, GPT và Gemini.

Lập trình viên tích hợp thư viện Canvas để ghép ảnh trực tiếp trong trình soạn thảo Markdown

Nguồn: X: Vista (@vista8) · Bài gốc

Giải pháp mới cho phép người dùng ghép nhiều ảnh trực tiếp trong trình soạn thảo Markdown bằng thư viện HTML5 Canvas, giúp loại bỏ sự cồng kềnh của các công cụ thiết kế bên ngoài.