Nhật báo AI ngày 07/05/2026
SenseNova-U1 cập nhật tính năng chưng cất LoRA 8 bước, giảm NFE từ 100 xuống 8, giúp rút ngắn thời gian suy luận trên H100 từ 23 giây xuống còn 2 giây. Đồng thời, dự án hiện đã hỗ trợ ComfyUI với các quy trình làm việc sẵn có cho chỉnh sửa hình ảnh và tạo nội dung.
⚡ HÔM NAY CÓ GÌ HOT? (HIGHLIGHTS)
Phát hành / cập nhật mô hình
SenseNova-U1 ra mắt LoRA chưng cất 8 bước, tăng tốc độ suy luận đáng kể
SenseNova-U1 cập nhật tính năng chưng cất LoRA 8 bước, giảm NFE từ 100 xuống 8, giúp rút ngắn thời gian suy luận trên H100 từ 23 giây xuống còn 2 giây. Đồng thời, dự án hiện đã hỗ trợ ComfyUI với các quy trình làm việc sẵn có cho chỉnh sửa hình ảnh và tạo nội dung.
Doubao-Seed-2.0-lite: Mô hình hiểu toàn diện đầu tiên của gia đình AI Doubao
ByteDance ra mắt phiên bản nâng cấp Doubao-Seed-2.0-lite, mô hình đầu tiên hỗ trợ hiểu đồng nhất video, hình ảnh, âm thanh và văn bản. Mô hình này vượt trội hơn các phiên bản trước trong suy luận khoa học và đa phương thức, đồng thời hỗ trợ phiên dịch 19 ngôn ngữ với hiệu suất cạnh tranh so với Gemini-3.1-Pro.
Sản phẩm / ứng dụng
Grok Web ra mắt tính năng Connectors, tích hợp sâu với các ứng dụng hàng ngày
xAI chính thức ra mắt tính năng Connectors trên Grok Web, cho phép tích hợp với các công cụ như SharePoint, Outlook, Google Workspace, Notion và GitHub. Người dùng có thể thực hiện các tác vụ như tóm tắt email, cập nhật slide hay quản lý lịch trực tiếp trong Grok mà không cần chuyển đổi ứng dụng.
Claude nâng giới hạn sử dụng và hợp tác tính toán với SpaceX
Anthropic hợp tác với SpaceX để tận dụng siêu máy tính Colossus 1 với hơn 220.000 GPU NVIDIA, giúp tăng gấp đôi giới hạn sử dụng cho người dùng Claude Pro và Max. Công ty cũng đang mở rộng hạ tầng tính toán toàn cầu thông qua các thỏa thuận với Amazon, Google và Microsoft.
xAI ra mắt tính năng tạo và chỉnh sửa ảnh 'Quality Mode' cho Grok Imagine API
xAI giới thiệu 'Quality Mode' cho Grok Imagine API, giúp cải thiện độ chân thực, khả năng hiển thị văn bản và kiểm soát sáng tạo. Dịch vụ này có giá từ 0,05 đến 0,07 USD mỗi ảnh, phù hợp cho các nhu cầu trực quan hóa sản phẩm và tạo nội dung tiếp thị.
Giới thiệu Tilde.run: Sandbox đại lý với hệ thống tệp có tính giao dịch và kiểm soát phiên bản
Tilde.run ra mắt sandbox cho phép thực thi mã trong môi trường an toàn với hệ thống tệp hỗ trợ giao dịch nguyên tử và lưu trữ lịch sử phiên bản đầy đủ, giúp tăng độ tin cậy cho các tác vụ tự động hóa.
Mã nguồn mở OrcaRouter-Lite: Công cụ định tuyến LLM tự lưu trữ giúp tối ưu chi phí
OrcaRouter-Lite là công cụ định tuyến LLM mã nguồn mở cho phép tự động chọn mô hình có chi phí thấp nhất và hỗ trợ bộ nhớ đệm cho các yêu cầu trùng lặp, giúp nhà phát triển tiết kiệm chi phí và thời gian xử lý.
Perplexity Agent API bổ sung tính năng tìm kiếm tài chính
Perplexity Agent API hiện đã hỗ trợ tìm kiếm dữ liệu tài chính, cho phép các tác nhân AI truy cập vào bộ dữ liệu tài chính được cấp phép và dữ liệu thị trường thời gian thực chỉ với một lần gọi công cụ.
Ra mắt điểm số năng lực chuyên biệt và tính năng ECI tùy chỉnh
Epoch AI giới thiệu hệ thống chấm điểm năng lực chuyên biệt cho các mô hình AI trong lĩnh vực kỹ thuật phần mềm và toán học, đồng thời hỗ trợ người dùng tạo các biến thể ECI tùy chỉnh.
Đại lý hiện có thể tạo tài khoản Cloudflare, mua tên miền và triển khai dự án
Cloudflare cho phép các đối tác đại lý quản lý toàn diện từ việc tạo tài khoản, đăng ký tên miền đến triển khai dịch vụ, giúp đơn giản hóa quy trình vận hành và tăng cường hiệu suất làm việc.
Tín hiệu ngành
DeepSeek được quỹ nhà nước dẫn đầu vòng gọi vốn, định giá vọt lên 45 tỷ USD
Định giá của DeepSeek tăng từ 20 tỷ lên 45 tỷ USD chỉ trong vài tuần với sự tham gia của quỹ đầu tư quốc gia, đánh dấu bước ngoặt quan trọng khi AI được đưa vào chiến lược bán dẫn quốc gia.
xAI sẽ sáp nhập vào SpaceX để trở thành SpaceXAI
Công ty xAI đang trong quá trình chuyển đổi để trở thành một phần của SpaceX dưới tên gọi SpaceXAI.
Moonshot AI hoàn tất vòng gọi vốn 2 tỷ USD, định giá vượt mốc 20 tỷ USD
Moonshot AI trở thành startup AI huy động vốn cao nhất Trung Quốc với định giá tăng gấp 4 lần, nhờ sự tăng trưởng mạnh mẽ của sản phẩm Kimi và doanh thu định kỳ.
Hy3 bản xem trước dẫn đầu bảng xếp hạng tuần với mức tăng trưởng 298%
Chỉ sau hai tuần ra mắt, Hy3 đã chiếm vị trí số 1 trên OpenRouter về lưu lượng xử lý, trở thành công cụ được ưa chuộng trong các ứng dụng lập trình và đại lý AI.
PayPal khởi động kế hoạch tái cấu trúc bằng AI, dự kiến cắt giảm 20% nhân sự
PayPal đặt mục tiêu tiết kiệm 1,5 tỷ USD trong 3 năm tới thông qua việc tinh gọn bộ máy và ứng dụng AI để hiện đại hóa hạ tầng công nghệ.
Uber hợp tác với OpenAI để tối ưu hóa thu nhập cho tài xế và trải nghiệm đặt xe
Uber tích hợp công nghệ của OpenAI vào nền tảng để hỗ trợ tài xế lập kế hoạch đón khách thông minh hơn và giúp hành khách đặt xe nhanh chóng hơn.
Google DeepMind hợp tác với EVE Online để nghiên cứu các hệ thống thông minh phức tạp
Google DeepMind hợp tác với Fenris Creations để sử dụng môi trường trò chơi EVE Online làm nơi thử nghiệm AI, tập trung vào việc nghiên cứu trí tuệ trong các hệ thống năng động và do người chơi điều khiển.
Sinh viên khóa 2026 của 'Lớp học tương lai ChatGPT' công bố các thành tựu ứng dụng AI
Nhóm 26 sinh viên tốt nghiệp đại học đã sử dụng ChatGPT trong suốt 4 năm học để đạt được các thành tựu như: phát hiện 1,5 triệu thiên thể mới, hỗ trợ tìm kiếm người sống sót sau thảm họa và bảo tồn các ngôn ngữ đang bị đe dọa.
Nghiên cứu / bài báo
Từ nhận thức vị trí đến hiểu chức năng: Thiết lập chuẩn mực trí tuệ không gian cho mô hình ngôn ngữ đa phương thức
Nhóm nghiên cứu giới thiệu SFI-Bench, một bộ tiêu chuẩn đánh giá khả năng suy luận không gian cao cấp của các mô hình đa phương thức, giúp chuyển đổi việc đánh giá từ mức độ hình học sang mức độ hiểu ý định chức năng.
Thủ thuật / thực hành
Đội ngũ Warp mã nguồn mở 15 công cụ tăng tốc quy trình làm việc nội bộ 'Oz Skills'
Warp đã chia sẻ 15 công cụ tối ưu hóa quy trình làm việc cho cộng đồng, bao gồm các lĩnh vực như cộng tác Git/GitHub, phân tích dữ liệu, kiểm định chất lượng web và quản lý hạ tầng.
Boris Cherny, người tạo ra Claude Code, công khai quy trình làm việc và trình diễn lập trình trên điện thoại
Boris Cherny chia sẻ phương pháp lập trình hiệu quả bằng cách sử dụng các mô hình AI mạnh nhất, duy trì cơ sở tri thức tập trung và cho phép AI tự kiểm tra kết quả thực thi mã nguồn ngay trên thiết bị di động.
Ranh giới lập trình mờ nhạt: Sự hòa trộn và những lo ngại giữa 'lập trình cảm tính' và 'kỹ thuật đại lý'
Tác giả phân tích sự giao thoa giữa việc tin tưởng hoàn toàn vào AI và kỹ thuật phần mềm chuyên nghiệp, đồng thời cảnh báo về rủi ro tiềm ẩn khi các chỉ số đánh giá chất lượng phần mềm truyền thống không còn đáng tin cậy.
Thầy Yao chia sẻ bộ sưu tập hơn 100 câu lệnh AI thực tế cho công việc
Thầy Yao đã tổng hợp và công khai bộ sưu tập hơn 100 câu lệnh (prompt) thực chiến, bao gồm 9 lĩnh vực như công việc, học tập, lập trình và marketing, giúp người dùng dễ dàng áp dụng vào các tình huống kinh doanh thực tế.
Hướng dẫn di chuyển chính thức của OpenAI Codex: Nhập dữ liệu Agent chỉ với một cú nhấp chuột
OpenAI ra mắt giải pháp di chuyển dữ liệu từ các AI Coding Agent khác sang Codex, hỗ trợ tự động hóa cấu hình và lịch sử hội thoại. Người dùng cần kiểm tra kỹ quyền truy cập công cụ và các thiết lập chuyên biệt sau khi di chuyển.
Kiến trúc LLM mã nguồn mở năm 2026: 90% thiết kế đã được chuẩn hóa
Khóa học CS336 của Stanford chỉ ra rằng kiến trúc LLM đã đạt đến sự đồng nhất cao với các tiêu chuẩn như RoPE, SwiGLU và GQA, tạo thành một khuôn mẫu mặc định cho các mô hình trong tương lai.
Qt ra mắt kỹ năng phân tích mã nguồn bằng AI để chẩn đoán lỗi giật lag phần mềm
Qt giới thiệu công cụ phân tích QML giúp AI tự động chẩn đoán các vấn đề về hiệu năng, render và bộ nhớ cho ứng dụng Qt Quick, tương thích tốt với các mô hình như Claude, GPT và Gemini.
Lập trình viên tích hợp thư viện Canvas để ghép ảnh trực tiếp trong trình soạn thảo Markdown
Giải pháp mới cho phép người dùng ghép nhiều ảnh trực tiếp trong trình soạn thảo Markdown bằng thư viện HTML5 Canvas, giúp loại bỏ sự cồng kềnh của các công cụ thiết kế bên ngoài.