Nhật báo AI ngày 12/05/2026

Mô hình tạo ảnh SenseNova U1 hiện đã hỗ trợ ComfyUI với khả năng suy luận nhanh chỉ trong 8 bước, phù hợp cho nhiều tác vụ từ chân dung đến thiết kế sinh học. Các tài nguyên triển khai đã được công khai trên Hugging Face, GitHub và Discord.

⚡ HÔM NAY CÓ GÌ HOT? (HIGHLIGHTS)

1. Phát hành / cập nhật mô hình (3 tin)
Mô hình tạo ảnh SenseNova U1 đã có mặt trên nền tảng ComfyUI
2. Sản phẩm / ứng dụng (8 tin)
Anthropic mở mã nguồn bộ khung AI tài chính, thiết lập tiêu chuẩn mới cho ngành
3. Tín hiệu ngành (6 tin)
OpenAI ra mắt DeployCo để hỗ trợ doanh nghiệp xây dựng giải pháp AI
4. Nghiên cứu / bài báo (3 tin)
Mô hình nhỏ nhưng trí tuệ lớn: Nghiên cứu mới về khả năng điều phối AI
5. Thủ thuật / thực hành (8 tin)
Sử dụng LLM trực tiếp trong dòng shebang của tập lệnh

Phát hành / cập nhật mô hình

Mô hình tạo ảnh SenseNova U1 đã có mặt trên nền tảng ComfyUI

Nguồn: X: SenseTime SenseTime (@SenseTime_AI) · Bài gốc

Mô hình tạo ảnh SenseNova U1 hiện đã hỗ trợ ComfyUI với khả năng suy luận nhanh chỉ trong 8 bước, phù hợp cho nhiều tác vụ từ chân dung đến thiết kế sinh học. Các tài nguyên triển khai đã được công khai trên Hugging Face, GitHub và Discord.

AntLingAGI ra mắt mô hình tư duy Ring-2.6-1T với hàng nghìn tỷ tham số

Nguồn: X: OpenRouter (@OpenRouter) · Bài gốc

Ring-2.6-1T là mô hình flagship mới của AntLingAGI, nổi bật với khả năng điều chỉnh cường độ tư duy và tối ưu hóa cho các tác vụ đại lý thông minh. Người dùng có thể trải nghiệm miễn phí trên OpenRouter đến ngày 15 tháng 5.

Tencent Hunyuan Hy3 bản xem trước tập trung vào các tác vụ đại lý phức tạp

Nguồn: X: Tencent Hunyuan (@TencentHunyuan) · Bài gốc

Bản xem trước của Hunyuan Hy3 được thiết kế để giải quyết các bài toán thực tế với cửa sổ ngữ cảnh 256K và kiến trúc chuyên gia hỗn hợp. Mô hình ưu tiên hiệu quả chi phí và khả năng xử lý logic phức tạp thay vì chỉ tập trung vào điểm số benchmark.

Sản phẩm / ứng dụng

Anthropic mở mã nguồn bộ khung AI tài chính, thiết lập tiêu chuẩn mới cho ngành

Nguồn: X: Xiaobei (@frxiaobei) · Bài gốc

Anthropic vừa công bố bộ khung giải pháp AI toàn diện cho ngành tài chính trên GitHub, bao gồm các đại lý thông minh và kết nối dữ liệu chuyên sâu. Động thái này cho thấy chiến lược tập trung vào doanh nghiệp và xây dựng hệ sinh thái của Anthropic.

Pareto Code: Định hình lại cách lựa chọn mô hình dựa trên nhu cầu thị trường

Nguồn: X: OpenRouter (@OpenRouter) · Bài gốc

Pareto Code là phương pháp mới đánh giá các mô hình dựa trên nhu cầu thực tế, trong đó DeepSeek V4 Pro hiện đang dẫn đầu, theo sau là GPT 5.4 Mini và Gemini 3.1 Pro.

Luma Agents: Tự động hóa sáng tạo từ bảng ý tưởng đến quảng cáo hoàn chỉnh

Nguồn: X: Luma AI (@LumaLabsAI) · Bài gốc

Luma Agents cho phép người dùng biến các bảng ý tưởng (moodboard) và tài liệu tham khảo thành video quảng cáo hoàn chỉnh một cách tự động thông qua nền tảng của Luma AI.

Cập nhật phiên bản Claude Code v2.1.139

Nguồn: Claude Code: GitHub Releases · Bài gốc

Bản cập nhật này bổ sung chế độ xem Agent để quản lý phiên làm việc, lệnh /goal để thực hiện tác vụ liên tục, lệnh /scroll-speed và nhiều cải tiến hiệu năng cũng như sửa hơn 20 lỗi hệ thống.

Công cụ video AI HappyHorse ra mắt trên Alibaba Cloud

Nguồn: X: Alibaba Cloud / Alibaba Cloud (@alibaba_cloud) · Bài gốc

HappyHorse, công cụ video AI hàng đầu cho nội dung chuyên nghiệp, hiện đã có mặt trên Alibaba Cloud Model Studio với khả năng xử lý vật lý phức tạp và đồng bộ môi chuẩn 1080p.

Claude Code ra mắt công cụ quản lý đa nhiệm Agent View

Nguồn: X: Xiaohu (@xiaohu) · Bài gốc

Agent View giúp người dùng quản lý tập trung các phiên làm việc của AI, cho phép theo dõi trạng thái và chuyển đổi giữa các tác vụ một cách hiệu quả như một trung tâm điều phối AI.

China Mobile ra mắt nền tảng trung chuyển mô hình AI MoMA

Nguồn: X: AI Notes (@AYi_AInotes) · Bài gốc

Nền tảng MoMA của China Mobile tích hợp hơn 300 mô hình phổ biến như DeepSeek và Qwen, đánh dấu bước tiến của doanh nghiệp nhà nước vào lĩnh vực hạ tầng AI.

Anthropic chính thức ra mắt nền tảng Claude trên AWS

Nguồn: Claude: Blog (Web) · Bài gốc

Nền tảng mới cho phép khách hàng AWS sử dụng toàn bộ tính năng của Claude API thông qua hệ thống thanh toán và xác thực của AWS, với sự vận hành trực tiếp từ Anthropic.

Tín hiệu ngành

OpenAI ra mắt DeployCo để hỗ trợ doanh nghiệp xây dựng giải pháp AI

Nguồn: OpenAI: Tin chính thức (RSS - lọc nội dung doanh nghiệp/khách hàng) · Bài gốc

OpenAI thành lập DeployCo nhằm hỗ trợ các tổ chức đưa công nghệ AI tiên tiến vào sản xuất thực tế và tối ưu hóa hiệu quả kinh doanh thông qua các giải pháp triển khai tùy chỉnh.

Tin đồn: IPO của công ty chip AI Cerebras được đăng ký vượt mức hơn 20 lần, dự kiến tăng giá phát hành gần 30%

Nguồn: IT Home · Bài gốc

Cerebras đang hướng tới đợt IPO lớn nhất kể từ năm 2026 với nhu cầu vượt mức hơn 20 lần. Công ty dự kiến tăng số lượng cổ phiếu phát hành và nâng giá chào bán lên 150-160 USD, giúp huy động tối đa 4,8 tỷ USD nhờ vào công nghệ chip wafer-scale được OpenAI và Amazon ưa chuộng.

Satya Nadella phản bác vụ kiện của Elon Musk: Musk có số điện thoại của tôi nhưng chưa từng phàn nàn về quan hệ đối tác giữa Microsoft và OpenAI

Nguồn: IT Home · Bài gốc

CEO Microsoft Satya Nadella đã làm chứng chống lại các cáo buộc của Elon Musk, khẳng định Musk từng ủng hộ hợp tác giữa Microsoft và OpenAI. Nadella cũng chỉ trích việc sa thải Sam Altman năm 2023 là hành động thiếu chuyên nghiệp và tiết lộ ông đã hỗ trợ để Altman quay trở lại vị trí cũ.

Định giá của Anthropic tăng vọt 200 tỷ USD trong 5 ngày, doanh thu tăng trưởng theo cấp số nhân

Nguồn: X: Kim (@kimmonismus) · Bài gốc

Định giá thị trường của Anthropic đã tăng từ 1,2 nghìn tỷ lên 1,4 nghìn tỷ USD chỉ trong 5 ngày. Sự tăng trưởng này được thúc đẩy bởi doanh thu hàng năm bùng nổ từ 100 triệu USD lên 45 tỷ USD trong thời gian ngắn.

Sự kiện dành cho các nhà phát triển mô hình AI diễn ra tại San Francisco vào thứ Tư

Nguồn: X: MiniMax (@MiniMax_AI) · Bài gốc

Sự kiện về các mô hình AI thế hệ mới sẽ diễn ra tại San Francisco với sự tham gia của Vercel, Anthropic và Kimi Moonshot, cung cấp các khoản tín dụng API và giải thưởng lớn cho người tham dự.

MiniMax thành lập 'Đội ngũ 10x', mời gọi các chuyên gia cùng thúc đẩy sự phát triển vượt bậc của AI

Nguồn: X: MiniMax (@MiniMax_AI) · Bài gốc

MiniMax đang tìm kiếm các chuyên gia hàng đầu để tham gia 'Đội ngũ 10x', nhằm tích hợp kiến thức chuyên môn vào mô hình AI để tạo ra năng suất thực tế. Công ty cung cấp chế độ đãi ngộ cạnh tranh toàn cầu và cơ hội làm việc tại nhiều thành phố lớn trên thế giới.

Nghiên cứu / bài báo

Mô hình nhỏ nhưng trí tuệ lớn: Nghiên cứu mới về khả năng điều phối AI

Nguồn: X: Berry Xia (@berryxia) · Bài gốc

Một nghiên cứu cho thấy mô hình ngôn ngữ 7B được huấn luyện bằng học tăng cường có thể điều phối hiệu quả các mô hình lớn như GPT-5, Claude Sonnet 4 và Gemini 2.5 Pro. Hệ thống này vượt trội hơn các mô hình đơn lẻ trong nhiều bài kiểm tra, chứng minh rằng khả năng điều phối quan trọng hơn quy mô mô hình.

Khả năng thực thi của AI Agent mạnh mẽ nhưng thiếu tối ưu hóa lợi ích người dùng

Nguồn: X: Microsoft Research (@MSFTResearch) · Bài gốc

Nghiên cứu qua bài kiểm tra SocialReasoning Bench cho thấy các mô hình AI thực hiện nhiệm vụ rất ổn định, nhưng ngay cả khi được yêu cầu ưu tiên lợi ích người dùng, chúng vẫn không thể cải thiện tình trạng của người dùng một cách nhất quán.

BalCapRL: Khung cân bằng mô tả hình ảnh cho MLLM dựa trên học tăng cường

Nguồn: Apple Machine Learning Research · Bài gốc

Nhóm nghiên cứu giới thiệu BalCapRL, một khung làm việc sử dụng hàm thưởng đa chiều để giải quyết các vấn đề như ảo giác, nhiễu và sự dài dòng trong mô tả hình ảnh, giúp tăng cường độ chính xác và khả năng đọc của mô hình.

Thủ thuật / thực hành

Sử dụng LLM trực tiếp trong dòng shebang của tập lệnh

Nguồn: Simon Willison Blog · Bài gốc

Bài viết giới thiệu phương pháp nhúng công cụ LLM vào dòng shebang để thực thi các tác vụ như tạo hình ảnh SVG, viết thơ haiku hoặc tính toán toán học phức tạp, biến LLM thành một trình thông dịch tập lệnh mạnh mẽ.

Công cụ PPT mã nguồn mở 'Guizang PPT' cập nhật tính năng phong cách Thụy Sĩ và AI tạo ảnh

Nguồn: X: Quy Tàng (@op7418) · Bài gốc

Dự án mã nguồn mở này vừa cập nhật phong cách thiết kế Thụy Sĩ và tích hợp GPT-Image 2.0 để tự động tạo ảnh minh họa, sơ đồ và tối ưu hóa giao diện cho slide thuyết trình.

Công cụ AI tạo hàng loạt hồ sơ đăng ký sở hữu trí tuệ gây chú ý

Nguồn: X: Xiaobei (@frxiaobei) · Bài gốc

Việc sử dụng các công cụ AI để tự động hóa quy trình soạn thảo hồ sơ sáng chế, bản quyền phần mềm và thiết kế kiểu dáng công nghiệp đang trở nên phổ biến và thu hút sự quan tâm lớn.

Sự tiến hóa của giao diện người-máy: Từ văn bản đến video thần kinh tương tác

Nguồn: X: Andrej Karpathy (@karpathy) · Bài gốc

Andrej Karpathy nhận định giao diện AI đang chuyển dịch từ văn bản thuần túy sang HTML và tương lai là video thần kinh tương tác, đồng thời nhấn mạnh sự cần thiết của các phương thức nhập liệu tự nhiên hơn như cử chỉ.

Anh em ơi! Hiểu được cấu trúc này thì coi như đã nhập môn tạo ảnh với GPT-Image-2 rồi đấy.

Nguồn: X: Berry Xia (@berryxia) · Bài gốc

Bài viết giới thiệu khung gợi ý (prompt) có cấu trúc giúp nâng cao chất lượng ảnh AI, nhấn mạnh rằng cấu trúc càng rõ ràng thì kết quả đầu ra càng chất lượng.

Người đoạt giải Fields kiểm chứng ChatGPT 5.5 Pro: Giải quyết vấn đề cấp độ luận án trong 17 phút, gióng lên hồi chuông cảnh báo cho sinh viên.

Nguồn: IT Home · Bài gốc

Timothy Gowers thử nghiệm ChatGPT 5.5 Pro và nhận thấy AI có thể giải quyết các bài toán hóc búa mà không cần hướng dẫn, đặt ra thách thức lớn cho tương lai của nghiên cứu toán học và đào tạo tiến sĩ.

Lần đầu công khai trụ sở huyền thoại 'Cog House': Hành trình vươn lên của thiên tài Scott Wu và Cognition AI.

Nguồn: X: swyx (@swyx) · Bài gốc

Bài viết hé lộ về trụ sở của Cognition AI và hành trình của nhà sáng lập Scott Wu, người đã tạo ra kỹ sư phần mềm AI Devin với mức định giá công ty lên tới 25 tỷ USD.

Thư viện học thuật AI với 33.000 sao trên GitHub, tổng hợp các video hướng dẫn chọn lọc.

Nguồn: X: Vista (@vista8) · Bài gốc

Một kho tài nguyên học tập AI được cộng đồng đánh giá cao, tập hợp các video giảng giải chuyên sâu từ YouTube và Bilibili, giúp người học có lộ trình nghiên cứu bài bản.