Nhật báo AI ngày 25/04/2026

DeepSeek-V4 ra mắt với hai phiên bản Pro và Flash, hỗ trợ cửa sổ ngữ cảnh lên tới 1 triệu token cùng kiến trúc chú ý mới giúp tối ưu hóa hiệu suất và chi phí tính toán.

⚡ HÔM NAY CÓ GÌ HOT? (HIGHLIGHTS)

1. Phát hành / cập nhật mô hình (8 tin)
Kỷ nguyên cửa sổ ngữ cảnh 1 triệu token: DeepSeek-V4 chính thức ra mắt và mã nguồn mở
2. Sản phẩm / ứng dụng (8 tin)
vLLM hỗ trợ DeepSeek V4 ngay khi ra mắt với công nghệ tối ưu hóa ngữ cảnh dài
3. Tín hiệu ngành (8 tin)
SGLang và Miles hỗ trợ toàn diện cho DeepSeek-V4 ngay trong ngày ra mắt
4. Nghiên cứu / bài báo (5 tin)
Mô hình hóa thế giới năng động: Nền tảng, năng lực, quy luật và sự vượt trội
5. Thủ thuật / thực hành (1 tin)
Prompt tạo ảnh GPT: Mẫu infographic giáo dục vẽ tay một trang

Phát hành / cập nhật mô hình

Kỷ nguyên cửa sổ ngữ cảnh 1 triệu token: DeepSeek-V4 chính thức ra mắt và mã nguồn mở

Nguồn: IT Home · Bài gốc

DeepSeek-V4 ra mắt với hai phiên bản Pro và Flash, hỗ trợ cửa sổ ngữ cảnh lên tới 1 triệu token cùng kiến trúc chú ý mới giúp tối ưu hóa hiệu suất và chi phí tính toán.

DeepSeek-V4 ra mắt bản xem trước, mở ra kỷ nguyên ngữ cảnh dài chi phí thấp

Nguồn: X: DeepSeek (@deepseek_ai) · Bài gốc

DeepSeek công bố phiên bản V4 với khả năng xử lý 1 triệu token, bao gồm bản Pro hiệu năng cao và bản Flash tối ưu tốc độ, hiện đã có sẵn trên nền tảng chat và API.

DeepSeek phát hành dòng mô hình mã nguồn mở V4 với hiệu năng ngang tầm các mô hình đóng hàng đầu

Nguồn: X: Testing Catalog (@testingcatalog) · Bài gốc

Dòng mô hình DeepSeek-V4 vừa ra mắt với các phiên bản Pro và Flash, được đánh giá có khả năng cạnh tranh trực tiếp với các mô hình hàng đầu như GPT-5.4 và Opus 4.6.

DeepSeek V4 chính thức ra mắt: Mô hình mã nguồn mở với ngữ cảnh 1 triệu token

Nguồn: X: Rohan Paul (@rohanpaul_ai) · Bài gốc

DeepSeek ra mắt thế hệ mô hình mới DeepSeek V4 với khả năng xử lý ngữ cảnh lên tới 1 triệu token. Phiên bản Pro sử dụng kiến trúc chuyên gia hỗn hợp với 1,6 nghìn tỷ tham số, trong khi phiên bản Flash là lựa chọn tối ưu hóa hiệu suất cao.

DeepSeek V4 ra mắt: Hiệu suất tiệm cận các mô hình hàng đầu với chi phí cạnh tranh

Nguồn: Simon Willison Blog · Bài gốc

DeepSeek giới thiệu dòng V4 với hai phiên bản Pro và Flash, hỗ trợ ngữ cảnh 1 triệu token. Phiên bản Pro là mô hình mã nguồn mở lớn nhất hiện nay với hiệu suất tiệm cận các mô hình đóng hàng đầu nhưng có mức giá API cực kỳ cạnh tranh.

DeepSeek V4

Nguồn: Hacker News Nổi bật (buzzing.cc bản dịch tiếng Trung) · Bài gốc

DeepSeek đã phát hành phiên bản mô hình mới nhất v4 cùng tài liệu API chính thức trên trang chủ. Bản cập nhật này đánh dấu bước tiến quan trọng về năng lực mô hình và đang thu hút sự chú ý lớn từ cộng đồng công nghệ.

DeepSeek V4 ra mắt, hiệu suất sánh ngang các mô hình đóng hàng đầu

Nguồn: X: Xiaohu (@xiaohu) · Bài gốc

DeepSeek V4 chính thức trình làng, trong đó phiên bản Pro vượt trội hơn tất cả các mô hình mã nguồn mở khác trong các bài kiểm tra về toán học, STEM và lập trình, đồng thời thiết lập tiêu chuẩn mới cho khả năng của AI Agent.

DeepSeek V4 Pro đứng đầu bảng xếp hạng mô hình mã nguồn mở GDPval-AA

Nguồn: X: Artificial Analysis (@ArtificialAnlys) · Bài gốc

DeepSeek V4 Pro dẫn đầu bảng xếp hạng GDPval-AA về khả năng thực hiện tác vụ thực tế, vượt qua nhiều đối thủ mạnh. Mô hình sử dụng kiến trúc hỗn hợp với 1,6 nghìn tỷ tham số và hỗ trợ cửa sổ ngữ cảnh 1 triệu token.

Sản phẩm / ứng dụng

vLLM hỗ trợ DeepSeek V4 ngay khi ra mắt với công nghệ tối ưu hóa ngữ cảnh dài

Nguồn: X: SemiAnalysis (@SemiAnalysis_) · Bài gốc

vLLM đã cập nhật hỗ trợ cho DeepSeek V4, áp dụng các kỹ thuật nén KV và quản lý bộ nhớ tiên tiến để xử lý hiệu quả ngữ cảnh 1 triệu token. Giải pháp này tối ưu hóa tốt cho các nền tảng phần cứng NVIDIA Blackwell và Hopper.

GPT-5.5 chính thức có mặt trên GitHub Copilot

Nguồn: X: Greg Brockman (@gdb) · Bài gốc

OpenAI đã ra mắt GPT-5.5 trên GitHub Copilot, mang lại hiệu suất vượt trội trong các tác vụ lập trình phức tạp và giải quyết được nhiều thách thức mà các phiên bản trước chưa xử lý được.

Sakana AI ra mắt hệ thống điều phối đa tác nhân Sakana Fugu và mở bản thử nghiệm Beta

Nguồn: X: Sakana AI (@SakanaAILabs) · Bài gốc

Sakana Fugu là hệ thống điều phối đa tác nhân mới của Sakana AI, có khả năng tự động chọn lựa và kết hợp các mô hình nền tảng tối ưu cho từng nhiệm vụ, hỗ trợ API tương thích với OpenAI.

Sakana AI phát hành bản thử nghiệm hệ thống điều phối đa tác nhân Fugu

Nguồn: X: Sakana AI (@SakanaAILabs) · Bài gốc

Sakana AI giới thiệu hệ thống Fugu với hai phiên bản: Fugu Mini tối ưu độ trễ thấp và Fugu Ultra dành cho các tác vụ suy luận chuyên sâu, đạt kết quả dẫn đầu trên nhiều bộ tiêu chuẩn đánh giá.

Sakana AI ra mắt phiên bản thử nghiệm Sakana Fugu: Hệ thống điều phối đa tác nhân

Nguồn: X: Sakana AI (@SakanaAILabs) · Bài gốc

Sakana AI giới thiệu Sakana Fugu, hệ thống điều phối đa tác nhân đạt hiệu suất dẫn đầu ngành trên các bài kiểm tra như SWE-Pro và GPQA-D. Hệ thống này hỗ trợ API tương thích với OpenAI, cho phép tự động chọn lựa các mô hình tối ưu cho từng tác vụ thông qua hai phiên bản Fugu Mini và Fugu Ultra.

Agent SDK: Xây dựng quy trình làm việc cho tác nhân đa vòng trên OpenRouter

Nguồn: OpenRouter: Announcements · Bài gốc

OpenRouter phát hành Agent SDK với hàm callModel, giúp chuyển đổi các cuộc hội thoại thành quy trình làm việc đa bước có hỗ trợ gọi công cụ và theo dõi chi phí. Công cụ này tương thích với hơn 300 mô hình trên nền tảng, hỗ trợ nhà phát triển xây dựng các ứng dụng tác nhân phức tạp.

Xây dựng bộ công cụ riêng với Agent SDK

Nguồn: OpenRouter: Announcements · Bài gốc

Anthropic ra mắt Agent SDK cho phép nhà phát triển tạo các tác nhân lập trình cá nhân hóa chỉ trong vài phút thông qua giao diện dòng lệnh hoặc chế độ headless. SDK này giúp đơn giản hóa việc tùy chỉnh trợ lý AI cho các tác vụ lập trình cụ thể và tích hợp vào các quy trình tự động hóa.

Microsoft/GitHub Copilot - Canada

Nguồn: Microsoft: GitHub · Bài gốc

Kho lưu trữ GitHub này liên quan đến dự án cấu hình Microsoft GitHub Copilot tại Canada, yêu cầu người dùng hoàn tất thiết lập ban đầu và phân quyền truy cập để đảm bảo an toàn cũng như quản lý cộng tác.

Tín hiệu ngành

SGLang và Miles hỗ trợ toàn diện cho DeepSeek-V4 ngay trong ngày ra mắt

Nguồn: LMSYS: Blog (Chatbot Arena ) · Bài gốc

Đội ngũ SGLang đã cung cấp hỗ trợ toàn diện cho DeepSeek-V4 thông qua công cụ suy luận SGLang và khung huấn luyện Miles, tối ưu hóa cho các kiến trúc mới như chú ý thưa hỗn hợp và trọng số chuyên gia FP4.

Chiến lược cạnh tranh trong kỷ nguyên AI: Hàng hóa bổ trợ

Nguồn: Tomer Tunguz Blog (phân tích VC) · Bài gốc

Bài viết phân tích chiến lược của Google và Anthropic trong việc cung cấp các sản phẩm bổ trợ miễn phí để thúc đẩy hệ sinh thái AI, tạo ra vòng lặp tăng trưởng dữ liệu nhưng cũng đặt ra thách thức cho sự đổi mới độc lập.

Cập nhật về các biện pháp bảo vệ bầu cử của chúng tôi

Nguồn: Anthropic: Newsroom (Web) · Bài gốc

Anthropic công bố các biện pháp an toàn mới cho mô hình Claude nhằm đảm bảo tính trung lập chính trị và ngăn chặn thông tin sai lệch trong các kỳ bầu cử, với tỷ lệ tuân thủ chính sách đạt gần 100%.

NousResearch/Anonymizer

Nguồn: Nous Research: GitHub · Bài gốc

NousResearch ra mắt công cụ NeMo Anonymizer giúp tự động phát hiện và bảo vệ thông tin cá nhân (PII) trong văn bản thông qua kỹ thuật thay thế và viết lại có nhận thức ngữ cảnh.

8 mẹo sử dụng Gemini để sắp xếp không gian sống và cuộc sống

Nguồn: Google Blog: AI · Bài gốc

Gemini cung cấp các gợi ý thông minh giúp người dùng lập kế hoạch dọn dẹp, quản lý hộp thư đến và sắp xếp công việc nhà một cách hiệu quả thông qua AI.

NousResearch/NemoClaw: Vận hành OpenClaw an toàn hơn thông qua suy luận được quản lý trong NVIDIA OpenShell

Nguồn: Nous Research: GitHub · Bài gốc

NousResearch ra mắt NemoClaw, một giải pháp chạy OpenClaw trong môi trường NVIDIA OpenShell với chế độ 'suy luận được quản lý' giúp cô lập các tác vụ, từ đó giảm thiểu rủi ro bảo mật cho nhà phát triển.

Anthropic hợp tác với NEC để xây dựng đội ngũ kỹ thuật AI lớn nhất Nhật Bản

Nguồn: Anthropic: Newsroom (Web) · Bài gốc

Anthropic và NEC thiết lập quan hệ đối tác chiến lược nhằm triển khai Claude cho 30.000 nhân viên NEC, đồng thời cùng phát triển các giải pháp AI chuyên biệt cho lĩnh vực tài chính, sản xuất và chính phủ.

Kho lưu trữ máy chủ riêng biệt hlh-server của Hugging Face

Nguồn: Hugging Face: GitHub · Bài gốc

hlh-server là kho lưu trữ dành cho sự kiện 'Humanity's Last Hackathon', cung cấp các điểm cuối API để kiểm tra sức khỏe hệ thống, quản lý người dùng và gửi dữ liệu thông qua CLI.

Nghiên cứu / bài báo

Mô hình hóa thế giới năng động: Nền tảng, năng lực, quy luật và sự vượt trội

Nguồn: HuggingFace Daily Papers (Nổi bậtBài nghiên cứu) · Bài gốc

Nghiên cứu đề xuất khung phân loại hai chiều để đánh giá các mô hình thế giới, giúp AI chuyển từ dự đoán bị động sang khả năng mô phỏng và tái định hình môi trường thực tế.

Dịch mã RNA có thể lập trình thông qua khám phá và tạo mới IRES bằng học sâu

Nguồn: Nature: Machine Learning · Bài gốc

Các nhà nghiên cứu đã phát triển một khung AI gồm ba mô hình để kiểm soát chính xác quá trình biểu hiện protein, cho phép dự đoán và tạo mới các trình tự IRES với hiệu suất vượt trội.

Nền tảng DeepDrugDiscovery tìm ra chất tăng cường tự thực giúp điều trị bệnh Alzheimer

Nguồn: Nature: Machine Learning · Bài gốc

Nền tảng AI DeepDrugDiscovery đã xác định được các hợp chất mới có khả năng vượt qua hàng rào máu não để hỗ trợ điều trị Alzheimer bằng cách tăng cường cơ chế tự thực của tế bào.

Giải mã hình thái bệnh lý và bản đồ phân tử bằng hệ thống nhúng đa phương thức thống nhất

Nguồn: Nature: Machine Learning · Bài gốc

Multi-Embed là khung học máy đa phương thức giúp tích hợp hình thái bệnh lý và bản đồ phân tử đa tầng, hỗ trợ nghiên cứu cơ chế bệnh sinh với hiệu suất vượt trội trên 12 loại ung thư.

Học các nhúng chuyển động dài hạn để tạo động học hiệu quả

Nguồn: Apple Machine Learning Research · Bài gốc

Phương pháp mới giúp tạo các chuỗi chuyển động dài và chân thực từ các nhúng học được, giúp tăng hiệu suất mô hình hóa động lực học cảnh quay lên gấp nhiều lần so với cách tiếp cận truyền thống.

Thủ thuật / thực hành

Prompt tạo ảnh GPT: Mẫu infographic giáo dục vẽ tay một trang

Nguồn: X: Baoyu (@dotey) · Bài gốc

Hướng dẫn thiết kế infographic phong cách vẽ tay với tông màu ấm, ưu tiên hình ảnh, biểu tượng và sơ đồ đơn giản thay vì văn bản dày đặc để tối ưu hóa trải nghiệm thị giác.