04/07 03/07 02/07 01/07 30/06 29/06 28/06 27/06 26/06 25/06

Nhật báo AI ngày 17/06/2026

Cartesia vừa giới thiệu Sonic 3.5 (chuyển văn bản thành giọng nói) và Ink 2 (chuyển giọng nói thành văn bản), thiết lập kỷ lục mới về tốc độ phản hồi chỉ 82ms và dẫn đầu bảng xếp hạng Artificial Analysis.

⚡ HÔM NAY CÓ GÌ HOT? (HIGHLIGHTS)

1. Phát hành / cập nhật mô hình (5 tin)

Cartesia ra mắt bộ đôi mô hình Sonic 3.5 và Ink 2: Đỉnh cao mới trong xử lý giọng nói thời gian thực

2. Sản phẩm / ứng dụng (8 tin)

Bộ Giáo dục Trung Quốc nâng cấp hệ thống 'Sunshine Volunteer': AI hỗ trợ chọn nguyện vọng đại học chính xác

3. Tín hiệu ngành (8 tin)

Bộ Tư pháp Mỹ lấy lý do an ninh quốc gia để bảo vệ các turbine khí trái phép của xAI

4. Nghiên cứu / bài báo (3 tin)

Nghiên cứu của Anthropic: Chuyên môn con người vẫn là chìa khóa trong lập trình AI

5. Thủ thuật / thực hành (5 tin)

Meta giải thể bộ phận kỹ thuật: Cú sốc gây tranh cãi trong giới công nghệ

Phát hành / cập nhật mô hình

Cartesia ra mắt bộ đôi mô hình Sonic 3.5 và Ink 2: Đỉnh cao mới trong xử lý giọng nói thời gian thực

Nguồn: X: Testing Catalog (@testingcatalog) · Bài gốc

Qwen-RobotManip: Bước tiến mới trong mô hình nền tảng điều khiển robot đa năng

Nguồn: Qwen: Blog Retrieval (API) · Bài gốc

Qwen-RobotManip là mô hình VLA đột phá từ Alibaba, sử dụng khung căn chỉnh 3D để điều khiển 15 loại robot khác nhau. Với dữ liệu huấn luyện khổng lồ, mô hình đạt hiệu suất dẫn đầu tại nhiều bảng xếp hạng robot học thuật và thực tế.

Qwen-RobotWorld: Bước tiến đột phá cho trí tuệ nhân tạo hiện thân

Nguồn: Qwen: Blog Retrieval (API) · Bài gốc

Qwen-RobotWorld sử dụng kiến trúc MMDiT và Qwen2.5-VL để thống nhất hơn 20 loại hình robot, hỗ trợ đa dạng tác vụ từ điều khiển, lái xe tự động đến điều hướng thông minh.

ByteDance ra mắt Seedance 2.0 Mini: Tạo video AI nhanh gấp đôi với chi phí giảm một nửa

Nguồn: IT Home · Bài gốc

ByteDance vừa giới thiệu mô hình tạo video Seedance 2.0 Mini với tốc độ nhanh gấp đôi và chi phí vận hành giảm 50% so với bản tiêu chuẩn, hướng tới các tác vụ sản xuất nội dung thương mại điện tử và marketing quy mô lớn.

Qwen-RobotNav: Mô hình điều hướng đa năng cho robot thông minh

Nguồn: Qwen: Blog Retrieval (API) · Bài gốc

Qwen ra mắt Qwen-RobotNav, mô hình hợp nhất 5 tác vụ điều hướng và thị giác, đạt hiệu suất SOTA trên nhiều tiêu chuẩn và đã triển khai thành công trên robot bốn chân Unitree Go2 mà không cần tinh chỉnh.

Sản phẩm / ứng dụng

Bộ Giáo dục Trung Quốc nâng cấp hệ thống 'Sunshine Volunteer': AI hỗ trợ chọn nguyện vọng đại học chính xác

Nguồn: IT Home · Bài gốc

Hệ thống 'Sunshine Volunteer' vừa được nâng cấp với dữ liệu chính thống từ Bộ Giáo dục, tích hợp AI hỗ trợ tư vấn 24/7 và các công cụ đánh giá năng lực giúp học sinh chọn nguyện vọng đại học hiệu quả.

Google Cloud ra mắt OKF v0.1: Chuẩn Markdown mở giúp AI Agent hiểu ngữ cảnh dữ liệu

Nguồn: MarkTechPost · Bài gốc

Google Cloud giới thiệu Open Knowledge Format (OKF), chuẩn Markdown phi tập trung giúp tổ chức hệ thống hóa kiến thức cho AI Agent mà không phụ thuộc vào nền tảng độc quyền. OKF cho phép lưu trữ dữ liệu dưới dạng tệp tin linh hoạt, dễ dàng tích hợp và trao đổi giữa các hệ thống khác nhau.

Microsoft chính thức ra mắt Copilot Cowork: Trợ lý AI đa mô hình cho doanh nghiệp

Nguồn: X: Satya Nadella (@satyanadella) · Bài gốc

Copilot Cowork đã có mặt trên toàn cầu, cho phép các tổ chức triển khai những tác nhân AI tự động xử lý các quy trình phức tạp dựa trên dữ liệu nội bộ chuyên biệt.

Alipay ra mắt trợ lý AI 'A-Bao': Đơn giản hóa thao tác qua lệnh thoại

Nguồn: IT Home · Bài gốc

Alipay vừa giới thiệu trợ lý AI 'A-Bao', cho phép người dùng thực hiện các tác vụ phức tạp như tra cứu công quỹ chỉ bằng một câu lệnh, giúp tối ưu hóa trải nghiệm người dùng. Hiện tại, tính năng này đang trong giai đoạn thử nghiệm giới hạn với 100 mã mời.

Xiaomi ra mắt MiMo Claw: Tích hợp mô hình AI flagship và hệ sinh thái văn phòng WPS

Nguồn: : Xiaomi MiMo · Bài gốc

Xiaomi chính thức phát hành MiMo Claw, ứng dụng AI tích hợp mô hình MiMo-V2.5-Pro với khả năng xử lý tác vụ vượt trội và tương thích sâu với bộ công cụ văn phòng WPS, đi kèm mô hình đăng ký linh hoạt cho người dùng.

Subagent: Giải pháp giúp AI 'ủy quyền' các tác vụ nhỏ cho mô hình phụ

Nguồn: OpenRouter: Announcements · Bài gốc

OpenRouter ra mắt công cụ Subagent, cho phép các mô hình AI lớn tự động chuyển giao những tác vụ đơn giản như tóm tắt hay định dạng dữ liệu cho các mô hình nhỏ hơn, giúp tối ưu chi phí và tiết kiệm token.

Midjourney V8.1 ra mắt chế độ Draft Mode: Tạo ảnh nhanh, tiết kiệm chi phí

Nguồn: Midjourney: Updates · Bài gốc

Chế độ Draft Mode mới trên Midjourney V8.1 cho phép tạo 24 ảnh nháp độ phân giải thấp với chi phí chỉ bằng một nửa, sau đó người dùng có thể chọn ảnh ưng ý để xuất bản chất lượng cao.

xAI ra mắt Grok for PowerPoint: Tạo và chỉnh sửa slide trực tiếp trong Microsoft 365

Nguồn: xAI: News (Web) · Bài gốc

xAI vừa phát hành plugin Grok cho bộ Microsoft 365, cho phép người dùng tạo slide, soạn thảo nội dung và truy xuất dữ liệu từ email hay SharePoint ngay trong PowerPoint, Word và Excel.

Tín hiệu ngành

Bộ Tư pháp Mỹ lấy lý do an ninh quốc gia để bảo vệ các turbine khí trái phép của xAI

Nguồn: The Decoder: AI News · Bài gốc

Bộ Tư pháp Mỹ lập luận rằng siêu máy tính Colossus 2 của xAI là thiết yếu cho các nhiệm vụ quân sự mật, nhằm bác bỏ đơn kiện của NAACP về việc xAI vận hành turbine khí gây ô nhiễm vượt mức cho phép.

Lầu Năm Góc cắt đứt quan hệ với Anthropic, chuyển hướng sang OpenAI vì bất đồng về vũ khí tự động

Nguồn: X: AI Notes (@AYi_AInotes) · Bài gốc

Lầu Năm Góc đang loại bỏ các mô hình của Anthropic khỏi quy trình làm việc do từ chối yêu cầu hỗ trợ giám sát và vũ khí tự động, đồng thời chuyển sang hợp tác với OpenAI.

Thiếu hụt tài nguyên tính toán AI, GitHub của Microsoft phải 'cầu cứu' AWS

Nguồn: Hacker News Nổi bật (buzzing.cc bản dịch tiếng Trung) · Bài gốc

Do nhu cầu AI tăng cao vượt quá khả năng đáp ứng nội bộ, GitHub (thuộc Microsoft) đã phải tìm đến hạ tầng đám mây của đối thủ AWS để duy trì hoạt động.

Microsoft cân nhắc tích hợp DeepSeek V4 vào Copilot Cowork để tối ưu chi phí

Nguồn: X: Kim (@kimmonismus) · Bài gốc

Microsoft dự định đưa DeepSeek V4 vào Copilot Cowork như một tùy chọn giá rẻ, đồng thời chuyển từ mô hình định giá trọn gói sang tính phí theo mức sử dụng thực tế để kiểm soát chi phí vận hành.

Chính phủ Mỹ cấm mô hình Anthropic: Không chỉ đơn thuần là vấn đề 'bẻ khóa' AI

Nguồn: Hacker News Nổi bật (buzzing.cc bản dịch tiếng Trung) · Bài gốc

Bộ Thương mại Mỹ vừa cấm người nước ngoài truy cập các mô hình Fable 5 và Mythos 5 của Anthropic vì lý do an ninh quốc gia. Các chuyên gia cảnh báo lệnh cấm này là quá đà, gây cản trở nghiên cứu bảo mật và làm suy giảm niềm tin quốc tế vào công nghệ AI của Mỹ.

SpaceX chi 60 tỷ USD cổ phiếu thâu tóm startup lập trình AI Cursor

Nguồn: TechCrunch: AI · Bài gốc

Chỉ vài ngày sau IPO, SpaceX đã đồng ý mua lại startup lập trình AI Cursor với giá 60 tỷ USD nhằm củng cố năng lực cho bộ phận AI của Elon Musk, giúp họ cạnh tranh trực tiếp với các ông lớn trong ngành.

Anthropic vượt mặt OpenAI về thị phần doanh nghiệp, lệnh cấm từ chính phủ Mỹ vô tình thúc đẩy tăng trưởng

Nguồn: TechCrunch: AI · Bài gốc

Thị phần đăng ký AI doanh nghiệp của Anthropic đạt 41%, lần đầu vượt OpenAI. Dù đối mặt với các hạn chế xuất khẩu từ chính quyền Trump, nhu cầu sử dụng các mô hình như Claude Opus vẫn tăng kỷ lục nhờ sự quan tâm lớn từ thị trường.

DeepSeek gọi vốn thành công vòng đầu tiên, định giá vượt mốc 50 tỷ USD

Nguồn: The Decoder: AI News · Bài gốc

Startup AI DeepSeek vừa huy động thành công hơn 7 tỷ USD với định giá 50 tỷ USD. Dù nhận đầu tư từ các ông lớn như Tencent và CATL, công ty vẫn giữ cam kết ưu tiên nghiên cứu AGI và duy trì chiến lược mã nguồn mở với chi phí vận hành cực thấp.

Nghiên cứu / bài báo

Nghiên cứu của Anthropic: Chuyên môn con người vẫn là chìa khóa trong lập trình AI

Nguồn: Anthropic: Research ( - Web) · Bài gốc

Phân tích từ Anthropic cho thấy khi con người nắm quyền lập kế hoạch và AI thực thi, hiệu suất công việc tăng đáng kể. Các tác vụ AI đang chuyển dịch từ sửa lỗi sang tự động hóa toàn diện, giúp giá trị công việc tăng 25%.

OpenAI giới thiệu phương pháp mô phỏng triển khai để dự đoán hành vi mô hình trước khi ra mắt

Nguồn: OpenAI: Tin chính thức (RSS - lọc nội dung doanh nghiệp/khách hàng) · Bài gốc

OpenAI ra mắt phương pháp Deployment Simulation giúp mô phỏng thực tế bằng cách tái hiện các cuộc hội thoại lịch sử, từ đó phát hiện sớm các vấn đề về an toàn và căn chỉnh mô hình mà các bài kiểm tra truyền thống thường bỏ lỡ.

Dữ liệu chat công khai có thể dự đoán sự lệch hướng của AI trong thực tế?

Nguồn: OpenAI: Alignment Nghiên cứuBlog · Bài gốc

OpenAI sử dụng tập dữ liệu WildChat để mô phỏng hành vi của các thế hệ GPT tương lai. Nghiên cứu cho thấy dữ liệu công khai là công cụ kiểm định hữu ích, dù độ chính xác với các tác vụ kỹ thuật phức tạp vẫn còn hạn chế.

Thủ thuật / thực hành

Meta giải thể bộ phận kỹ thuật: Cú sốc gây tranh cãi trong giới công nghệ

Nguồn: Hacker News Nổi bật (buzzing.cc bản dịch tiếng Trung) · Bài gốc

Bài viết trên Hacker News đang gây xôn xao khi đặt nghi vấn về việc Meta đang âm thầm giải thể bộ phận kỹ thuật, làm dấy lên nhiều lo ngại về tương lai và cấu trúc vận hành của tập đoàn này.

Dở khóc dở cười: Sinh viên bị AI 'bắt bài' sai lệch, bài tự viết bị đánh dấu 99% là AI

Nguồn: : · Bài gốc

Các sinh viên đang rơi vào vòng xoáy kiểm duyệt AI đầy bất cập khi công cụ quét cho kết quả sai lệch nghiêm trọng, buộc họ phải tốn kém chi phí chỉnh sửa vô nghĩa để đáp ứng các tiêu chuẩn khắt khe của nhà trường.

WorkBuddy bùng nổ: Lượng người dùng hàng ngày gấp 3-4 lần đối thủ, làn sóng nhân sự phi kỹ thuật đổ bộ

Nguồn: : · Bài gốc

WorkBuddy đang thống trị thị trường với lượng người dùng hàng ngày vượt xa các đối thủ, thu hút đông đảo nhân viên văn phòng từ HR đến vận hành. Sự trỗi dậy này kéo theo cuộc đua khốc liệt từ các ông lớn như Tencent, đánh dấu bước ngoặt quan trọng trong kỷ nguyên AI Agent.

Lợi thế dẫn đầu của OpenAI đang dần tan biến

Nguồn: Gary Marcus: The Road to AI We Can Trust · Bài gốc

OpenAI đang đối mặt với khủng hoảng kép: mất dần lợi thế cạnh tranh, sự rạn nứt với Microsoft và tốc độ đốt tiền đáng báo động, trong khi các đối thủ như Anthropic đang trỗi dậy mạnh mẽ.

Nhìn lại công thức hậu huấn luyện mô hình ngôn ngữ lớn: Trò chuyện cùng Finbarr Timbers

Nguồn: Nathan Lambert: Interconnects · Bài gốc

Podcast Interconnects phân tích sự tiến hóa của công thức hậu huấn luyện từ InstructGPT đến DeepSeek R1, đồng thời làm rõ xu hướng MOPD (chưng cất đa giáo viên trực tuyến) giúp giải quyết xung đột năng lực giữa các lĩnh vực trong mô hình AI hiện đại.