Nhật báo AI ngày 25/06/2026

OpenAI vừa triển khai thử nghiệm mô hình giọng nói Bidi 1 trên ChatGPT, cho phép người dùng ngắt lời và tương tác hai chiều tự nhiên như người thật. Tính năng này hiện đang được mở rộng dần cho người dùng trên cả nền tảng web và ứng dụng.

⚡ HÔM NAY CÓ GÌ HOT? (HIGHLIGHTS)

1. Phát hành / cập nhật mô hình (4 tin)

ChatGPT âm thầm thử nghiệm mô hình giọng nói hai chiều Bidi 1

2. Sản phẩm / ứng dụng (8 tin)

ByteDance chính thức ra mắt phiên bản chuyên nghiệp của AI Doubao

3. Tín hiệu ngành (1 tin)

NSA mất quyền truy cập vào hệ thống Mythos sau tranh chấp với Anthropic

4. Nghiên cứu / bài báo (2 tin)

DFlash: Mô hình dự đoán khối giúp tăng tốc độ xử lý AI lên gấp 15 lần

5. Thủ thuật / thực hành (6 tin)

Reid Hoffman: SpaceX không phải công ty AI, xAI là một 'thảm họa toàn diện'

Phát hành / cập nhật mô hình

ChatGPT âm thầm thử nghiệm mô hình giọng nói hai chiều Bidi 1

Nguồn: IT Home · Bài gốc

Qwen-AgentWorld ra mắt: Bước tiến đột phá giúp AI 'dự đoán trước khi hành động'

Nguồn: : · Bài gốc

Alibaba giới thiệu Qwen-AgentWorld, mô hình thế giới ngôn ngữ đầu tiên được huấn luyện qua 10 triệu tương tác thực tế, vượt qua các đối thủ hàng đầu trên nhiều tác vụ phức tạp. Công nghệ này cho phép AI mô phỏng môi trường và tự học hỏi, mở ra kỷ nguyên mới cho các tác nhân tự hành.

Google tích hợp khả năng 'điều khiển máy tính' trực tiếp vào Gemini 3.5 Flash

Nguồn: Hacker News Nổi bật (buzzing.cc bản dịch tiếng Trung) · Bài gốc

Google đưa tính năng điều khiển máy tính vào Gemini 3.5 Flash, cho phép AI tương tác trực tiếp với trình duyệt và ứng dụng desktop. Cập nhật này đi kèm các lớp bảo mật mới, giúp tối ưu hóa quy trình tự động hóa cho doanh nghiệp.

GPT-5.5 Instant ra mắt: Trò chuyện thông minh và thú vị hơn

Nguồn: X: OpenAI (@OpenAI) · Bài gốc

OpenAI vừa cập nhật GPT-5.5 Instant với khả năng thấu hiểu ý định người dùng tốt hơn, xử lý các yêu cầu phức tạp chính xác hơn, đặc biệt hữu ích cho việc mua sắm và gợi ý địa điểm.

Sản phẩm / ứng dụng

ByteDance chính thức ra mắt phiên bản chuyên nghiệp của AI Doubao

Nguồn: : · Bài gốc

Doubao Pro tích hợp mô hình 2.1 mới, tập trung vào các tác vụ văn phòng phức tạp như điều khiển máy tính, tự động hóa trình duyệt và tạo ứng dụng web. Người dùng có thể chọn các gói đăng ký linh hoạt với mức giá ưu đãi cho sinh viên.

Figma tại Config 2026: Đặt cược vào tư duy con người, nhưng dựa dẫm vào AI từ bên thứ ba

Nguồn: The Decoder: AI News · Bài gốc

Tại Config 2026, Figma ra mắt loạt tính năng thiết kế nâng cao tích hợp AI từ Anthropic, OpenAI và Google. Dù mở rộng mạnh mẽ khả năng sáng tạo, chiến lược này đặt ra thách thức về chi phí vận hành và sự cạnh tranh trực tiếp từ chính các đối tác cung cấp mô hình AI.

Volcengine ra mắt hạ tầng Agent Ready, nâng cấp bộ công cụ AgentKit và ArkClaw cho doanh nghiệp

Nguồn: : · Bài gốc

Volcengine giới thiệu hạ tầng Agent Ready với kiến trúc 3 lớp, giúp tối ưu hóa khả năng kiểm soát và đánh giá AI Agent. Các giải pháp như ArkClaw đã giúp doanh nghiệp như Haidilao và Skyworth tăng hiệu suất vận hành đáng kể và tiết kiệm chi phí token.

Notion tích hợp AI lập trình thông qua Cursor SDK

Nguồn: Cursor Blog · Bài gốc

Notion đã tích hợp thành công các tác nhân AI từ Cursor SDK, cho phép người dùng tự động hóa quy trình từ lập kế hoạch, viết code đến tạo PR ngay trong tài liệu và luồng thảo luận.

Perplexity ra mắt 'Computer for Counsel': Trợ lý AI chuyên dụng cho ngành luật

Nguồn: X: Perplexity (@perplexity_ai) · Bài gốc

Perplexity vừa giới thiệu công cụ chuyên biệt cho luật sư, tích hợp trực tiếp với các cơ sở dữ liệu nghiên cứu, quản lý hồ sơ và văn bản pháp lý như Midpage, LegalZoom và Docusign để trích xuất nguồn tin chính xác. Tính năng này hiện đã khả dụng cho người dùng gói Pro và Max.

Mistral AI nâng cấp hệ thống Connectors: Tăng cường bảo mật và khả năng kiểm soát

Nguồn: Mistral AI: News (Web) · Bài gốc

Mistral AI vừa ra mắt loạt tính năng mới cho Connectors, bao gồm quản trị quyền truy cập theo không gian làm việc, bảo mật API key, hỗ trợ đa tài khoản và công cụ gỡ lỗi chuyên sâu, giúp tối ưu hóa quy trình làm việc cho doanh nghiệp.

Ra mắt bảng xếp hạng FFASR: Chuẩn đánh giá nhận dạng giọng nói trong môi trường thực tế

Nguồn: Hugging Face: Blog · Bài gốc

Treble Technologies và Hugging Face giới thiệu FFASR, bảng xếp hạng mã nguồn mở đầu tiên đánh giá khả năng nhận dạng giọng nói (ASR) trong điều kiện âm thanh thực tế, khắc phục hạn chế của các bài kiểm tra trong phòng thu bằng cách mô phỏng nhiễu, độ vang và khoảng cách micrô.

OpenAI hợp tác cùng Broadcom ra mắt chip Jalapeño chuyên dụng cho suy luận LLM

Nguồn: OpenAI: Tin chính thức (RSS - lọc nội dung doanh nghiệp/khách hàng) · Bài gốc

OpenAI và Broadcom vừa công bố Jalapeño, dòng chip AI tùy chỉnh được tối ưu hóa cho việc suy luận của các mô hình ngôn ngữ lớn, nhằm nâng cao hiệu suất và khả năng mở rộng hệ thống.

Tín hiệu ngành

NSA mất quyền truy cập vào hệ thống Mythos sau tranh chấp với Anthropic

Nguồn: Hacker News Nổi bật (buzzing.cc bản dịch tiếng Trung) · Bài gốc

Cơ quan An ninh Quốc gia Mỹ (NSA) đã bị cắt quyền truy cập vào hệ thống AI Mythos do những bất đồng pháp lý và chính sách với công ty Anthropic.

Nghiên cứu / bài báo

DFlash: Mô hình dự đoán khối giúp tăng tốc độ xử lý AI lên gấp 15 lần

Nguồn: MarkTechPost · Bài gốc

DFlash là mô hình dự đoán khối (draft model) đột phá giúp tăng tốc suy luận LLM bằng cách tạo và xác thực các khối token song song. Công nghệ này đạt tốc độ nhanh gấp 6 lần trên các mô hình phổ biến và lên tới 15 lần trên phần cứng NVIDIA Blackwell mà không làm giảm độ chính xác.

Tư duy để ghi nhớ: Cách suy luận giúp LLM khai phá tri thức tham số

Nguồn: Google Research: Blog (Web) · Bài gốc

Nghiên cứu từ Google cho thấy chuỗi suy luận (CoT) giúp LLM truy xuất tri thức hiệu quả hơn thông qua cơ chế đệm tính toán và kích hoạt ngữ cảnh, ngay cả với các câu hỏi thực tế đơn giản.

Thủ thuật / thực hành

Reid Hoffman: SpaceX không phải công ty AI, xAI là một 'thảm họa toàn diện'

Nguồn: Hacker News Nổi bật (buzzing.cc bản dịch tiếng Trung) · Bài gốc

Nhà đồng sáng lập LinkedIn chỉ trích gay gắt Elon Musk, cho rằng SpaceX đang cố 'mua sự liên quan' với AI, đồng thời gọi xAI là thảm họa khi mất toàn bộ đội ngũ sáng lập và tụt hậu về công nghệ.

Phó chủ tịch ByteDance chia sẻ thực tế về AI Coding: Hiệu suất thực sự và bài học từ TRAE

Nguồn: : · Bài gốc

ByteDance tiết lộ dù AI đóng góp hơn 90% mã nguồn, hiệu suất thực tế không tăng tương ứng. Công ty nhấn mạnh việc chuyển dịch từ tập trung vào số lượng token sang tối ưu hóa khả năng bàn giao dự án thông qua nền tảng TRAE.

AI thay thế kỹ sư? Dữ liệu mới cho thấy kỹ thuật là ngành nghề bền bỉ nhất năm 2025

Nguồn: TechCrunch: AI · Bài gốc

Dữ liệu từ SignalFire cho thấy nhu cầu tuyển dụng kỹ sư tại các tập đoàn lớn và startup vẫn tăng trưởng mạnh bất chấp làn sóng AI. Thay vì bị thay thế, các kỹ sư đang trở nên bận rộn hơn nhờ hiệu ứng Jevons, khẳng định vị thế không thể thay thế của nhân sự kỹ thuật.

OpenRouter đẩy mạnh chính sách 'Không lưu trữ dữ liệu' (ZDR): Gần 50% lưu lượng đã áp dụng

Nguồn: OpenRouter: Announcements · Bài gốc

OpenRouter vừa mở rộng chính sách ZDR cho 97 mô hình mới, đảm bảo dữ liệu người dùng không bị lưu trữ. Với khả năng tùy chỉnh linh hoạt từ cấp tài khoản đến từng yêu cầu, đây là giải pháp bảo mật quan trọng cho doanh nghiệp muốn tránh phụ thuộc vào một nhà cung cấp duy nhất.

NVIDIA NeMo AutoModel: Tăng tốc tinh chỉnh mô hình Transformer MoE chỉ với một dòng code

Nguồn: Hugging Face: Blog · Bài gốc

NVIDIA NeMo AutoModel tối ưu hóa hiệu suất tinh chỉnh mô hình MoE, giúp tăng tốc độ huấn luyện lên tới 3,7 lần và giảm đáng kể mức tiêu thụ bộ nhớ GPU so với thư viện Transformers gốc.

MiniCPM-V 4.6 vận hành siêu tốc trên Apple Core AI

Nguồn: X: OpenBMB (@OpenBMB) · Bài gốc

Mô hình đa phương thức MiniCPM-V 4.6 gây ấn tượng mạnh khi đạt tốc độ xử lý vượt trội trên Apple Core AI dù sở hữu dưới 2 tỷ tham số. Đây là bước tiến lớn cho khả năng chạy AI hiệu suất cao ngay trên thiết bị.