Nhật báo AI ngày 25/06/2026
OpenAI vừa triển khai thử nghiệm mô hình giọng nói Bidi 1 trên ChatGPT, cho phép người dùng ngắt lời và tương tác hai chiều tự nhiên như người thật. Tính năng này hiện đang được mở rộng dần cho người dùng trên cả nền tảng web và ứng dụng.
⚡ HÔM NAY CÓ GÌ HOT? (HIGHLIGHTS)
Phát hành / cập nhật mô hình
ChatGPT âm thầm thử nghiệm mô hình giọng nói hai chiều Bidi 1
OpenAI vừa triển khai thử nghiệm mô hình giọng nói Bidi 1 trên ChatGPT, cho phép người dùng ngắt lời và tương tác hai chiều tự nhiên như người thật. Tính năng này hiện đang được mở rộng dần cho người dùng trên cả nền tảng web và ứng dụng.
Qwen-AgentWorld ra mắt: Bước tiến đột phá giúp AI 'dự đoán trước khi hành động'
Alibaba giới thiệu Qwen-AgentWorld, mô hình thế giới ngôn ngữ đầu tiên được huấn luyện qua 10 triệu tương tác thực tế, vượt qua các đối thủ hàng đầu trên nhiều tác vụ phức tạp. Công nghệ này cho phép AI mô phỏng môi trường và tự học hỏi, mở ra kỷ nguyên mới cho các tác nhân tự hành.
Google tích hợp khả năng 'điều khiển máy tính' trực tiếp vào Gemini 3.5 Flash
Google đưa tính năng điều khiển máy tính vào Gemini 3.5 Flash, cho phép AI tương tác trực tiếp với trình duyệt và ứng dụng desktop. Cập nhật này đi kèm các lớp bảo mật mới, giúp tối ưu hóa quy trình tự động hóa cho doanh nghiệp.
GPT-5.5 Instant ra mắt: Trò chuyện thông minh và thú vị hơn
OpenAI vừa cập nhật GPT-5.5 Instant với khả năng thấu hiểu ý định người dùng tốt hơn, xử lý các yêu cầu phức tạp chính xác hơn, đặc biệt hữu ích cho việc mua sắm và gợi ý địa điểm.
Sản phẩm / ứng dụng
ByteDance chính thức ra mắt phiên bản chuyên nghiệp của AI Doubao
Doubao Pro tích hợp mô hình 2.1 mới, tập trung vào các tác vụ văn phòng phức tạp như điều khiển máy tính, tự động hóa trình duyệt và tạo ứng dụng web. Người dùng có thể chọn các gói đăng ký linh hoạt với mức giá ưu đãi cho sinh viên.
Figma tại Config 2026: Đặt cược vào tư duy con người, nhưng dựa dẫm vào AI từ bên thứ ba
Tại Config 2026, Figma ra mắt loạt tính năng thiết kế nâng cao tích hợp AI từ Anthropic, OpenAI và Google. Dù mở rộng mạnh mẽ khả năng sáng tạo, chiến lược này đặt ra thách thức về chi phí vận hành và sự cạnh tranh trực tiếp từ chính các đối tác cung cấp mô hình AI.
Volcengine ra mắt hạ tầng Agent Ready, nâng cấp bộ công cụ AgentKit và ArkClaw cho doanh nghiệp
Volcengine giới thiệu hạ tầng Agent Ready với kiến trúc 3 lớp, giúp tối ưu hóa khả năng kiểm soát và đánh giá AI Agent. Các giải pháp như ArkClaw đã giúp doanh nghiệp như Haidilao và Skyworth tăng hiệu suất vận hành đáng kể và tiết kiệm chi phí token.
Notion tích hợp AI lập trình thông qua Cursor SDK
Notion đã tích hợp thành công các tác nhân AI từ Cursor SDK, cho phép người dùng tự động hóa quy trình từ lập kế hoạch, viết code đến tạo PR ngay trong tài liệu và luồng thảo luận.
Perplexity ra mắt 'Computer for Counsel': Trợ lý AI chuyên dụng cho ngành luật
Perplexity vừa giới thiệu công cụ chuyên biệt cho luật sư, tích hợp trực tiếp với các cơ sở dữ liệu nghiên cứu, quản lý hồ sơ và văn bản pháp lý như Midpage, LegalZoom và Docusign để trích xuất nguồn tin chính xác. Tính năng này hiện đã khả dụng cho người dùng gói Pro và Max.
Mistral AI nâng cấp hệ thống Connectors: Tăng cường bảo mật và khả năng kiểm soát
Mistral AI vừa ra mắt loạt tính năng mới cho Connectors, bao gồm quản trị quyền truy cập theo không gian làm việc, bảo mật API key, hỗ trợ đa tài khoản và công cụ gỡ lỗi chuyên sâu, giúp tối ưu hóa quy trình làm việc cho doanh nghiệp.
Ra mắt bảng xếp hạng FFASR: Chuẩn đánh giá nhận dạng giọng nói trong môi trường thực tế
Treble Technologies và Hugging Face giới thiệu FFASR, bảng xếp hạng mã nguồn mở đầu tiên đánh giá khả năng nhận dạng giọng nói (ASR) trong điều kiện âm thanh thực tế, khắc phục hạn chế của các bài kiểm tra trong phòng thu bằng cách mô phỏng nhiễu, độ vang và khoảng cách micrô.
OpenAI hợp tác cùng Broadcom ra mắt chip Jalapeño chuyên dụng cho suy luận LLM
OpenAI và Broadcom vừa công bố Jalapeño, dòng chip AI tùy chỉnh được tối ưu hóa cho việc suy luận của các mô hình ngôn ngữ lớn, nhằm nâng cao hiệu suất và khả năng mở rộng hệ thống.
Tín hiệu ngành
NSA mất quyền truy cập vào hệ thống Mythos sau tranh chấp với Anthropic
Cơ quan An ninh Quốc gia Mỹ (NSA) đã bị cắt quyền truy cập vào hệ thống AI Mythos do những bất đồng pháp lý và chính sách với công ty Anthropic.
Nghiên cứu / bài báo
DFlash: Mô hình dự đoán khối giúp tăng tốc độ xử lý AI lên gấp 15 lần
DFlash là mô hình dự đoán khối (draft model) đột phá giúp tăng tốc suy luận LLM bằng cách tạo và xác thực các khối token song song. Công nghệ này đạt tốc độ nhanh gấp 6 lần trên các mô hình phổ biến và lên tới 15 lần trên phần cứng NVIDIA Blackwell mà không làm giảm độ chính xác.
Tư duy để ghi nhớ: Cách suy luận giúp LLM khai phá tri thức tham số
Nghiên cứu từ Google cho thấy chuỗi suy luận (CoT) giúp LLM truy xuất tri thức hiệu quả hơn thông qua cơ chế đệm tính toán và kích hoạt ngữ cảnh, ngay cả với các câu hỏi thực tế đơn giản.
Thủ thuật / thực hành
Reid Hoffman: SpaceX không phải công ty AI, xAI là một 'thảm họa toàn diện'
Nhà đồng sáng lập LinkedIn chỉ trích gay gắt Elon Musk, cho rằng SpaceX đang cố 'mua sự liên quan' với AI, đồng thời gọi xAI là thảm họa khi mất toàn bộ đội ngũ sáng lập và tụt hậu về công nghệ.
Phó chủ tịch ByteDance chia sẻ thực tế về AI Coding: Hiệu suất thực sự và bài học từ TRAE
ByteDance tiết lộ dù AI đóng góp hơn 90% mã nguồn, hiệu suất thực tế không tăng tương ứng. Công ty nhấn mạnh việc chuyển dịch từ tập trung vào số lượng token sang tối ưu hóa khả năng bàn giao dự án thông qua nền tảng TRAE.
AI thay thế kỹ sư? Dữ liệu mới cho thấy kỹ thuật là ngành nghề bền bỉ nhất năm 2025
Dữ liệu từ SignalFire cho thấy nhu cầu tuyển dụng kỹ sư tại các tập đoàn lớn và startup vẫn tăng trưởng mạnh bất chấp làn sóng AI. Thay vì bị thay thế, các kỹ sư đang trở nên bận rộn hơn nhờ hiệu ứng Jevons, khẳng định vị thế không thể thay thế của nhân sự kỹ thuật.
OpenRouter đẩy mạnh chính sách 'Không lưu trữ dữ liệu' (ZDR): Gần 50% lưu lượng đã áp dụng
OpenRouter vừa mở rộng chính sách ZDR cho 97 mô hình mới, đảm bảo dữ liệu người dùng không bị lưu trữ. Với khả năng tùy chỉnh linh hoạt từ cấp tài khoản đến từng yêu cầu, đây là giải pháp bảo mật quan trọng cho doanh nghiệp muốn tránh phụ thuộc vào một nhà cung cấp duy nhất.
NVIDIA NeMo AutoModel: Tăng tốc tinh chỉnh mô hình Transformer MoE chỉ với một dòng code
NVIDIA NeMo AutoModel tối ưu hóa hiệu suất tinh chỉnh mô hình MoE, giúp tăng tốc độ huấn luyện lên tới 3,7 lần và giảm đáng kể mức tiêu thụ bộ nhớ GPU so với thư viện Transformers gốc.
MiniCPM-V 4.6 vận hành siêu tốc trên Apple Core AI
Mô hình đa phương thức MiniCPM-V 4.6 gây ấn tượng mạnh khi đạt tốc độ xử lý vượt trội trên Apple Core AI dù sở hữu dưới 2 tỷ tham số. Đây là bước tiến lớn cho khả năng chạy AI hiệu suất cao ngay trên thiết bị.