Nhật báo AI ngày 01/07/2026
Claude Sonnet 5 sở hữu khả năng lập kế hoạch và điều khiển máy tính vượt trội, với hiệu suất tiệm cận Opus 4.8 nhưng mức giá tối ưu hơn, hiện đã có mặt trên mọi nền tảng của Anthropic.
⚡ HÔM NAY CÓ GÌ HOT? (HIGHLIGHTS)
Phát hành / cập nhật mô hình
Anthropic ra mắt Claude Sonnet 5: Bước tiến mới cho AI tự vận hành
Claude Sonnet 5 sở hữu khả năng lập kế hoạch và điều khiển máy tính vượt trội, với hiệu suất tiệm cận Opus 4.8 nhưng mức giá tối ưu hơn, hiện đã có mặt trên mọi nền tảng của Anthropic.
Google DeepMind ra mắt Nano Banana 2 Lite và Gemini Omni Flash: Tối ưu tốc độ và chi phí
Google DeepMind giới thiệu Nano Banana 2 Lite, mô hình tạo ảnh nhanh và rẻ nhất hiện nay, cùng Gemini Omni Flash hỗ trợ tạo video chất lượng cao với khả năng chỉnh sửa đối thoại trực tiếp.
Meituan ra mắt LongCat-2.0: Mô hình MoE 1.6T tham số với khả năng lập trình vượt trội
Meituan giới thiệu LongCat-2.0, mô hình MoE 1.6T tham số hỗ trợ cửa sổ ngữ cảnh 1 triệu token, tối ưu hóa chuyên biệt cho tác vụ lập trình với hiệu suất tiệm cận các mô hình đóng hàng đầu.
Sản phẩm / ứng dụng
X (Twitter) ra mắt hosted X MCP: AI Agent kết nối trực tiếp với API của X
X chính thức hỗ trợ giao thức MCP, cho phép các AI Agent như Grok hay Cursor truy cập dữ liệu thời gian thực thông qua API. Người dùng có thể sử dụng với chi phí linh hoạt chỉ từ 0,01 USD mỗi lượt gọi.
Tự động hóa quay video demo sản phẩm bằng AI Agent với shot-scraper
Phiên bản shot-scraper 1.10 bổ sung tính năng quay video thao tác trình duyệt thông qua file cấu hình, giúp các AI Agent dễ dàng tạo video demo sản phẩm một cách chuyên nghiệp và chính xác.
Acti biến bàn phím điện thoại thành trợ lý AI thông minh
Startup Acti ra mắt bàn phím tích hợp Google Gemini, cho phép người dùng tạo các phím tắt bằng ngôn ngữ tự nhiên để tự động hóa thao tác trong ứng dụng. Sản phẩm ưu tiên quyền riêng tư với kiến trúc xử lý tại chỗ và đã huy động thành công 5,3 triệu USD.
AI News Radar cập nhật lớn: Hỗ trợ theo dõi đa nền tảng và cá nhân hóa nguồn tin
AI News Radar vừa nâng cấp tính năng cho phép người dùng theo dõi các tài khoản từ mạng xã hội, kết hợp cùng nguồn tin chính thống từ OpenAI, Google và GitHub để tổng hợp tin tức AI theo độ hot hoặc trình tự thời gian.
NotebookLM ra mắt tính năng tạo video tóm tắt 60 giây cho người dùng web
Google chính thức cập nhật tính năng Short Video Overviews trên nền tảng web của NotebookLM, cho phép tự động chuyển đổi tài liệu phức tạp thành video dọc 60 giây để giải thích khái niệm.
Ra mắt ADK Go 2.0: Công cụ xây dựng ứng dụng đa tác nhân (Multi-Agent) mạnh mẽ và linh hoạt
ADK Go 2.0 giới thiệu công cụ điều phối luồng công việc dựa trên đồ thị, hỗ trợ quy trình con người tham gia (HITL) và khả năng thực thi động, giúp đơn giản hóa việc phát triển các hệ thống đa tác nhân phức tạp.
Anthropic chính thức ra mắt Claude Desktop bản thử nghiệm cho Linux
Claude Desktop hiện đã có mặt trên Linux (Ubuntu và Debian), mang đến trải nghiệm làm việc chuyên nghiệp với đầy đủ tính năng như Claude Code, Claude Cowork và chat cho người dùng trả phí.
Anthropic ra mắt Claude Science: Trợ lý AI chuyên dụng cho nghiên cứu khoa học
Claude Science là nền tảng nghiên cứu tích hợp hơn 60 công cụ chuyên sâu về sinh học và hóa học, hỗ trợ tự động hóa quy trình từ phân tích tài liệu đến mô phỏng dữ liệu phức tạp cho người dùng chuyên nghiệp.
Tín hiệu ngành
Tesla bắt đầu thử nghiệm thực tế Cybercab trên đường phố Austin
Tesla chính thức đưa phiên bản sản xuất của Cybercab vào thử nghiệm trên đường phố Austin với 34 xe. Mẫu xe không vô lăng này đang được kiểm chứng độ tin cậy phần cứng trước khi triển khai dịch vụ taxi tự lái hoàn toàn.
Bộ Thương mại Mỹ gỡ bỏ lệnh kiểm soát xuất khẩu đối với Claude Fable 5 và Mythos 5
Anthropic thông báo Bộ Thương mại đã dỡ bỏ lệnh hạn chế xuất khẩu đối với các mô hình Claude Fable 5 và Mythos 5. Dịch vụ dự kiến sẽ sớm được khôi phục và cập nhật trong thời gian tới.
Meta bí mật thử nghiệm ChatGPT và Gemini bằng cách giả danh trẻ vị thành niên gửi hàng chục nghìn câu hỏi nhạy cảm
Meta đã thuê hàng trăm người giả danh trẻ vị thành niên gửi hơn 45.000 câu hỏi về tự hại và ma túy tới các chatbot đối thủ để kiểm tra độ an toàn mà không thông báo cho các công ty này.
Blackstone đầu tư 30 tỷ USD xây trung tâm dữ liệu AI tại Nhật Bản, bắt tay thành lập nền tảng AI XPV
Blackstone dự kiến rót 30 tỷ USD vào hạ tầng AI tại Nhật Bản trong 3-5 năm tới. Đồng thời, liên minh với Apollo và Broadcom thành lập nền tảng AI XPV với mục tiêu cung cấp hơn 20GW công suất tính toán cho các ông lớn như OpenAI và Anthropic vào năm 2028.
Nghiên cứu / bài báo
Đột phá toán học: AI giải quyết 9 bài toán hóc búa nhờ quy trình 'chứng minh - kiểm chứng'
Sử dụng vòng lặp LLM 'prover-verifier', các nhà nghiên cứu từ Đại học Columbia đã giải quyết thành công 9 bài toán mở trong khoa học máy tính lý thuyết, mở ra tiềm năng ứng dụng phương pháp này cho mọi lĩnh vực khoa học.
OpenAI ra mắt GeneBench-Pro: Bộ tiêu chuẩn đánh giá AI trong sinh học tính toán
OpenAI giới thiệu GeneBench-Pro, bộ benchmark gồm 129 bài toán thực tế giúp đánh giá khả năng xử lý dữ liệu phức tạp và tư duy phân tích của AI trong lĩnh vực sinh học tính toán.
Anthropic giới thiệu Turn-Averaged SAE: Bước tiến mới trong giải mã hành vi mô hình AI
Anthropic đề xuất phương pháp huấn luyện SAE bằng cách lấy trung bình luồng dư qua các lượt hội thoại, giúp tập trung vào các đặc trưng hành vi cấp cao thay vì chi tiết kỹ thuật, đồng thời tối ưu hóa khả năng diễn giải dài hạn.
Thủ thuật / thực hành
Cách một kỹ sư quản lý 5 sản phẩm: Dành 80% thời gian để 'tư duy' thay vì viết code
Công ty Every chia sẻ phương pháp 'Compound Engineering', sử dụng hệ thống Agent AI để tự động hóa quy trình phát triển, giúp kỹ sư tập trung vào lập kế hoạch và đánh giá thay vì viết code thủ công.
Khám phá Claude Code: Làm chủ các vòng lặp tác tử (Agent Loops)
Bài viết giải mã 4 loại vòng lặp tác tử trong Claude Code, từ điều khiển theo lượt đến tự động hóa hoàn toàn, đồng thời hướng dẫn cách dùng tệp SKILL.md để tối ưu hóa quy trình tự kiểm tra.
Tranh cãi về việc làm và AI: Khi công nghệ không chỉ là nỗi lo mất việc
Dù AI gây ra làn sóng cắt giảm nhân sự, dữ liệu mới cho thấy các doanh nghiệp đầu tư mạnh vào AI lại tăng trưởng tuyển dụng nhờ tối ưu hóa chi phí. AI đang trở thành công cụ mở rộng quy mô thay vì chỉ thay thế con người, tạo ra khoảng cách lớn giữa các công ty biết tận dụng và nhóm đứng ngoài cuộc.
Nghề 'dạy' robot: Thu nhập từ 200 tệ/ngày, công việc thu thập dữ liệu cho trí tuệ hiện thân
Nghề thu thập dữ liệu cho trí tuệ hiện thân (Embodied AI) đang tuyển dụng với mức lương hấp dẫn, yêu cầu người lao động đeo thiết bị VR để mô phỏng các thao tác vật lý cho robot học tập, nhằm giải quyết tình trạng khan hiếm dữ liệu tương tác thực tế.
Dữ liệu từ OpenAI: ChatGPT đang bùng nổ tại các thị trường mới nổi và người dùng nữ
Báo cáo từ OpenAI cho thấy ChatGPT đang tăng trưởng mạnh mẽ tại châu Phi và châu Á, với sự đa dạng hóa người dùng khi phụ nữ chiếm đa số ở nhiều quốc gia và hơn một nửa người dùng sử dụng ngôn ngữ không phải tiếng Anh.
Grant Sanderson: AI giành huy chương vàng IMO không đồng nghĩa với AGI
Nhà sáng lập 3Blue1Brown nhận định AI giải được các bài toán khó không phải là AGI, mà chỉ là một cột mốc kỹ thuật. Ông thảo luận về giới hạn của AI trong việc hiểu các đột phá toán học và khả năng tự động hóa các tác vụ thực tế.
AI tại Anh bùng nổ: Chỉ 15% người dùng chuyên sâu thực sự hưởng lợi từ thăng tiến và tăng lương
Nghiên cứu của Google cho thấy dù tỷ lệ ứng dụng AI tại Anh tăng vọt lên 73%, nhưng chỉ 15% 'người tiên phong' đạt được hiệu suất vượt trội và lợi ích tài chính. Phần lớn nhân sự còn lại vẫn đang loay hoay với cách dùng AI hiệu quả.
Tại sao chuyên môn hóa là xu hướng tất yếu trong kỷ nguyên AI?
Dựa trên các lý thuyết tối ưu hóa, sinh học và kinh tế, bài viết khẳng định các hệ thống AI chuyên biệt sẽ luôn vượt trội hơn mô hình đa năng nhờ khả năng thích nghi chính xác với môi trường cụ thể trong bối cảnh nguồn lực hữu hạn.