Nhật báo AI ngày 04/07/2026

Shengshu Technology vừa chính thức giới thiệu Vidu S1, mô hình AI thế hệ mới cho phép tạo video tương tác thời gian thực. Công nghệ này cho phép người dùng trò chuyện, điều khiển hành vi nhân vật ảo bằng giọng nói và tạo video không giới hạn thời lượng, mở ra bước tiến mới trong lĩnh vực AI tạo sinh.

⚡ HÔM NAY CÓ GÌ HOT? (HIGHLIGHTS)

1. Phát hành / cập nhật mô hình (1 tin)
Shengshu Technology ra mắt Vidu S1: Đưa tạo video AI vào kỷ nguyên tương tác thời gian thực
2. Sản phẩm / ứng dụng (5 tin)
Wan Video ra mắt tính năng 'Nhảy theo nhạc': Biến nhân vật thành vũ công chuyên nghiệp
3. Tín hiệu ngành (3 tin)
Trung Quốc lấy ý kiến sửa đổi quy định Internet, bổ sung chương riêng quản lý dịch vụ AI
4. Nghiên cứu / bài báo (1 tin)
Viện nghiên cứu DAMO của Alibaba ra mắt AI Elements Claw, phát hiện 4 loại vật liệu siêu dẫn mới
5. Thủ thuật / thực hành (5 tin)
pxpipe: Giảm chi phí token cho Claude Code bằng cách chuyển đổi văn bản thành hình ảnh

Phát hành / cập nhật mô hình

Shengshu Technology ra mắt Vidu S1: Đưa tạo video AI vào kỷ nguyên tương tác thời gian thực

Nguồn: : (Vidu - Video) · Bài gốc

Shengshu Technology vừa chính thức giới thiệu Vidu S1, mô hình AI thế hệ mới cho phép tạo video tương tác thời gian thực. Công nghệ này cho phép người dùng trò chuyện, điều khiển hành vi nhân vật ảo bằng giọng nói và tạo video không giới hạn thời lượng, mở ra bước tiến mới trong lĩnh vực AI tạo sinh.

Sản phẩm / ứng dụng

Safari ra mắt MCP Server: Bước tiến mới cho lập trình viên web

Nguồn: Hacker News Nổi bật (buzzing.cc bản dịch tiếng Trung) · Bài gốc

Safari Technology Preview 247 giới thiệu MCP Server, cho phép các AI agent truy cập trực tiếp vào trình duyệt để thực hiện gỡ lỗi, phân tích hiệu năng và kiểm tra giao diện thông qua các công cụ tự động hóa, giúp tối ưu hóa quy trình làm việc của lập trình viên.

FaceWall AI ra mắt ForgeTrain: Khung huấn luyện AI tự động, vượt mặt Megatron-LM chỉ sau 8 giờ

Nguồn: : (MiniCPM) · Bài gốc

FaceWall AI giới thiệu ForgeTrain, khung huấn luyện mô hình ngôn ngữ lớn đầu tiên do AI tự viết mã mà không cần can thiệp từ con người. Hệ thống này tối ưu hóa hiệu suất phần cứng vượt trội, giúp rút ngắn thời gian huấn luyện và tăng hiệu quả sử dụng tài nguyên tính toán đáng kể.

Tín hiệu ngành

Lần đầu tiên ghi nhận cuộc tấn công mã độc tống tiền tự động bởi AI Agent

Nguồn: IT Home · Bài gốc

Hãng bảo mật Sysdig vừa công bố phát hiện cuộc tấn công mã độc tống tiền đầu tiên trên thế giới được thực hiện hoàn toàn tự động bởi AI Agent, có tên là JADEPUFFER. AI này tự thực hiện toàn bộ quy trình từ khai thác lỗ hổng, di chuyển ngang trong hệ thống cho đến mã hóa cơ sở dữ liệu mà không cần sự can thiệp của con người.

Nghiên cứu / bài báo

Viện nghiên cứu DAMO của Alibaba ra mắt AI Elements Claw, phát hiện 4 loại vật liệu siêu dẫn mới

Nguồn: IT Home · Bài gốc

Ngày 3/7, Viện nghiên cứu DAMO (Alibaba) phối hợp cùng Đại học Nhân dân Trung Quốc và Đại học Khoa học Công nghệ Trung Quốc đã công bố Elements Claw, AI đầu tiên chuyên về khám phá vật liệu siêu dẫn. Hệ thống này đã dự đoán 68.000 ứng viên tiềm năng, trong đó 4 loại vật liệu mới đã được tổng hợp và xác nhận có tính siêu dẫn trong thực nghiệm.

Thủ thuật / thực hành

pxpipe: Giảm chi phí token cho Claude Code bằng cách chuyển đổi văn bản thành hình ảnh

Nguồn: Hacker News Nổi bật (buzzing.cc bản dịch tiếng Trung) · Bài gốc

pxpipe là một proxy cục bộ giúp giảm đáng kể chi phí token đầu vào cho Claude Code bằng cách chuyển đổi các phần nội dung cồng kềnh như system prompt, tài liệu công cụ và lịch sử trò chuyện thành hình ảnh PNG. Phương pháp này tận dụng cơ chế tính phí dựa trên kích thước pixel thay vì số lượng ký tự, giúp tiết kiệm từ 59-70% chi phí tổng thể mà vẫn duy trì hiệu suất làm việc.

Claude-real-video: Công cụ giúp mọi LLM 'xem' và hiểu nội dung video

Nguồn: Hacker News Nổi bật (buzzing.cc bản dịch tiếng Trung) · Bài gốc

Claude-real-video là công cụ mã nguồn mở cho phép các mô hình ngôn ngữ lớn phân tích video thông qua hình ảnh và âm thanh thay vì chỉ dựa vào phụ đề. Toàn bộ quá trình xử lý diễn ra cục bộ, đảm bảo tính riêng tư và hỗ trợ cả YouTube lẫn tệp tin nội bộ.