CHỦ ĐỀ

Video AI

Tạo và hiểu video bằng AI: Mô hình text-to-video, công cụ biên tập video và cuộc cách mạng điện ảnh sáng tạo.

🔥 Tiêu điểm:Wan Video ra mắt tính năng 'Nhảy theo nhạc': Biến nhân vật thành vũ công chuyên nghiệp16:12

03/07

12:14

Hacker News Nổi bật（buzzing.cc bản dịch tiếng Trung）

Nổi bật⚡️ Đề xuất 81

Claude-real-video: Công cụ giúp mọi LLM 'xem' và hiểu nội dung video

Claude-real-video là công cụ mã nguồn mở cho phép các mô hình ngôn ngữ lớn phân tích video thông qua hình ảnh và âm thanh thay vì chỉ dựa vào phụ đề. Toàn bộ quá trình xử lý diễn ra cục bộ, đảm bảo tính riêng tư và hỗ trợ cả YouTube lẫn tệp tin nội bộ.

Đa phương thứcMã nguồn mởCông cụ AIXử lý videoLLM

💡 Lý do đề xuất: Giải pháp thực tế, hữu ích cho việc khai thác đa phương thức trên các LLM hiện có, đặc biệt là khả năng xử lý cục bộ giúp bảo mật dữ liệu.

02/07

00:08

Apple Machine Learning Research（RSS）

Nổi bật🔥 Nổi bật 56

VideoFlexTok: Bước đột phá trong nén và biểu diễn video với cấu trúc token linh hoạt

VideoFlexTok giới thiệu phương pháp biểu diễn video bằng chuỗi token có độ dài tùy biến theo cấu trúc từ thô đến tinh, giúp tối ưu hóa tài nguyên tính toán và cho phép xử lý video dài hơn gấp 8 lần so với các phương pháp truyền thống mà vẫn giữ nguyên chất lượng.

Video AINghiên cứu AINén dữ liệuApple ResearchGenerative AI

💡 Lý do đề xuất: Đây là nghiên cứu quan trọng từ Apple giúp giải quyết bài toán hiệu suất trong tạo video AI, có tính ứng dụng cao cho các mô hình thế hệ mới.

23:06

IT Home（RSS）

Nổi bật🔥 Nổi bật 71

Kuaishou huy động 2 tỷ USD cho Kling AI, định giá công ty đạt 18 tỷ USD

Kuaishou vừa huy động thành công 2,028 tỷ USD từ các nhà đầu tư cho dự án Kling AI, nâng định giá công ty lên 18 tỷ USD. Hãng dự kiến sẽ đưa Kling AI lên sàn chứng khoán Hồng Kông trong 12 tháng tới để mở rộng hạ tầng tính toán và dữ liệu.

Kling AIKuaishouĐầu tư AIVideo AIKỳ lân công nghệ

💡 Lý do đề xuất: Tin tức quan trọng về dòng vốn lớn trong ngành AI tạo video, phản ánh xu hướng thương mại hóa mạnh mẽ của các mô hình AI Trung Quốc.

18:39

X：Shao Meng (@shao__meng)

Nổi bật⚡️ Đề xuất 79

browser-use ra mắt 'video-use': Công cụ AI mã nguồn mở giúp tự động hóa biên tập video

Đội ngũ browser-use vừa giới thiệu 'video-use', bộ kỹ năng cho phép các AI Agent như Claude Code tự động biên tập video thông qua quy trình xử lý âm thanh, tạo EDL và render bằng ffmpeg với độ chính xác cao.

AI AgentMã nguồn mởBiên tập videoTự động hóaCông nghệ

💡 Lý do đề xuất: Đây là bước tiến quan trọng trong việc kết hợp AI Agent với quy trình hậu kỳ video chuyên nghiệp, có tính ứng dụng thực tế cao cho các nhà phát triển và sáng tạo nội dung.

01/07

02:55

X：NotebookLM (@NotebookLM)

Nổi bật🔥 Nổi bật 68

NotebookLM ra mắt tính năng tạo video tóm tắt 60 giây cho người dùng web

Google chính thức cập nhật tính năng Short Video Overviews trên nền tảng web của NotebookLM, cho phép tự động chuyển đổi tài liệu phức tạp thành video dọc 60 giây để giải thích khái niệm.

GoogleNotebookLMAIVideoCập nhật sản phẩm

💡 Lý do đề xuất: Tính năng này giúp tối ưu hóa cách tiếp cận thông tin, rất hữu ích cho người dùng phổ thông và sáng tạo nội dung, đánh dấu bước tiến mới trong ứng dụng AI của Google.

30/06

00:19

Simon Willison Blog

Nổi bật🔥 Nổi bật 73

Tự động hóa quay video demo sản phẩm bằng AI Agent với shot-scraper

Phiên bản shot-scraper 1.10 bổ sung tính năng quay video thao tác trình duyệt thông qua file cấu hình, giúp các AI Agent dễ dàng tạo video demo sản phẩm một cách chuyên nghiệp và chính xác.

Công cụ AITự động hóaPhát triển phần mềmAgentSản phẩm mới

💡 Lý do đề xuất: Công cụ hữu ích cho nhà phát triển muốn tự động hóa quy trình làm video demo, đặc biệt tối ưu cho việc tích hợp với AI Agent.

27/06

20:24

X：Runway (@runwayml)

Nổi bật🔥 Nổi bật 66

Runway ra mắt tính năng 'Recipe' hỗ trợ bản địa hóa quảng cáo qua API

Runway vừa tích hợp tính năng bản địa hóa quảng cáo vào API, cho phép người dùng dịch nội dung hình ảnh và quảng cáo tĩnh chỉ với một lệnh gọi duy nhất.

RunwayAPIBản địa hóaQuảng cáoAI

💡 Lý do đề xuất: Đây là cập nhật quan trọng cho các nhà quảng cáo và doanh nghiệp, giúp tối ưu hóa quy trình sản xuất nội dung đa ngôn ngữ bằng AI một cách tự động.

24/06

10:12

HuggingFace Daily Papers (Nổi bậtBài nghiên cứu)

Nổi bật🔥 Nổi bật 70

Causal-rCM: Bước đột phá trong chưng cất mô hình khuếch tán video tự hồi quy

Causal-rCM giới thiệu phương pháp huấn luyện kết hợp giữa ép buộc giáo viên (TF) và tự ép buộc (SF), giúp tăng tốc độ hội tụ gấp 10 lần. Công nghệ này cho phép tạo video chất lượng cao chỉ với 1-2 bước lấy mẫu, thiết lập chuẩn mực mới cho mô hình thế giới tương tác.

AI tạo videoMô hình khuếch tánNghiên cứu AITối ưu hóa mô hìnhWan2.1

💡 Lý do đề xuất: Đây là nghiên cứu quan trọng giúp tối ưu hóa đáng kể hiệu suất tạo video thời gian thực, có tính ứng dụng cao trong các mô hình thế giới và video AI thế hệ mới.

04:45

X：Runway (@runwayml)

Nổi bật🔥 Nổi bật 72

Runway ra mắt bộ ba mô hình AI mới: Seedance 4K, Seedance Mini và Kling 3.0 Turbo

Runway vừa chính thức trình làng ba mô hình AI đột phá gồm Seedance 4K, Seedance Mini và Kling 3.0 Turbo. Người dùng có thể trải nghiệm ngay với ưu đãi giảm giá 30% trong 3 tháng đầu tiên khi sử dụng mã 30RUNWAY.

RunwayAI VideoCập nhật sản phẩmSeedanceKling

💡 Lý do đề xuất: Đây là bản cập nhật quan trọng từ một trong những đơn vị dẫn đầu ngành video AI, mang tính ứng dụng cao và có ưu đãi trực tiếp cho người dùng.

02:21

X：Sky Computing Lab (@haoailab)

Nổi bật🔥 Nổi bật 73

FastWan-QAD: Tạo video 5 giây chỉ trong 1.8 giây trên card đồ họa RTX 5090

Sky Computing Lab ra mắt FastWan-QAD, mô hình tạo video sử dụng kỹ thuật chưng cất nhận thức lượng tử, cho phép tạo video 480P siêu tốc trên phần cứng tiêu dùng.

Tạo videoFastWanMã nguồn mởRTX 5090AI tạo sinh

💡 Lý do đề xuất: Bước tiến đột phá về tốc độ tạo video trên phần cứng cá nhân, có tính ứng dụng thực tiễn cao và đã mở mã nguồn cho cộng đồng.

19/06

19:51

X：Elvis Saravia (@omarsar0, DAIR.AI)

Nổi bật🔥 Nổi bật 75

Biến video YouTube thành tài liệu Artifacts với công cụ /youtube-notetaker

Khám phá cách sử dụng kỹ năng /youtube-notetaker để tự động trích xuất slide, ghi chú và nội dung chuyển ngữ từ video YouTube thành định dạng Artifacts tiện lợi.

YouTubeGhi chúNăng suấtCông cụ AITự động hóa

💡 Lý do đề xuất: Công cụ cực kỳ hữu ích cho người học và làm việc, giúp tiết kiệm thời gian tóm tắt nội dung video dài một cách trực quan và hiệu quả.

18/06

20:21

The Decoder：AI News（RSS）

Nổi bật🔥 Nổi bật 72

Adobe tích hợp AI Agent vào Photoshop, Premiere và hệ sinh thái Creative Cloud

Adobe ra mắt AI Assistant dưới dạng thử nghiệm, cho phép tự động hóa các tác vụ phức tạp như biên tập video, xử lý ảnh và dàn trang. Công cụ này cũng mở rộng khả năng tích hợp sâu với các nền tảng như ChatGPT, Claude và Microsoft 365.

AdobeAI AgentSáng tạoTự động hóaCreative Cloud

💡 Lý do đề xuất: Tin tức quan trọng về việc ứng dụng AI Agent vào quy trình làm việc chuyên nghiệp, tác động trực tiếp đến cộng đồng sáng tạo và người dùng Adobe.

14:55

HuggingFace Daily Papers (Nổi bậtBài nghiên cứu)

Nổi bật🔥 Nổi bật 75

HumanScale: Dùng video góc nhìn thứ nhất của con người để huấn luyện robot hiệu quả hơn dữ liệu thực tế

Nghiên cứu chứng minh việc tận dụng video góc nhìn thứ nhất của con người giúp mô hình robot cải thiện 52.5% tỷ lệ thành công trong các tác vụ quen thuộc và 90% với tác vụ mới, mở ra hướng đi mới cho việc mở rộng quy mô dữ liệu huấn luyện robot.

Robot hiện thânRobotHọc máyDữ liệu huấn luyệnAI

17/06

07:21

X：Baoyu (@dotey)

Nổi bật🔥 Nổi bật 75

Baoyu-design cập nhật tính năng xuất video hoạt họa chất lượng cao

Công cụ baoyu-design vừa bổ sung tính năng xuất video hoạt họa dựa trên cơ chế render từng khung hình qua Chromium và ffmpeg, đảm bảo độ chính xác tuyệt đối cho các chuyển động phức tạp.

Công cụ thiết kếMã nguồn mởVideoTự động hóa

💡 Lý do đề xuất: Giải pháp kỹ thuật thông minh cho việc xuất video từ web-based design, có tính ứng dụng cao cho người dùng chuyên nghiệp và cộng đồng mã nguồn mở.

16/06

08:49

IT Home（RSS）

Nổi bật🔥 Nổi bật 70

ByteDance ra mắt Seedance 2.0 Mini: Tạo video AI nhanh gấp đôi với chi phí giảm một nửa

ByteDance vừa giới thiệu mô hình tạo video Seedance 2.0 Mini với tốc độ nhanh gấp đôi và chi phí vận hành giảm 50% so với bản tiêu chuẩn, hướng tới các tác vụ sản xuất nội dung thương mại điện tử và marketing quy mô lớn.

ByteDanceAI tạo videoSeedanceTối ưu chi phíCông nghệ AI

💡 Lý do đề xuất: Tin tức quan trọng về tối ưu hóa chi phí trong AI tạo video, có tính ứng dụng cao cho doanh nghiệp và người sáng tạo nội dung tại Việt Nam.

01:30

TechCrunch：AI（RSS）

Nổi bật🔥 Nổi bật 71

Meta ra mắt 'AI Mode' trên Facebook: Tổng hợp thông tin từ bài đăng công khai

Meta tích hợp 'AI Mode' vào Facebook, cho phép người dùng truy vấn thông tin từ các bài đăng công khai, đồng thời bổ sung loạt tính năng chỉnh sửa ảnh và video bằng AI đầy thú vị.

MetaFacebookAISáng tạo nội dungCông nghệ

💡 Lý do đề xuất: Tính năng mới giúp tối ưu hóa trải nghiệm tìm kiếm và sáng tạo nội dung trên mạng xã hội, có tính ứng dụng cao cho người dùng phổ thông.

12/06

00:05

X：Logan Kilpatrick (@OfficialLoganK)

Nổi bật⚡️ Đề xuất 81

Gemini Omni Flash đạt chuẩn SATA trong tạo video và chỉnh sửa video

Logan Kilpatrick từ Google xác nhận Gemini Omni Flash đã đạt hiệu suất SATA trong các tác vụ chuyển đổi hình ảnh/văn bản sang video và chỉnh sửa video, chuẩn bị ra mắt API cho nhà phát triển.

GoogleGeminiTạo videoĐa phương thứcAPI

💡 Lý do đề xuất: Đây là bước tiến quan trọng về khả năng đa phương thức của Google, mở ra tiềm năng lớn cho các nhà phát triển ứng dụng sáng tạo nội dung.

11/06

07:00

HuggingFace Daily Papers (Nổi bậtBài nghiên cứu)

Nổi bật🔥 Nổi bật 73

HYDRA-X: Mô hình đa phương thức hợp nhất với bộ phân tách hình ảnh toàn diện

HYDRA-X là mô hình đầu tiên hợp nhất quá trình xử lý ảnh và video trong một Vision Transformer duy nhất, giúp tối ưu hóa khả năng hiểu và tạo nội dung đa phương thức với hiệu suất vượt trội.

Đa phương thứcThị giác máy tínhNghiên cứu AIVideo AIMô hình ngôn ngữ

💡 Lý do đề xuất: Đây là bước tiến quan trọng trong kiến trúc đa phương thức, giải quyết bài toán hợp nhất xử lý ảnh và video hiệu quả, rất đáng chú ý cho giới nghiên cứu AI.

10/06

15:56

HuggingFace Daily Papers (Nổi bậtBài nghiên cứu)

Nổi bật🔥 Nổi bật 70

Kwai Keye-VL-2.0: Mô hình đa phương thức mã nguồn mở xử lý video dài 256K

Kwai Keye-VL-2.0 là mô hình MoE đa phương thức mới, ứng dụng DeepSeek Sparse Attention để xử lý video dài hàng giờ với ngữ cảnh 256K mà không mất dữ liệu, tối ưu hóa hiệu suất cho các tác vụ thông minh.

AIVideoAIMoEDeepSeekMultimodal

💡 Lý do đề xuất: Đây là bước tiến kỹ thuật quan trọng trong xử lý video dài (long-video) bằng kiến trúc MoE và DSA, có tính ứng dụng cao cho các hệ thống AI phân tích video quy mô lớn.

11:56

HuggingFace Daily Papers (Nổi bậtBài nghiên cứu)

Nổi bật🔥 Nổi bật 73

Flow-DPPO: Tối ưu hóa mô hình Flow Matching bằng ràng buộc phân kỳ thay vì cắt tỉa tỷ lệ

Flow-DPPO cải tiến việc huấn luyện mô hình sinh ảnh/video bằng cách thay thế kỹ thuật cắt tỉa tỷ lệ (ratio clipping) bằng ràng buộc phân kỳ KL, giúp ổn định quá trình học tăng cường cho các mô hình Flow Matching.

Flow MatchingHọc tăng cườngGenerative AINghiên cứu AITối ưu hóa

💡 Lý do đề xuất: Giải quyết vấn đề kỹ thuật quan trọng trong huấn luyện mô hình sinh (generative models). Phương pháp mới có cơ sở toán học rõ ràng, hữu ích cho cộng đồng nghiên cứu AI tại Việt Nam.

07:00

Hugging Face Daily Papers

Nổi bật⚡️ Đề xuất 85

MilliVid: Giải pháp tạo video nhất quán dài hạn thông qua phân cấp không gian latent

MilliVid giải quyết thách thức về tính nhất quán trong video dài bằng cách sử dụng cơ chế tạo từ thô đến tinh trên không gian token đa quy mô, giúp tối ưu hóa tài nguyên tính toán mà vẫn đảm bảo chi tiết hình ảnh.

Video AIGenerative AINghiên cứu AIMilliVidComputer Vision

💡 Lý do đề xuất: Đây là một bước tiến kỹ thuật quan trọng trong lĩnh vực video generative, giải quyết trực tiếp bài toán khó về độ dài và tính nhất quán của video bằng cách tiếp cận phân cấp thông minh.

09/06

23:59

Luma

Nổi bật⚡️ Đề xuất 78

Luma AI ra mắt Ray 3.2 API: Đưa công nghệ render chuẩn điện ảnh vào ứng dụng của bạn

Luma AI vừa phát hành Ray 3.2 API, cho phép các nhà phát triển và doanh nghiệp tích hợp khả năng render video chất lượng điện ảnh trực tiếp vào sản phẩm của mình.

Cập nhật sản phẩmVideo

💡 Lý do đề xuất: Đây là bản cập nhật quan trọng cho các nhà phát triển muốn ứng dụng AI tạo video chất lượng cao vào quy trình sản xuất thực tế, có tính ứng dụng thương mại rất cao.

05/06

21:41

ViggleAI

Nổi bật🔥 Nổi bật 65

Viggle AI: Biến video cá nhân thành chuyển động 3D chuyên nghiệp mà không cần thiết bị đắt tiền

Viggle AI cho phép người dùng tạo dữ liệu chuyển động (mocap) chỉ từ video quay bằng điện thoại. Công cụ hiện đang trong giai đoạn thử nghiệm và hoàn toàn miễn phí cho mọi người dùng.

Cập nhật sản phẩmVideo

💡 Lý do đề xuất: Công nghệ giúp dân chủ hóa kỹ thuật mocap vốn đắt đỏ, tính ứng dụng cao cho người sáng tạo nội dung và nhà làm phim độc lập.

30/05

03:55

Luma

Nổi bật🔥 Nổi bật 61

Luma Agents: Tự động hóa thiết kế hình ảnh quảng cáo từ nội dung blog

Luma Labs ra mắt tính năng mới cho phép AI tự động phân tích nội dung blog, xác định thông điệp chính và tạo ra các hình ảnh quảng cáo chuyên nghiệp chỉ từ một đường dẫn.

Cập nhật sản phẩmTạo hình ảnhVideo

💡 Lý do đề xuất: Công cụ thực tiễn cao, giúp tối ưu hóa quy trình làm marketing cho người sáng tạo nội dung, ứng dụng trực tiếp công nghệ AI tạo sinh vào công việc hàng ngày.

03:10

Runway

Nổi bật🔥 Nổi bật 72

Runway API cập nhật hàng loạt mô hình mới: Seedance 2.0, GPT Image 2 và nhiều công cụ mạnh mẽ khác

Runway vừa bổ sung hàng loạt mô hình tiên tiến như Seedance 2.0, GPT Image 2 và Magnific Precision Upscaler V2 vào API, giúp các nhà phát triển dễ dàng tích hợp khả năng tạo nội dung đỉnh cao vào ứng dụng của mình.

Cập nhật sản phẩmTạo hình ảnh

💡 Lý do đề xuất: Cập nhật quan trọng cho cộng đồng lập trình viên và doanh nghiệp muốn ứng dụng AI tạo sinh vào sản phẩm thực tế với các mô hình hàng đầu.

02:06

Google Gemini

Nổi bật🔥 Nổi bật 74

Gemini Omni biến nét vẽ nguệch ngoạc thành hiện thực sống động

Google giới thiệu tính năng mới trên Gemini Omni, cho phép người dùng biến các bản phác thảo đơn giản thành hình ảnh thực tế thông qua video và câu lệnh tương tác.

GoogleCập nhật sản phẩm

💡 Lý do đề xuất: Tính năng thể hiện sức mạnh đa phương thức ấn tượng của Gemini, có tính ứng dụng cao và tạo trải nghiệm thú vị cho người dùng phổ thông.

01/06

07:00

Hugging Face Daily Papers

Nổi bật⚡️ Đề xuất 85

StateKV: Giải pháp tối ưu hóa mô hình ngôn ngữ thị giác cho video dài với độ phức tạp tuyến tính

StateKV là phương pháp mới giúp các mô hình VLM xử lý video dài hiệu quả hơn bằng cách sử dụng trạng thái tái phát có trọng số, giúp duy trì độ chính xác cao mà không làm tăng chi phí tính toán theo số lượng khung hình.

AIVideoVLMComputerVisionDeepLearningNghiên cứuAI

💡 Lý do đề xuất: Nghiên cứu giải quyết bài toán hóc búa về độ trễ và chi phí tính toán cho video dài, có tính ứng dụng cao trong phát triển AI thế hệ mới.

07:00

Hugging Face Daily Papers

Nổi bật⚡️ Đề xuất 85

Light Interaction: Tăng tốc suy luận không cần huấn luyện cho mô hình thế giới video tương tác

Light Interaction là khung tăng tốc suy luận giúp tối ưu hóa mô hình thế giới video bằng cách quản lý ngữ cảnh linh hoạt, cho phép tái sử dụng dữ liệu và giảm độ phức tạp tính toán mà không cần huấn luyện lại.

AIVideoGenerativeSuyLuậnTốiƯuHóaMôHìnhThếGiới

💡 Lý do đề xuất: Giải quyết vấn đề chi phí tính toán cao trong mô hình video tương tác bằng phương pháp thông minh, có tính ứng dụng cao cho game và AI mô phỏng.

07:00

Hugging Face Daily Papers

Nổi bật⚡️ Đề xuất 85

Lumos-Nexus: Đột phá hiệu suất tạo video nhờ kỹ thuật cầu nối tần số trong không gian tiềm ẩn

Lumos-Nexus là khung tạo video hợp nhất giúp tối ưu hóa tài nguyên bằng cách tách biệt quá trình huấn luyện nhẹ và suy luận chất lượng cao thông qua kỹ thuật cầu nối tần số, cho phép tạo video sắc nét mà không cần huấn luyện lại toàn bộ mô hình lớn.

AI tạo videoMô hình hợp nhấtTối ưu hóa AINghiên cứu AIGenerative Video

💡 Lý do đề xuất: Giải pháp kỹ thuật thông minh giúp giải quyết bài toán chi phí tính toán trong tạo video, có tính ứng dụng cao cho các mô hình AI tạo sinh hiện nay.

Video AI

Tin tinh chọn

03/07

Claude-real-video: Công cụ giúp mọi LLM 'xem' và hiểu nội dung video

02/07

VideoFlexTok: Bước đột phá trong nén và biểu diễn video với cấu trúc token linh hoạt

Kuaishou huy động 2 tỷ USD cho Kling AI, định giá công ty đạt 18 tỷ USD

browser-use ra mắt 'video-use': Công cụ AI mã nguồn mở giúp tự động hóa biên tập video

01/07

NotebookLM ra mắt tính năng tạo video tóm tắt 60 giây cho người dùng web

30/06

Tự động hóa quay video demo sản phẩm bằng AI Agent với shot-scraper

27/06

Runway ra mắt tính năng 'Recipe' hỗ trợ bản địa hóa quảng cáo qua API

24/06

Causal-rCM: Bước đột phá trong chưng cất mô hình khuếch tán video tự hồi quy

Runway ra mắt bộ ba mô hình AI mới: Seedance 4K, Seedance Mini và Kling 3.0 Turbo

FastWan-QAD: Tạo video 5 giây chỉ trong 1.8 giây trên card đồ họa RTX 5090

19/06

Biến video YouTube thành tài liệu Artifacts với công cụ /youtube-notetaker

18/06

Adobe tích hợp AI Agent vào Photoshop, Premiere và hệ sinh thái Creative Cloud

HumanScale: Dùng video góc nhìn thứ nhất của con người để huấn luyện robot hiệu quả hơn dữ liệu thực tế

17/06

Baoyu-design cập nhật tính năng xuất video hoạt họa chất lượng cao

16/06

ByteDance ra mắt Seedance 2.0 Mini: Tạo video AI nhanh gấp đôi với chi phí giảm một nửa

Meta ra mắt 'AI Mode' trên Facebook: Tổng hợp thông tin từ bài đăng công khai

12/06

Gemini Omni Flash đạt chuẩn SATA trong tạo video và chỉnh sửa video

11/06

HYDRA-X: Mô hình đa phương thức hợp nhất với bộ phân tách hình ảnh toàn diện

10/06

Kwai Keye-VL-2.0: Mô hình đa phương thức mã nguồn mở xử lý video dài 256K

Flow-DPPO: Tối ưu hóa mô hình Flow Matching bằng ràng buộc phân kỳ thay vì cắt tỉa tỷ lệ

MilliVid: Giải pháp tạo video nhất quán dài hạn thông qua phân cấp không gian latent

09/06

Luma AI ra mắt Ray 3.2 API: Đưa công nghệ render chuẩn điện ảnh vào ứng dụng của bạn

05/06

Viggle AI: Biến video cá nhân thành chuyển động 3D chuyên nghiệp mà không cần thiết bị đắt tiền

30/05

Luma Agents: Tự động hóa thiết kế hình ảnh quảng cáo từ nội dung blog

Runway API cập nhật hàng loạt mô hình mới: Seedance 2.0, GPT Image 2 và nhiều công cụ mạnh mẽ khác

Gemini Omni biến nét vẽ nguệch ngoạc thành hiện thực sống động

01/06

StateKV: Giải pháp tối ưu hóa mô hình ngôn ngữ thị giác cho video dài với độ phức tạp tuyến tính

Light Interaction: Tăng tốc suy luận không cần huấn luyện cho mô hình thế giới video tương tác

Lumos-Nexus: Đột phá hiệu suất tạo video nhờ kỹ thuật cầu nối tần số trong không gian tiềm ẩn