ByteDance ra mắt Seedance 2.5: AI tạo video 4K dài 30 giây từ một câu lệnh

Cuộc đua phát triển AI tạo video vừa có thêm một đối thủ đáng gờm khi ByteDance chính thức giới thiệu Seedance 2.5, phiên bản mới nhất của mô hình tạo video bằng trí tuệ nhân tạo do hãng phát triển. Không chỉ nâng cấp đáng kể về chất lượng hình ảnh, Seedance 2.5 còn cho phép tạo video 4K dài tới 30 giây chỉ từ một câu lệnh (prompt), đồng thời hỗ trợ số lượng dữ liệu tham chiếu nhiều hơn gấp nhiều lần so với phiên bản trước.

Mô hình mới được ByteDance công bố tại một hội nghị diễn ra ở Bắc Kinh hồi giữa tháng. Đây được xem là bước tiến mới trong lĩnh vực AI tạo video, vốn đang phát triển với tốc độ rất nhanh trong vài năm gần đây.

Tạo video 30 giây độ phân giải 4K từ một prompt

Một trong những nâng cấp đáng chú ý nhất của Seedance 2.5 là khả năng tạo video có thời lượng lên tới 30 giây với độ phân giải 4K chỉ từ một câu lệnh mô tả.

Bên cạnh đó, người dùng còn có thể cung cấp tối đa 50 dữ liệu tham chiếu, bao gồm hình ảnh, video hoặc tệp âm thanh. Con số này cao hơn rất nhiều so với giới hạn chỉ 12 dữ liệu của Seedance 2.0.

Việc tăng số lượng dữ liệu tham chiếu giúp người dùng kiểm soát tốt hơn quá trình tạo video. AI có thể bám sát phong cách hình ảnh, nhân vật, bối cảnh hoặc âm thanh mà người dùng mong muốn, từ đó tạo ra kết quả có tính nhất quán cao hơn.

AI tạo video đang tiến bộ rất nhanh

Chỉ vài năm trước, những video đầu tiên do AI tạo ra vẫn còn khá thô sơ. Nhiều người hẳn vẫn nhớ đoạn video nổi tiếng mô tả diễn viên Will Smith ăn mì spaghetti với hình ảnh méo mó, chuyển động thiếu tự nhiên và được xem như biểu tượng cho những ngày đầu của AI tạo video.

Hiện nay, chất lượng đã được cải thiện đáng kể. Các mô hình mới có thể tạo ra hình ảnh chân thực hơn, chuyển động mượt mà hơn và xử lý tốt hơn các cảnh quay phức tạp. Điều này cũng kéo theo những lo ngại ngày càng lớn về nguy cơ xuất hiện deepfake hoặc các nội dung giả mạo có độ chân thực rất cao.

Chính vì vậy, nhiều chuyên gia cho rằng các video do AI tạo ra cần được gắn watermark hoặc có cơ chế nhận diện rõ ràng để người xem có thể phân biệt với nội dung thật.

Đối thủ đáng gờm của OpenAI và Google

Trong vài năm qua, ByteDance liên tục giới thiệu nhiều mô hình AI tạo video được đánh giá cao và đủ sức cạnh tranh với các đối thủ lớn trên thị trường.

Seedance 2.5 được kỳ vọng sẽ tiếp tục cạnh tranh trực tiếp với những nền tảng như Sora của OpenAI hay Veo 3 của Google.

Theo các thông tin được công bố, ByteDance dự kiến phát hành Seedance 2.5 tại thị trường Trung Quốc ngay trong tháng tới. Hiện hãng vẫn chưa tiết lộ thời điểm ra mắt tại các thị trường quốc tế.

Bài toán bản quyền vẫn chưa có lời giải

Bên cạnh những cải tiến về công nghệ, Seedance 2.5 cũng có thể tiếp tục đối mặt với các tranh cãi liên quan đến dữ liệu huấn luyện AI.

Trước đó, việc phát hành Seedance 2.0 tại Mỹ đã bị trì hoãn sau khi nhiều hãng phim Hollywood gây sức ép, cho rằng mô hình có thể đã sử dụng các tác phẩm có bản quyền trong quá trình huấn luyện mà chưa được cấp phép.

Nếu Seedance 2.5 mang lại chất lượng vượt trội hơn đáng kể so với thế hệ trước nhưng vẫn chưa giải quyết triệt để các vấn đề pháp lý và bản quyền, ByteDance nhiều khả năng sẽ tiếp tục phải đối mặt với những phản ứng tương tự khi mở rộng sang các thị trường khác.

AI tạo video đang bước sang một giai đoạn mới

Sự xuất hiện của Seedance 2.5 cho thấy cuộc đua AI tạo video đang ngày càng nóng lên. Các mô hình mới không chỉ tập trung nâng cao chất lượng hình ảnh mà còn hướng tới việc giúp người dùng kiểm soát nhiều hơn quá trình sáng tạo thông qua việc sử dụng hàng chục dữ liệu tham chiếu.

Nếu xu hướng này tiếp tục, việc tạo ra những đoạn video chất lượng cao chỉ từ một vài câu lệnh sẽ sớm trở thành công cụ quen thuộc đối với nhà sáng tạo nội dung, doanh nghiệp cũng như người dùng phổ thông. Tuy nhiên, song song với đó, các vấn đề về bản quyền, deepfake và xác thực nội dung cũng sẽ trở thành những thách thức lớn mà toàn ngành AI phải tìm cách giải quyết.