1. “Ingredients to Video”: Cuộc Cách Mạng Về Tính Nhất Quán Veo 3.1
Một trong những điểm yếu lớn nhất của video AI từ trước đến nay là “sự biến dạng” của nhân vật hoặc bối cảnh giữa các khung hình. Với tính năng Ingredients to Video (Nguyên liệu tạo video), Veo 3.1 cho phép người dùng tải lên tối đa 3 hình ảnh tham chiếu về nhân vật, vật thể hoặc bối cảnh.
Kết quả là mô hình AI có thể duy trì danh tính nhân vật xuyên suốt các cảnh quay khác nhau. Điều này mở ra cơ hội cho việc làm phim dài tập hoặc kể chuyện có chiều sâu, nơi nhân vật không bị thay đổi khuôn mặt hay trang phục một cách ngẫu nhiên.
2. Ưu Tiên Định Dạng Dọc (Native Vertical Output) Veo 3.1
Nhắm thẳng vào thị trường nội dung ngắn đang bùng nổ như YouTube Shorts, TikTok và Instagram Reels, Veo 3.1 hiện hỗ trợ xuất video định dạng dọc (9:16) một cách bản xứ.
Thay vì phải tạo video ngang rồi cắt cúp (crop) làm mất chi tiết, Veo 3.1 tính toán bố cục ngay từ đầu để tối ưu cho màn hình điện thoại. Sự tích hợp trực tiếp vào ứng dụng YouTube Create giúp các nhà sáng tạo có thể biến ý tưởng thành video ngắn chỉ trong vài phút.
3. Nâng Cấp Độ Phân Giải Lên 1080p và 4K Veo 3.1
Để đáp ứng tiêu chuẩn khắt khe của các nhà sản xuất chuyên nghiệp, Google đã bổ sung khả năng Upscale (nâng cấp độ phân giải) lên 1080p và thậm chí là 4K.
1080p: Mang lại hình ảnh sắc nét, sạch sẽ, lý tưởng cho việc biên tập hậu kỳ.
4K: Tập trung vào các kết cấu (texture) phức tạp như da người, sợi vải hay chuyển động của chất lỏng, mang lại độ chân thực đáng kinh ngạc.
Tính năng này hiện khả dụng trên các nền tảng dành cho doanh nghiệp và chuyên gia như Google Flow, Gemini API và Vertex AI.
4. Âm Thanh Bản Xứ (Native Audio) và Điều Khiển Kể Chuyện
Veo 3.1 không chỉ tạo ra hình ảnh mà còn tự động tạo ra âm thanh đi kèm (tiếng động môi trường, hiệu ứng âm thanh, và thậm chí là lời thoại khớp với khẩu hình – Lip-sync).
Ngoài ra, hai công cụ mới là “First & Last Frame” (Khung hình đầu và cuối) và “Scene Extension” (Mở rộng cảnh quay) giúp người dùng kiểm soát mạch phim tốt hơn. Bạn có thể định hướng điểm bắt đầu và kết thúc của một hành động, hoặc kéo dài một video sẵn có lên hơn một phút mà vẫn giữ được sự liền mạch về mặt hình thái và âm thanh.
5. An Toàn Và Minh Bạch Với SynthID
Đi đôi với sức mạnh tạo hình ảnh cực kỳ chân thực là trách nhiệm về an toàn thông tin. Google tích hợp công nghệ SynthID vào Veo 3.1 để đóng dấu chìm kỹ thuật số vào video. Dấu chìm này không thể nhìn thấy bằng mắt thường nhưng có thể được nhận diện bởi các công cụ kiểm soát, giúp phân biệt rõ ràng đâu là nội dung do AI tạo ra, từ đó hạn chế tin giả và bảo vệ quyền sở hữu trí tuệ.
Tổng Kết
Bản cập nhật Veo 3.1 là minh chứng cho thấy Google đang chuyển dịch từ việc “trình diễn công nghệ” sang việc cung cấp “công cụ sản xuất thực thụ”. Với khả năng tạo video dọc chất lượng cao, tính nhất quán nhân vật vượt trội và hỗ trợ 4K, Veo 3.1 đang trở thành đối thủ nặng ký nhất của Sora (OpenAI) hay Kling AI trong cuộc đua điện ảnh hóa trí tuệ nhân tạo.


