Google ra mắt mô hình AI Veo và Imagen 3 cho phép tạo video/hình ảnh từ văn bản, hỗ trợ độ phân giải 1080p, nhiều góc nhìn khác nhau.
Tại sự kiện Google I/O năm nay, "gã khổng lồ" công nghệ vừa giới thiệu hai mô hình AI mới đầy hứa hẹn mang tên Veo và Imagen 3. Công cụ Imagen 3 sở hữu khả năng chuyển đổi văn bản thành hình ảnh chất lượng cao, trong khi Veo hỗ trợ tạo ra video với độ phân giải 1080p.
Veo cho phép người dùng sáng tạo video từ nhiều góc nhìn khác nhau. Theo công bố của Google, Veo được trang bị khả năng hiểu biết nâng cao về ngôn ngữ và bối cảnh tự nhiên, giúp tạo ra những đoạn video gần gũi và trung thực với tầm nhìn của người xem. Thậm chí, Veo còn có thể dễ dàng bắt nhịp với các kỹ thuật điện ảnh phức tạp hiện nay như timelapse hay quay cảnh từ trên không.
Giải thích thêm về Veo, Google khẳng định mô hình AI này có khả năng tạo ra những cảnh quay nhất quán, mô tả xuất sắc chuyển động của con người, động vật và các vật thể. Những đoạn video được tạo ra cũng có thể được điều chỉnh thêm thông qua các lệnh bổ sung. Hiện Google đang nghiên cứu tính năng mới để Veo có thể sản xuất ra những góc quay và phân cảnh dài hơn nữa.
Tuy nhiên, hiện tại khả năng của Veo vẫn đang trong giai đoạn trải nghiệm hạn chế với một số nhà làm phim và nhà sáng tạo nội dung. Dù vậy, Google khẳng định người dùng hoàn toàn có thể yêu cầu tạo ra video dài hơn 1 phút.
Động thái ra mắt Veo của Google được xem là màn đối đầu trực tiếp với mô hình AI Sora vừa được OpenAI giới thiệu vài tháng trước đó. Song song đó, các "ông lớn" công nghệ khác như Microsoft cũng vừa trình làng công cụ VASA-1 để tạo video từ hình ảnh.