OpenAI giới thiệu Sora, mô hình AI chuyển văn bản thành video

0:00 / 0:00
0:00
  • Nam miền Bắc
  • Nữ miền Bắc
  • Nữ miền Nam
  • Nam miền Nam

(PLO)- Sora là mô hình AI có thể tạo ra những video chân thực, giàu trí tưởng tượng từ những hướng dẫn bằng văn bản.

Mới đây, OpenAI (công ty mẹ của ChatGPT) đã tung ra một mô hình tạo video mới có tên là Sora. Mô hình AI này cho phép chuyển văn bản thành video chân thực dài tối đa một phút, tất cả đều dựa trên lời nhắc của người dùng.

Theo bài giới thiệu trên blog của OpenAI, Sora có khả năng tạo ra “những cảnh phức tạp với nhiều nhân vật, các kiểu chuyển động cụ thể cũng như các chi tiết chính xác về chủ đề và bối cảnh”. Công ty cũng lưu ý rằng mô hình này có thể hiểu cách các vật thể “tồn tại trong thế giới vật chất” cũng như “diễn giải chính xác các đạo cụ và tạo ra các nhân vật hấp dẫn thể hiện cảm xúc sống động”.

Một đoạn video được tạo bởi Sora. Nguồn: OpenAI

Sora cũng có thể tạo video dựa trên hình ảnh tĩnh cũng như điền vào các khung hình còn thiếu trên video hiện có hoặc mở rộng video đó. Các bản demo do Sora tạo có trong bài đăng trên blog của OpenAI bao gồm cảnh trên không của California trong cơn sốt vàng, một video trông như thể được quay từ bên trong một chuyến tàu ở Tokyo và các video khác.

OpenAI cho biết mô hình AI Sora có thể gặp khó khăn trong việc mô phỏng chính xác tính chất vật lý của một cảnh phức tạp, nhưng kết quả nhìn chung khá ấn tượng.

Đoạn phim lịch sử về California trong cơn sốt vàng được tạo bởi Sora. Ảnh chụp màn hình
Đoạn phim lịch sử về California trong cơn sốt vàng được tạo bởi Sora. Ảnh chụp màn hình

Trong thời gian gần đây, các công cụ AI hỗ trợ biến văn bản thành video ngày càng được quan tâm, đơn cử như Runway, Pika và Lumiere của Google. Tương tự như Sora, Lumiere cung cấp cho người dùng công cụ chuyển văn bản thành video và phép họ tạo video từ hình ảnh tĩnh.

Sora hiện chỉ dành cho một số ít người dùng thử nghiệm, đánh giá về mô hình và những tác hại, rủi ro tiềm ẩn. OpenAI cũng cung cấp quyền truy cập cho một số nghệ sĩ thị giác, nhà thiết kế và nhà làm phim để nhận phản hồi.

Đầu tháng này, OpenAI đã thông báo rằng họ sẽ thêm watermark vào công cụ chuyển văn bản thành hình ảnh DALL-E 3, nhưng lưu ý rằng chúng có thể “dễ dàng xóa bỏ”. Giống như các sản phẩm AI khác, Sora sẽ phải đối mặt với hậu quả của việc các video do AI tạo ra bị nhầm lẫn với video thật.

cong-cu-dall-e.jpeg
Công cụ tạo hình ảnh từ văn bản DALL-E của OpenAI. Ảnh: TIỂU MINH

Đọc thêm