12 актуальних AI відео-моделей. Сім критеріїв. 12 сигнатур.
Абсолютний лідер по моушну та реалізму. Фізика руху, м'язи, тканини, волосся — все відпрацьовує на рівні живого кадру. Сильний функціонал з рефом, мульти-шотом та зйомкою одним кадром — це фактично продакшн-комбайн. Мінус один — висока цензура, через що підійде не для всіх генерацій і точно не для анімації відомих людей чи брендів.
Єдина модель у списку з повноцінним 4K на виході. Чудовий моушн і візуальна естетика сцени, синхрон аудіо і алаймент до промпту також на висоті. Найкращий баланс ціни та якості у топ-трьох — $1.11 за генерацію.
Найвищий бал по alignment у списку — слухає промпт буквально слово в слово. Висока консистентність сцени і дуже сильна стабільність кадру «з коробки» — генерації дають мінімум мутацій. Слабкі сторони — обмежений функціонал та наявність не на всіх платформах. Робоча модель для коротких віральних форматів.
Якість руху в кадрі: фізика тіл, реалізм анімації людей і тварин, плавність рухів камери. Чим вищий бал, тим менше «гумових» рук і пливучих кінцівок.
Естетика картинки «з коробки»: композиція, кольорокорекція, кіношність кадру, відчуття «дорогого» продакшну без додаткового допилу.
Точність слідування промпту: чи робить модель саме те, що написано, чи додає від себе. Включає роботу з негативними промптами і деталями.
Консистентність сцени: збереження персонажа, обʼєктів, освітлення, локації протягом усього ролика. Уникнення «мерехтіння» обʼєктів і їх мутацій між кадрами.
Синхронізація аудіо і відео: липсинк, генерація саундтреку та звукових ефектів. 0 — функції немає взагалі, 10 — повноцінний звук синхронно з кадром та голосом українською.
Максимальна роздільна здатність на виході. 720p — 5, 1080p — 9, 4K — 10. Впливає на придатність матеріалу для великих екранів і пост-продакшну.
Набір продакшн-фіч: кейфрейми, мульти-шот, референс-модель, extend video, motion control, інпейнтинг, рівень цензури. Чим вищий бал — тим ширший інструментарій.