Kling — серия видеомоделей от китайской компании Kuaishou, которая регулярно занимает верхние строчки в независимых бенчмарках видеогенерации. Версия v2.1 существенно улучшила реалистичность физики по сравнению с предшественниками: вода течёт и плещется с правдоподобными завихрениями, ткань реагирует на ветер и движение, огонь развивается динамично. Именно за это Kling часто называют лучшей моделью для анимации портретов и природных сцен.
Модель работает в двух режимах. В режиме Image-to-Video (i2v) вы загружаете фото и получаете видеоклип с органичным движением. В режиме Text-to-Video (t2v) вы описываете сцену текстом — модель генерирует её с нуля. В обоих случаях можно управлять движением камеры, добавляя в промпт инструкции вроде «slow pan right» или «cinematic zoom out».
Стоимость — 30 кредитов за I2V и 20 за T2V — отражает высокие вычислительные затраты на генерацию. Если бюджет ограничен, Wan 2.1 даёт хороший результат за 4 кредита.