Главное за 30 секунд
В мае 2026 средний виральный AI-Short режется со скоростью 1.2 cut/сек — это значит новый кадр или явное визуальное событие происходит примерно каждые 800 миллисекунд. Это в 2.5 раза быстрее, чем «обычный» темп креаторов из 2023 года, и почти ровно совпадает с тем, как Sora 2, Veo 3.1 и Runway Gen-4 нарезают свои промпт-сцены по умолчанию.
Алгоритм YouTube Shorts и TikTok 2026 года использует не только общий retention rate, но и его форму: если ваша кривая удержания плоская — алгоритм видит длинные «мёртвые зоны». Каждая такая зона = причина показать видео меньшему количеству людей. Темп монтажа — это инструмент, которым вы напрямую управляете формой этой кривой.
В статье — бенчмарк темпа для 2026, правило 3-beat (откуда оно растёт), матрица длины кадров по 6 жанрам, разбор того, как Veo 3.1, Sora 2, Welder, Runway и Kling держат темп без After Effects, и чек-лист, который можно прикрутить к своему пайплайну за один вечер.
Почему темп монтажа — метрика №2 после хука
Хук решает, посмотрит ли человек первые три секунды. После хука работает уже не «обещание», а биология: вестибулярная и зрительная система обновляются каждые 200–400 мс, и мозг ждёт нового стимула. Если стимула нет — внимание дрейфует, и алгоритм фиксирует micro-drop в retention curve.
В 2026 70% completion rate — это новая планка для виральности (в 2024 хватало 50%). Алгоритм YouTube Shorts и TikTok For You сравнивают вашу видео-кривую с кривыми других роликов в той же длительности и нише. Если ваш ролик «провисает» дольше 1.5 секунды — соседи с более плотным монтажом обходят вас в раздаче.
Статичные кадры длиннее 5 секунд уменьшают retention на 25–35% по данным OpusClip за Q1 2026. Это не значит, что нужно резать каждые 0.5 сек подряд — вариация ритма (см. §«ошибки») важнее средней цифры. Но и средняя цифра должна попадать в коридор.
Бенчмарк 2026: 1.2 cut/сек как новая норма
OpusClip в январе 2026 проанализировал 13.5 млн виральных TikTok за январь–март. Findmecreators и Socialinsider дали похожие срезы по YouTube Shorts. Совпало два числа:
- средняя длина шота в виральных клипах: 760–820 миллисекунд;
- доля клипов с rapid-cut эпизодами (0.5–1 сек): 80.2% виральных против 41% у обычных.
Это даёт целевой темп 1.2–1.3 cut/сек как среднее по ролику. Никто не режет всё видео под метроном — есть «дыхание», — но в среднем виральные клипы 30–45 секунд содержат 35–55 явных монтажных склеек или визуальных событий.
Что считается «cut» в 2026:
- смена шота (новый план, новая сцена);
- сильное движение камеры (whip-pan, jump-cut, push-in);
- появление крупного текста или эмодзи поверх кадра;
- ducking — резкое изменение громкости фоновой музыки;
- новый звуковой эффект (SFX) — для аудио-визуального ритма он считается за cut.
Reels и YouTube Shorts терпимее к 1.0–1.1 cut/сек, потому что аудитория там в среднем на 4–6 лет старше TikTok. На VK Клипах в 2026 году срабатывает похожий темп, но с поправкой: первая ускоренная серия cut'ов лучше работает после 4–5 секунды, не сразу.
3-beat rule: главное правило сценарной нарезки
Правило, которое в 2025 году обкатали редакторы Captions и теперь используют почти все агентства AI-каналов: в каждый момент в кадре должно происходить ровно одно из трёх событий — visual beat, audio beat или text beat.
- Visual beat — смена шота, движение камеры, появление персонажа.
- Audio beat — удар музыки, SFX, акцент в голосе диктора.
- Text beat — новая строка субтитров, эмодзи, графика.
Если все три происходят одновременно — мозг получает overload, и retention падает. Если ни одного — viewer теряет нить за 1.5 сек. Идеальный паттерн: visual / audio / text сменяют друг друга в шахматном порядке каждые 700–1200 мс.
Конкретный пример 30-секундного AI-Short в нише «лор игр»:
- 0:00 — крупный заголовок-хук (text beat) + статичный кадр Veo 3.1;
- 0:01 — резкая склейка в новую сцену (visual beat);
- 0:02 — удар музыки + появление цифры на экране (audio + text);
- 0:03 — следующая сцена (visual);
- … и так до 0:30.
В итоге за 30 сек должно произойти 25–35 «бит» суммарно. Если меньше — ролик провисает; если больше — viewer не успевает считать смысл.
Длина шота по жанрам: матрица
Один и тот же темп не работает для лекции и для эзотерики. Вот эмпирическая матрица, которую мы собрали по 1 200+ AI-каналам внутри Welder за апрель 2026:
| Жанр / ниша | Целевая длина шота | Целевой cut/сек | Оптимальная длина ролика |
|---|---|---|---|
| Эзотерика, таро, гороскопы | 1.4–1.8 сек | 0.6–0.8 | 35–45 сек |
| Лор игр, мифология, история | 0.8–1.2 сек | 0.9–1.2 | 30–45 сек |
| Авиа / морские катастрофы | 0.7–1.0 сек | 1.0–1.4 | 35–50 сек |
| Лайфстайл / faceless-влог | 1.0–1.4 сек | 0.8–1.0 | 25–35 сек |
| Бизнес / B2B SaaS | 1.5–2.5 сек | 0.4–0.7 | 30–55 сек |
| Юмор / мемы | 0.5–0.8 сек | 1.2–1.7 | 15–22 сек |
B2B-аудитория терпит более длинные шоты, потому что воспринимает информацию текстом и графиками, а не движением. Для юмора, наоборот, темп должен опережать ожидание — это и есть ритмический сюрприз, который вызывает смех.
Эзотерика выглядит как исключение: казалось бы, темп должен быть медленный — но на практике он медленный только по визуалу. Голос ElevenLabs там идёт почти без пауз, и audio beat закрывает дыры между склейками. Если убрать плотную озвучку — retention рушится на 20–25%.
Как держать темп в AI-видео: что умеет каждая модель
В 2026 году пайплайн «промпт → видео» сильно отличается у разных провайдеров — и это напрямую влияет на ваш темп монтажа.
- Veo 3.1 (Google DeepMind) — нативно генерирует 8-секундные клипы с одним непрерывным шотом. Чтобы получить 1.2 cut/сек, вам нужно склеивать 5–7 коротких клипов в один Short. Стоимость: $0.40–0.50 за 8 секунд через Vertex AI. Есть Veo 3.1 Lite для черновиков ($0.15/8 сек).
- Sora 2 (OpenAI) — даёт более длинные сцены (до 20 сек), но контроль камеры слабее. Подписка $20/мес внутри ChatGPT Plus, отдельный API в feature preview. Для AI-Shorts с быстрым темпом приходится резать вручную в CapCut или Submagic.
- Runway Gen-4 — лучший контроль камеры через motion brush, можно задать темп ещё на этапе генерации. Pay-as-you-go от $0.25 за 5 секунд.
- Kling 3 (Kuaishou) — отлично справляется с быстрыми сменами поз и движений, но рендерит 10 секунд медленно (3–7 минут на клип). Цена: $0.20–0.30 за клип.
- Hailuo 02 (MiniMax) — лидер по lip-sync, но шоты до 6 секунд, и плотная нарезка получается хуже, чем у Veo.
- Welder AI — пайплайн, который берёт вашу нишу + промпт, генерирует 10 шотов, сам режет под целевой темп (1.0–1.5 cut/сек на выбор), прикрывает SFX и burn-in субтитрами. Из перечисленных это единственный, кто закрывает темп без ручного монтажа. Тарифы — от 290 ₽ за серию из 5 роликов на старте, подробности на странице тарифов.
Если бюджет позволяет — гибрид: Veo 3.1 для основных сцен + Welder для финальной упаковки в TikTok-формат с правильным темпом и субтитрами. Если бюджета нет — Welder в одиночку даёт самый короткий путь от идеи до публикации.
Честно про слабые места Welder: контроль кадра у нас ниже, чем у Runway Gen-4 (там motion brush — реально удобнее), и dialog lip-sync слабее, чем у Hailuo 02. Зато сотни готовых сцен у нас режутся по 3-beat rule из коробки, и вам не нужно ставить After Effects.
5 ошибок темпа, из-за которых AI-Short умирает
- Один промпт = один шот на 8 секунд. Самая частая ошибка новичков в Veo. Один длинный клип = retention drops к 4–5 секунде, completion rate ниже 40%. Решение: разбивайте идею на 6–10 промптов по 1–1.5 сек и склеивайте.
- Идеальный темп без вариации. Если все шоты строго по 800 мс — мозг считает паттерн за 4 секунды и переключается на автопилот. Вариируйте: 0.6 / 1.2 / 0.8 / 1.5 / 0.5 — внутри одного клипа.
- Слишком много визуальных событий одновременно. Камера движется + субтитр меняется + бэк-музыка сменилась — viewer не успевает обработать. Это cognitive overload, retention падает на 15–20%.
- Тихий монтаж. Cut без audio beat (SFX, music kick, ducking) ощущается как «обрыв», а не «событие». Решение: к каждой второй склейке добавляйте короткий SFX через ElevenLabs Sound Effects (бесплатно до 50 генераций/мес).
- Финальный шот длиннее 3 секунд. Все хотят повесить CTA и логотип. Но плоский финал убивает loop rate — а в 2026 алгоритм TikTok считает повтор просмотра как сигнал высочайшего качества. Финальный шот = до 2 секунд, с прямой склейкой обратно на первый кадр (loop).
Если хочется глубже разобрать чужой вирусный ролик и понять, как там устроен темп — у нас есть пошаговый разбор в материале «Реверс-инжиниринг AI-Shorts за 30 минут». Там показано, как раскладывать чужой Short на cuts/beats и копировать структуру под свою нишу.
Чек-лист перед публикацией
Прежде чем закинуть ваш AI-Short в TikTok, YouTube Shorts, Reels или VK Клипы, пройдитесь по семи пунктам:
- Средний темп: 1.0–1.3 cut/сек (под жанр — см. матрицу выше).
- Первый cut произошёл до 1.8 секунды.
- В каждые 700–1200 мс — visual, audio или text beat (не пусто).
- Нет статичных шотов длиннее 2.5 секунд (для B2B — до 3.5).
- 80% ролика покрыто burn-in субтитрами (рекомендация 2026).
- Финальный шот до 2 секунд и склеивается с первым «по контенту» (loop).
- Темп связан с алгоритмом площадки — последний апдейт мы разбирали в майском обзоре алгоритма Shorts.
После публикации — через 24 часа проверьте кривую удержания. Если есть резкий drop, значит на этой секунде темп пробуксовал. Найдите соответствующий шот, укоротите его на 30% — и перезалейте в следующей серии. У большинства AI-каналов 2–3 итерации такой подстройки поднимают completion rate с 55% до 72–75%.
Что делать дальше
Темп монтажа — это второй по важности рычаг после хука. Хук решает, посмотрят ли первые три секунды. Темп решает, досмотрят ли до конца. Вместе они дают около 80% от total retention, на котором держится алгоритм 2026 года.
Welder автоматически режет ваш AI-Short в нужном темпе под выбранную нишу — поверх Veo 3.1, Sora 2 или Kling 3 — с burn-in субтитрами, SFX на склейках и loop-финалом. От идеи до готового ролика — 6–9 минут.
Загляните в гайд по хукам, если хотите параллельно прокачать первые секунды. А когда будете готовы запустить свой канал — заходите в дашборд и сделайте первый ролик с правильным темпом.