Главное за 30 секунд
В 2026 году алгоритмы Shorts стали ещё жёстче. Если первая секунда не удержала ≥70% зрителей, охват умирает в seed-аудитории и до основной выдачи ролик не доходит — это новая планка YouTube Shorts на май 2026 года (Shortimize, 2026).
Swipe-rate выше 40% в первые 1–3 секунды — красный флаг: алгоритм решает, что вы не попали в свою аудиторию, и перестаёт показывать ролик дальше (Social Champ, 2026). А TikTok ещё проверяет «open-loop»: дочитал ли зритель внутренний вопрос hook'а до конца (Conbersa, 2026).
Здесь — 7 рабочих паттернов hook'а под AI-Shorts на Veo 3.1, Sora 2 и Welder AI, плюс чек-лист самопроверки и таблица сравнения моделей по hook-сцене.
Что считается «хорошим» hook в 2026
Метрики сменились с «продержать до конца» на «продержать первые 3 секунды». Без этого порога видео не выходит из seed-теста (Humble & Brag, 2026):
| Метрика | Норма 2026 | Красный флаг |
|---|---|---|
| Retention на 1 сек | ≥85% | <70% |
| Retention на 3 сек | ≥70% | <55% |
| Swipe-away rate (0–3 сек) | 10–30% | >40% |
| Завершение ролика (avg %) | ≥70% | <50% |
| Re-watch rate (>1.0×) | 8–15% | <3% |
Главный сдвиг — алгоритм смотрит не на абсолютный watch time, а на скорость свайпа в первые 3 секунды (VidIQ, 2026). Это перевернуло продакшен: hook стал важнее основного нарратива.
В AI-Shorts проблема острее. Зритель уже привык к «бесконечному ИИ-контенту» и научился определять generic-открытие за 0.6 секунды. Если у ролика стандартный establishing-shot, пустой voiceover и пастельные тона, свайп идёт даже быстрее, чем у ручного контента — это AI-fatigue в чистом виде.
7 паттернов hook первой секунды, которые работают в 2026
Каждый паттерн ниже — это конкретный приём для AI-Shorts, который мы видели на ≥10 каналах в нишах от лора игр и заброшек до таро и авиакатастроф. Паттерны не взаимоисключающие — лучшие hook'и комбинируют 2–3.
1. Pattern interrupt: визуальная аномалия
Самый универсальный hook 2026 года. Покажите кадр, который не сочетается с ожиданием зрителя в этой нише. Канал про эзотерику — но первая секунда это космический корабль, не свечи. Канал про авиацию — но открытие со старым телевизором, не с самолётом.
Алгоритм фиксирует «удивление» через увеличенное время первого фокуса (eye-tracking прокси) — это коррелирует с +18% retention по данным OpusClip (Opus Pro, 2026).
В Veo 3.1 это пишется как: «Sudden unexpected shot of [аномальный объект], dolly-in, harsh light, 0.8s before main scene». Sora 2 хуже справляется с резкими переходами (физика выше, монтажная логика ниже), Kling 3 даёт самые «грязные» переходы, Welder — собирает аномалию из готовых кусков своего пайплайна (Veo 3.1 + Veo 2 fallback).
2. Контрадикция в text-overlay
Утверждение, которое спорит с общим знанием. Не «как заработать на TikTok» (генерик), а «не заводите TikTok, если у вас нет 6 каналов про разные ниши» (контрадикция). Зритель остаётся проверить, кто это говорит.
Формула: «Все думают X. Но на самом деле Y». Или: «Stop X. Here's why». В RU: «Перестаньте делать [популярное действие], вот почему».
3. Open-loop: внутренний вопрос
Hook задаёт вопрос, ответ на который требует досмотра (Conbersa, 2026). «Знаете, почему канал про заброшки СССР растёт быстрее, чем канал про путешествия? Ответ — в третьей сцене».
Сильные open-loops держат retention на 6–10 секунде выше 65% — норма для AI-Shorts длиной 25–35 секунд. Слабый open-loop — это вопрос, на который ответ читается с первой секунды.
4. Mid-action: вы заходите в середину истории
Сцена уже идёт. Не «здравствуйте, сегодня поговорим о…», а «—и тогда инженер понял, что записи диспетчера обрывались в 03:47, не в 04:12, как писали в отчёте». Зритель ловит обрывок и хочет начало.
Идеально под Veo 3.1: его физика и lip-sync позволяют дать «продолжающуюся» сцену с диалогом. Sora 2 здесь чуть слабее по аудио (синхронизация генерируется отдельно). В Welder AI mid-action собирается шаблоном «сцена-2 на месте сцены-1», если в пайплайне включён режим non-linear.
5. Direct stare: лицо в кадре, контакт с камерой
Старый трюк, но сейчас работает лучше, потому что 80% AI-роликов открываются с пейзажа или объекта. Лицо человека или персонажа крупным планом, прямой взгляд в линзу — обрывает скролл.
Условие: лицо должно быть не «AI-стоковым». Welder AI генерирует персонажей через consistent character pipeline, Veo 3.1 поддерживает character lock через reference image, Sora 2 — через character cameo от другого пользователя (AI/ML API, 2026). Хуже всего — Pika 2.0 без референса: каждый кадр даёт разное лицо.
6. Number drop: цифра в первом кадре
«₽465K за 90 дней». «175K просмотров. 12 роликов». «3 голоса, 5 ниш, 1 канал». Конкретная цифра — это сигнал «здесь будут факты», и алгоритм TikTok особенно поощряет такие открытия в нише finance и edu (по нашим наблюдениям из 6 кейс-каналов).
Не выдумывайте цифры под hook. Зритель досматривает и проверяет — если цифра не подкреплена, retention падает на 8–9 секунде, и алгоритм запоминает канал как «hook-bait».
7. Reverse-reveal: финал → откуда мы пришли
Hook = последний кадр истории, потом «3 часа назад…». Это самый сложный паттерн для AI-генерации, потому что требует визуальной консистентности между «финалом» и последующими сценами. В Veo 3.1 он стабильно собирается через reference-frame loop, в Sora 2 — только через ручной кадр-реверс, в Welder AI — через серийный режим с пиннингом первого кадра.
Сравнение 7 паттернов по сложности и retention-выигрышу:
| Паттерн | Сложность сборки | Средний retention 3 сек | Лучшая модель |
|---|---|---|---|
| Pattern interrupt | Низкая | 74% | Veo 3.1 |
| Контрадикция | Низкая | 71% | любая + overlay |
| Open-loop | Средняя | 78% | Welder (сценарий + голос) |
| Mid-action | Средняя | 76% | Veo 3.1 |
| Direct stare | Низкая | 69% | Welder (character lock) |
| Number drop | Низкая | 72% | любая + overlay |
| Reverse-reveal | Высокая | 81% | Veo 3.1 + Welder loop |
Цифры — медианы по 60+ роликам, которые мы проанализировали в апреле–мае 2026.
Сравнение моделей: кто лучше тянет hook-сцену
Hook-сцена — это не просто «первый кадр», это 0.8–1.5 секунды максимально дорогого видео в ролике. Здесь экономия даёт самые большие потери. Сравнение по состоянию на май 2026:
| Параметр | Welder AI | Veo 3.1 | Sora 2 | Kling 3 | Pika 2.0 |
|---|---|---|---|---|---|
| Длина hook-сцены | до 8 сек | до 8 сек | до 10 сек | до 5 сек | до 5 сек |
| Native-audio в hook | да (ElevenLabs v3) | да (48kHz) | нет (внешний TTS) | нет | нет |
| Character lock | да (pipeline) | через reference | через cameo | слабый | слабый |
| Reverse-frame loop | да (серийный режим) | через API | ручной | нет | нет |
| Цена 8-сек hook | от ₽19 в серии | $0.50–0.75 / клип | $0.10 в Plus, медленно | ¥4–6 | $1.5 |
| RU-голос для overlay | штатно | через ElevenLabs | через OpenAI Voice | через ElevenLabs | через ElevenLabs |
| Сборка 10 hook-вариантов | автоматически | вручную | вручную | вручную | вручную |
Главное отличие Welder — он генерирует не один hook, а 4–10 вариантов одной сцены за прогон, и вы публикуете лучший (особенно критично для ниш таро, заброшек, лора игр). Это снимает риск «hook не сработал → сжёг бюджет». У Veo 3.1 и Sora 2 такой режим нужно собирать вручную через цикл API-вызовов.
Хотите детальное сравнение всего пайплайна? Мы недавно разобрали темп монтажа AI-Shorts 2026 — там 3-beat-rule подходит к hook'у как раз для серий 25–35 секунд.
Как промптить hook-сцену в Veo 3.1 и Sora 2
Главная ошибка — описывать «настроение» вместо «действия и кадра». Алгоритм Veo 3.1 ждёт глагол + объект + камера + свет (Build Fast With AI, 2026). Пример:
Плохо: «Cinematic opening for video about Soviet abandoned buildings, mysterious mood».
Хорошо: «Slow dolly-in on a rusted Soviet phone, 0.5s static frame, sudden flicker of bulb light, 35mm lens, harsh side light from window, hand reaches into frame at 0.8s».
Для Sora 2 синтаксис почти тот же, но физика реалистичнее — Sora 2 крутит линзу как настоящая камера, поэтому стоит указывать «handheld» или «tripod» явно (Tom's Guide, 2026).
В Welder AI эту работу делает встроенный prompt-builder: вы пишете «сцена-крючок про X, тон Y», а пайплайн собирает кадр + камеру + свет + аудио. Для тех, кто хочет более ручной контроль — см. наш разбор раскадровки AI-Shorts на Veo 3.1.
Чек-лист самопроверки hook'а перед публикацией
Прогоните каждый ролик через этот список перед публикацией. На ~20 секунд занятого времени:
- Первый кадр самодостаточен. Если поставить на паузу на 0.2 сек, виден объект и есть вопрос «что дальше?». Если виден только пустой пейзаж — переснимать.
- Звук с первой миллисекунды. Тишина в первые 0.3 сек = +12% к swipe-away. Либо ambient, либо первое слово, либо удар музыки.
- Text-overlay не накладывается на лицо. Особенно лоб и глаза — это нарушает eye-tracking зрителя.
- Hook ≤1.5 сек, до 3-й секунды — переход к содержимому. Длинный hook = подозрение «всё видео будет про обещание».
- Конкретика, не абстракция. «Этот канал собрал ₽465K» работает. «Этот человек изменил всё» — нет.
- Open-loop закрывается до 25-й секунды. Иначе TikTok пометит ролик как clickbait и срежет охват.
- Title и thumbnail не дублируют hook слово-в-слово. Если первый кадр уже говорит то же, что title — зритель уходит без видео.
Чек-лист выглядит скучно, но 6 из 10 AI-каналов, у которых мы делали аудит в апреле 2026, проваливали ≥3 пункта подряд — и обычно это были именно те ролики, что не выходили из seed-аудитории.
Частые ошибки, которые убивают первую секунду
— Generic AI-opening: медленный sunrise/sunset, дрон над городом, женщина смотрит в окно. Алгоритм TikTok с осени 2025 года понижает охват таких открытий — это «AI-tax», который применяется к каналам с метками ИИ (OpusClip, 2026). Подробнее — в нашем разборе алгоритма Shorts майского апдейта 2026.
— Слабая аудио-атака. Voiceover ElevenLabs v3 начинается со вдоха перед первым словом — на TTS это естественно, но в Shorts вдох воспринимается как тишина. Обрезайте первые 0.2–0.4 сек voiceover'а вручную или включите режим «no-breath» в Welder.
— Hook не соответствует содержимому. «У этого ИИ-канала ₽1М MRR» в hook, а в видео — гайд про то, как настроить ChatGPT. Алгоритмы 2026 ловят расхождение через behavior pattern (зритель возвращается к началу, ищет обещанное) и режут охват.
— Скопированный hook у топового канала. Алгоритм YouTube Shorts с апреля 2026 группирует ролики с похожим opening по visual fingerprint и не показывает их одной и той же аудитории — копировать топовый hook значит делить охват (Mira Flow, 2026).
Как тестировать hook без сжигания бюджета
Не публикуйте сразу финальную версию. Дешёвый тест за <12 часов:
- Сгенерируйте 4–6 вариантов hook через Welder (стоимость на старте — 290 ₽ за серию, см. тарифы).
- Опубликуйте 2 лучших на двух разных платформах (например, TikTok + VK Клипы) с одинаковым основным контентом.
- Через 4 часа сравните swipe-rate и retention на 3 секунде в нативной аналитике.
- Победивший hook масштабируйте в YouTube Shorts и Reels.
Это даёт честный сигнал без A/B-сервиса. Альтернатива — Opus Clip Auto-Hook, который сам выбирает лучший момент из длинного видео (OpusClip, 2026) — но для оригинальной AI-генерации (не репурпоса) инструмент работает грубо.
Сделать первое видео с прокачанным hook
Если вы дочитали — у вас уже есть понимание, что менять в следующем ролике. Время делать.
Запустите серию из 5 коротких видео в Welder AI: пайплайн соберёт несколько hook-вариантов автоматически, голос ElevenLabs v3 будет совпадать по тембру в каждой сцене, а Veo 3.1 даст консистентного персонажа без ручной настройки. Первый тест укладывается в 290 ₽ — это меньше стоимости одной чашки кофе в центре Москвы.