Главное за 30 секунд
В мае 2026 у вас три способа собрать AI-Short без раздражающих перегенераций: Sora 2 Storyboard с пятью кадрами в одной генерации, Kling 3.0 Multi-Shot Storyboard с индивидуальным промптом на каждый шот и пайплайн поверх Veo 3.1 от Google DeepMind по цене $0.10–$0.40 за секунду в зависимости от тарифа. Welder AI делает то же сверху: превращает идею в карточки сцен с готовыми промптами, голосом ElevenLabs v3 и сборкой ffmpeg, поэтому вы не пишете промпты вручную в Google AI Studio.
Что общего у всех троих: раскадровка до промпта снижает стоимость одного готового клипа с $5 до $1.50 и поднимает first-try success rate до 4 из 5 (данные Topview Storyboard). Без раскадровки 8-секундная сцена Veo 3.1 Quality стоит ≈ $3.20, и каждая перегенерация — это ещё $3.20 в трубу. Дальше — конкретные 6 шагов и чек-лист, по которым работают AI-каналы на 50–200K MRR.
Зачем раскадровка для 8-секундной сцены
Veo 3.1, Sora 2 и Kling 3.0 не «понимают» намерение режиссёра. Они интерпретируют текстовый промпт буквально. Если в голове у вас есть кадр, но в промпте написано «герой смотрит на дверь», модель сама решит, какой герой, какая дверь, под каким углом и в какой плёнке. Раскадровка — это акт фиксации этих решений до того, как вы потратите кредиты.
По открытым данным Google Cloud за 2026 год, эффективная формула промпта для Veo 3.1 — это пять блоков: cinematography, subject, action, context, style & ambiance. Раскадровка — это сетка, в которой каждый из пяти блоков заполнен до ввода в модель. Это не художественная работа; это аналог тех самых scene cards, которые продакшен-команды используют для съёмок с актёрами.
Экономика без раскадровки выглядит так. Канал делает 30 Shorts в неделю по 5 сцен в каждом — 150 сцен. На каждой сцене 1.6 ре-генерации среднем (наша внутренняя статистика Welder за апрель 2026). При тарифе Veo 3.1 Fast ($0.12/сек × 8 сек) это 150 × 1.6 × $0.96 = $230 в неделю — только на «попробовал, не зашло, попробовал снова». С раскадровкой ре-генерации падают до 0.3 за сцену: $43 в неделю. Разница — $187 в неделю, или $9.7K в год.
Шаг 1. Сценарий → список сцен
Первое решение — сколько сцен в Shorts. Это вопрос про темп монтажа и удержание (мы разбирали в «Темп монтажа AI-Shorts 2026: 1.2 cut/сек и 3-beat rule»). Для вертикали под TikTok и YouTube Shorts работает рамка:
- 30 секунд → 4–5 сцен (по 6–8 секунд)
- 45 секунд → 6–7 сцен (по 6–8 секунд)
- 60 секунд → 8–10 сцен (по 5–7 секунд)
Берём готовый сценарий и режем его на абзацы, каждый абзац — одна сцена. Это и есть нулевой драфт раскадровки: пока без визуала, только текст + хронометраж. Если ваш сценарий пишет ChatGPT-5, Claude 4.6 или Gemini 2.5 Pro, попросите модель сразу разметить сцены меткой ## Сцена N (X сек). Это экономит шаг переноса в таблицу.
Шаг 2. Якорные кадры — один на сцену
Под каждую сцену зафиксируйте якорный кадр — главный визуальный момент, ради которого сцена существует. Это не весь шот, это одна мысль: «герой замечает тень за окном», «лампа взрывается», «женщина в красном плаще проходит мимо». Якорный кадр позже превращается в первую строку промпта.
Если у вас есть художник или хотя бы Midjourney v7 / Flux 1.1 Pro, сгенерируйте 1 эскиз на сцену в формате 9:16. Это не финал, это карта. Зрителю никогда не покажут эскиз; нужен только режиссёр (вы), который знает, в каком кадре что происходит. Sora 2 Storyboard и Kling 3.0 Multi-Shot позволяют прикрепить такой кадр как reference frame — модель попадает в композицию точнее.
Шаг 3. Камера и движение
Абсолютное большинство «зашумлённых» AI-видео получаются такими, потому что модель импровизирует с камерой. Любая Veo 3.1 / Sora 2 генерация без явного указания камеры выдаст «среднюю плоскую кадрировку» с лёгким парящим движением — это безопасный дефолт, и он скучный. Раскадровка — место, где вы это решаете.
Для каждой сцены пропишите два поля:
- Тип кадра: extreme close-up / close-up / medium / wide / aerial.
- Движение: static / pan left / pan right / push in / pull out / dolly / handheld.
Если не уверены — почитайте, как формулируются эти параметры в «Камере в промптах Veo 3 и Sora 2: 8 параметров 2026». Идея простая: длинный Shorts с одинаковым типом кадра проседает по удержанию, потому что глаз не получает «новой информации». Чередуйте close-up → wide → push-in — это держит вертикаль на retention 70%+.
Шаг 4. Персонаж и предметы (consistency)
Если через раскадровку проходит один и тот же герой — закрепите его описание один раз. Veo 3.1 поддерживает Ingredients-to-Video и reference frames, Sora 2 — Cameos, Kling 3.0 — Character Lock. Описание персонажа должно быть ≥ 40 слов и идентично копироваться во все 5–10 промптов раскадровки.
Повторение — это не «вода», это контракт с моделью. Если в сцене 3 описание поменяется на «худой парень в куртке» вместо «молодой парень 22 лет, рост 178, тёмные волосы, куртка-бомбер цвета хаки, синие джинсы», модель сгенерирует другого человека. Подробнее — «Консистентный персонаж в AI-Shorts 2026: Veo, Sora, Runway».
То же касается предметов. Если в сцене 1 лежал «латунный ключ с резным узором на красном бархате», в сценах 3 и 7 — копируем то же описание, не пересказываем. Краткий пересказ = другой ключ.
Шаг 5. Аудио и тайминг
Veo 3.1 умеет генерировать аудио синхронно с видео. Sora 2 тоже (с октября 2025). Это значит, что в раскадровке у вас есть третья дорожка — звук — которую тоже надо запланировать.
Две типичные ошибки:
- Просить TTS-голос ElevenLabs v3 и одновременно генерировать «герой кричит на двери» в Veo 3.1 — у вас будет два конфликтующих звуковых слоя.
- Не оставлять зазор 200–300 мс между сценами под breath/pause. Без зазора монтаж получается резкий, а с зазором мозг зрителя успевает «обработать» переход.
Если вы используете внешний TTS (а не нативное аудио Veo 3.1), то в раскадровке для каждой сцены прописывайте reading time под закадровый голос. Лучше всего работает диапазон 2.2–2.6 слова в секунду для русского нарратива — это естественный для слушателя темп. 6-секундная сцена закрывает 13–16 слов voiceover-текста.
Шаг 6. Промпт для каждой сцены
Только на шестом шаге вы пишете сам промпт. К этому моменту у вас есть: сценарий → сцены → якорный кадр → камера → персонаж → аудио. Промпт — это просто склейка этих полей по формуле Google Cloud:
[Cinematography] + [Subject] + [Action] + [Context] + [Style & Ambiance]
Пример заполненной сетки для одной сцены:
- Cinematography: close-up shot, slow push-in, handheld, 35mm anamorphic lens
- Subject: молодой парень 22 лет, рост 178, тёмные волосы, куртка-бомбер цвета хаки
- Action: подносит латунный ключ к старому замку и поворачивает
- Context: тёмный подвал, луч света от фонарика сверху, пыль в воздухе
- Style & Ambiance: cinematic noir, тёплый янтарный свет, грубое зерно, ambient тишина с эхом капель
Если копаете в промпты глубже — у нас есть отдельный разбор 9 рабочих шаблонов Veo 3.1 для AI-Shorts 2026. Шаблоны экономят 30–40% времени на промптинге.
Чек-лист 8-секундной сцены
Каждая сцена в раскадровке должна закрывать 5 полей до того, как вы нажмёте Generate:
| Поле | Что заполнить | Почему важно |
|---|---|---|
| Тип кадра + движение | «close-up, slow push-in» | Модель не импровизирует камерой |
| Описание субъекта | 40+ слов, скопировано из канона | Персонаж не «плавает» между сценами |
| Действие | один глагол + объект | Veo 3.1 теряет 2+ действия в 8-сек кадре |
| Контекст | свет, фон, время суток | Атмосфера читается зрителем за 1 сек |
| Аудио / тайминг | TTS-текст или ambient | Не получите дубль звука |
Если хотя бы одно поле пустое — промпт не готов, и шанс ре-генерации растёт с 30% до 70%.
Инструменты раскадровки 2026: сравнение
На рынке три категории:
- Классический storyboard-софт — Boords, Storyboarder by Wonder Unit, StudioBinder. Сделан для кино/рекламы, но прекрасно адаптируется под Shorts.
- AI-storyboard — Drawstory, Boords AI, Canva Magic Studio. Сами рисуют эскизы по сценарию.
- Встроенный в модель — Sora 2 Storyboard, Kling 3.0 Multi-Shot, и пайплайн Welder, который делает раскадровку как часть генерации.
| Инструмент | Цена 2026 | Для чего | Слабое место |
|---|---|---|---|
| Boords | $24/мес Pro | Профи-раскадровка, экспорт в PDF/MP4 animatic | Не генерирует видео, только планирует |
| Storyboarder (Wonder Unit) | бесплатно | Open-source эскизы, sketch-режим | Только рисование, без AI |
| Drawstory AI | $19/мес Pro | Скрипт → эскизы под кино-композицию | Подписка для длинных скриптов |
| Sora 2 Storyboard | $20/мес ChatGPT Plus | 5 кадров в одной генерации с reference frames | Лимит 5 кадров за раз |
| Kling 3.0 Multi-Shot | от $10/мес | Шот-лист в одном бэтче с разной камерой | Длиннее очередь генерации |
| Welder AI | от ₽290 / серия | Идея → сценарий → карточки сцен → Veo 3.1/3.2 → сборка | Только русский язык на старте |
По стоимости готового клипа на маленьких объёмах Welder выходит дешевле Sora 2 Storyboard примерно в 2 раза, если считать от ₽290 за 10-сценную серию против $20 ChatGPT Plus за 5 кадров Sora. На больших объёмах (200+ клипов в месяц) — наоборот, Sora 2 Pro начинает выигрывать за счёт безлимитных генераций. Если хотите подобрать тариф Veo 3.1 под объём, у нас разобрано в «Veo 3.1 Lite vs Fast vs Standard: выбор тарифа 2026».
Типичные ошибки, которые жгут бюджет
Ошибка 1: «начну с промпта, по ходу разберусь». Это путь к 1.6 ре-генерации на сцену. Любая сцена в Veo 3.1 Quality за $0.40/сек = $3.20 за 8 сек. Каждый «пробую ещё раз» — это ещё $3.20. На канале с 30 Shorts в неделю экономика разваливается за месяц.
Ошибка 2: раскадровка как набор картинок без полей. Видел, как создатель приносит 8 красивых эскизов, но не записал ни одного описания камеры, ни одного фрагмента диалога. Эскизы — это карта, не инструкция модели. Без 5 полей промпта они бесполезны.
Ошибка 3: смена описания персонажа между сценами. Модель воспринимает каждое слово как новый сигнал. «Парень 22 лет» в сцене 1 и «студент Иван» в сцене 3 — это два разных героя для Veo 3.1. Канон описания живёт в отдельной табличке и копируется без правок.
Ошибка 4: игнор аудио. Когда вы лепите TTS-озвучку поверх native-audio Veo 3.1, получаете два конфликтующих слоя. Решение: либо вырубаете нативное аудио (--no-audio в API), либо отказываетесь от TTS на этой сцене. Третьего нет.
Ошибка 5: слишком длинные сцены. Любая сцена > 8 секунд в Veo 3.1 потребует Scene Extension и дополнительный кредит. Лучше резать на 6–8 секунд и стыковать в монтаже — экономит ≈ 25% бюджета на длинный Shorts.
Где раскадровка вписывается в пайплайн Welder
Welder делает шаги 1–6 за вас. Вы вводите идею («история про античную свадьбу для TikTok-канала») — модель собирает сценарий, режет на сцены, генерирует промпты по формуле, прокидывает их в Veo 3.1 или Veo 3.2 и собирает финальный mp4 через ffmpeg. У каждого AI-канала, который проходит через Welder, фактически уже есть раскадровка — просто она формируется автоматически и хранится в воспроизводимом виде. Если вам нужно вмешаться, можно отредактировать карточку конкретной сцены, поменять промпт и пере-сгенерировать только её, не трогая остальные.
Для тех, кто работает с Veo 3.1 из России, у нас есть прямой канал доступа через /lp/veo-3-v-telegram-bez-vpn — без VPN и с оплатой картой РФ. На этой странице же выложены гайды по тарифам и лимитам.
Что попробовать сегодня
Выпишите следующие 5 Shorts, которые вы собираетесь сделать. Под каждым — таблицу из 5 полей чек-листа. Это займёт 20 минут, но сэкономит вам $40–80 на первой же неделе. Дальше — два варианта: либо собирать промпты руками в Google AI Studio, либо отдать раскадровку Welder, чтобы пайплайн собрал её сам и вернул готовые карточки сцен.
Если хотите второй путь — запустите первое видео в Welder и сравните стоимость с тем, что у вас выходило раньше. Тарифы и лимиты — на /pricing.