AI-сценарист Shorts 2026: Claude, GPT-5.5, Gemini 3.1

Пять LLM на одном промпте для вертикали 30 секунд: где выигрывает плотность, где — цена, и какую модель Welder ставит первой.

Главное за 30 секунд

В июне 2026 у вас на одном столе пять кандидатов в AI-сценаристы для вертикали: Claude Opus 4.7 ($5/$25 за миллион токенов), GPT-5.5 ($5/$30), Gemini 3.1 Pro ($2/$12), DeepSeek V4 Pro ($1.74/$3.48 после промо) и DeepSeek V4 Flash ($0.14/$0.28). Плюс российский ход — YandexGPT 5 Pro и GigaChat Ultra.

Коротко: Claude пишет плотнее всех и держит драматургию в 25 секунд. GPT-5.5 — рабочая лошадка batch-продакшна и repurpose. Gemini 3.1 Pro даёт лучшую цену на массовый поток и обходит остальных по скорости первого токена. DeepSeek V4 Flash в 35–100 раз дешевле GPT-5.5 на input — идеален, когда вы делаете 200 сценариев в день и редактор всё равно проходит руками. YandexGPT и GigaChat — нужны, если контент регулируемый (бады, банки, юр-консультации) и данные нельзя выпускать из РФ.

Дальше — таблица, промпт, и честный разбор: что внутри Welder AI и почему мы не строим всё на одной модели.

Что значит «хороший AI-сценарий для Shorts»

Красивый текст в чате ≠ работающий сценарий. На вертикали 15–45 секунд модель должна одновременно:

Дать сильный hook в первой секунде. TikTok Q2 2026 переехал на трёхсекундное удержание как первичный сигнал: видео с hook в первой секунде получают на 41% больший retention (по данным TTS Vibes за 2025–2026). Если LLM открывает «В этом видео мы расскажем…» — вы уже проиграли. Подробнее про формулы первой секунды — в нашем разборе 9 формул hook.
Сжать историю до 60–80 слов. Для 25-секундного ролика на русском это 7–9 предложений по 8–11 слов. Модель должна резать сама, а не «уложиться примерно».
Держать одну линию. Никаких «а ещё, кстати, важно…» — Shorts не терпят боковых ответвлений. Каждое предложение продвигает зрителя ближе к финалу.
Выдать выход с движением. Финал = либо петля (зритель пересматривает), либо вопрос (комментирует), либо CTA с конкретным действием — без водянистого «подписывайтесь».
Не сорвать модерацию. YouTube в апреле 2026 ужесточил «inauthentic content» по AI-Shorts; описание и сценарий не должны звучать как «один из десяти бесконечных» каналов.

Хорошая модель проходит все пять пунктов из одного промпта. Слабая — даст красивый абзац, который придётся переписывать руками.

Таблица: 5 моделей на одном промпте (июнь 2026)

Мы прогнали один и тот же промпт через все пять моделей — «история про античного полководца, 25 секунд, hook в первой секунде, петля в финале, без штампов про эпохи и величие». Оценка субъективная, на корпусе из 30 запусков на нишу «история», «true crime», «финграмотность», «wellness».

Модель	Цена $/M (in/out)	Hook 1 сек	Плотность	Скорость	Русский язык	Лучшее применение
Claude Opus 4.7	5 / 25	8.5 / 10	9 / 10	средняя	отлично	флагман: hero-сценарий, серии, драма
GPT-5.5	5 / 30	7.5 / 10	7.5 / 10	средняя	очень хорошо	batch, repurpose, описания
Gemini 3.1 Pro	2 / 12	7 / 10	7 / 10	быстрая	хорошо	массовый поток, мульти-язык
DeepSeek V4 Pro	1.74 / 3.48	6.5 / 10	7 / 10	средняя	хорошо	дёшево + reasoning, аналитический контент
DeepSeek V4 Flash	0.14 / 0.28	5.5 / 10	6 / 10	очень быстрая	средне	200+ драфтов в день под ручную правку

Главное наблюдение: разница между топом и низом — не «писать или не писать», а «сколько времени редактор тратит на правку». Claude Opus 4.7 на 30 сценариях потребовал правки в среднем 38 секунд на ролик. GPT-5.5 — 1 минута 12 секунд. Gemini 3.1 Pro — 1 минута 40. DeepSeek V4 Flash — 3 минуты 20 секунд, но при цене input в ~35 раз ниже это всё равно может быть выгоднее на объёме.

Claude Opus 4.7 — плотность и драматургия

Из пяти моделей только Claude Opus 4.7 стабильно держит одну линию на 80 словах. На промпт «true crime, 28 секунд, без слова «жертва» в первой фразе» модель из 10 запусков 9 раз выдала готовый сценарий, который не нужно сокращать. GPT-5.5 в том же сетапе пять раз перебрал по словам — пришлось вручную резать на 15–20%.

Claude Opus 4.7 показал 87.6% на SWE-bench Verified (по данным Vellum) — это сигнал не для сценариев напрямую, но он отражает общую способность модели держать сложную инструкцию без дрейфа. Для сценариста это критично: вы даёте 12 ограничений (длина, тон, hook, петля, ниша, запрещённые слова, диалект, ритм) — Opus 4.7 их не теряет к третьему абзацу.

Цена. Opus 4.7 — $5 input и $25 output за миллион токенов. Один сценарий Shorts на русском — это примерно 1500 input (промпт + контекст серии) и 200 output (готовый текст). Себестоимость одного сценария: $0.0125 (≈1.1 ₽). 1000 сценариев — 1 100 ₽. Это дорого только в абсолюте; на фоне рендера видео (от 60–150 ₽ за ролик через Veo 3.1 и параллельные модели) сценарий стоит копейки.

Где Opus 4.7 проигрывает: длинные batch-задачи. Если вы кидаете 200 идей и просите 200 сценариев в одном запросе, модель начинает «выравнивать» все 200 под один ритм — пропадает разнообразие. Лучше — по одному вызову на сценарий.

Небольшое уточнение: в мае 2026 Anthropic выпустила Claude Opus 4.8 как новый флагман. На сценариях для Shorts мы пока не видим существенного отрыва от 4.7 — разница больше заметна на коде и сложных reasoning-задачах. Если бюджет ограничен, 4.7 даёт 95% качества за ту же цену.

GPT-5.5 — рабочая лошадка batch

GPT-5.5 — выбор по умолчанию для большинства команд, которые делают AI-Shorts серийно. Не потому, что лучшая (по плотности проигрывает Opus 4.7), а потому, что:

Стабильная JSON-структура. Если ваш пайплайн ждёт {title, hook, body, cta} — GPT-5.5 даст это в 99% случаев без багов. Opus иногда добавляет лишний комментарий перед JSON; Gemini 3.1 Pro изредка теряет квотирование. Это критично, когда оркестратор автоматически парсит ответ.
Лучше всех держит длинные системные промпты. Если у вас 12 страниц style-guide для канала и 200 примеров «как мы пишем» — GPT-5.5 не размывает стиль к десятому сценарию.
Дешёвый prompt-кэш. При повторных запросах с одним и тем же system-prompt OpenAI кэширует input — реальная цена падает раза в 4. Для batch это меняет экономику сильно.

Цена output — $30 за миллион — выше Opus 4.7. Но на сценариях output короткий (200–400 токенов), так что фактическая разница в чеке копеечная: ~$0.0135 за сценарий vs $0.0125 у Claude.

Где GPT-5.5 хуже Claude: в драматургии и подтексте. На true crime, истории, психологии GPT-5.5 даёт «правильный» сценарий — все элементы на месте, hook→тело→финал — но плоский. Не цепляет. Opus 4.7 в той же нише регулярно выдаёт фразы, которые редактор оставляет дословно. Это субъективно, но повторяется на десятках запусков.

Gemini 3.1 Pro — массовый поток и мульти-язык

Gemini 3.1 Pro — главный соперник на цену. $2 input / $12 output за миллион (для контекста до 200K). Для сценариев Shorts это значит ~$0.004 за сценарий — почти в 3 раза дешевле Claude и GPT.

Плюсы:

Скорость первого токена. На API Gemini 3.1 Pro отдаёт первый токен за 180–260 мс, против 400–600 мс у Opus 4.7. Когда вы пишете интерактивный мастер «Welder-стиля», где автор видит идею в реальном времени, это разница между «модно» и «бесит».
Мульти-язык. Если вы запускаете один и тот же канал на иврите, шведском и португальском (см. наш разбор RPM по языкам), Gemini 3.1 Pro держит ритм короткой формы на всех трёх лучше, чем GPT-5.5 или Opus 4.7. Это особенность тренировки на мультиязычном корпусе Google.
Огромный контекст. 1М токенов на чтение позволяет дать модели весь архив сериала (200 эпизодов) и сказать «не повторяйся».

Минусы. Gemini 3.1 Pro в русском часто пишет «гладко, но никак». На драме теряет ритм, на сатире проигрывает Opus в три раза. Финал чаще скатывается в банальный CTA «не пропустите следующее видео». Для batch — отлично; как флагман на сложные ниши — мимо.

DeepSeek V4 — когда цена решает

DeepSeek V4 Flash — самый дешёвый из жизнеспособных вариантов. $0.14 input / $0.28 output за миллион. Если у вас агентство с 6 каналами и 30 сценариев в день на канал — это разница между $200 в месяц на скрипты и $5.

Quality. V4 Flash работает на русском, но требует жёсткой структуры промпта. Если дать «напиши сценарий на тему X в 25 секунд» — получите рыхло. Если дать пошаговую инструкцию («сначала hook, потом 3 факта по одному предложению, потом петля» с примером каждого блока) — V4 Flash вытягивает на уровень GPT-5.5 ± 15%.

DeepSeek V4 Pro — тяжёлый брат, $1.74/$3.48 за миллион (после промо). У него thinking-mode, который полезен для аналитических ниш: финграмотность, статистика, объяснение алгоритмов. Для драмы и storytelling-ниш — переусложняет.

Ключевая стратегия для V4: используйте его как первый драфт, потом прогоняйте через Opus 4.7 или GPT-5.5 для «полировки» только лучших 10%. Так вы платите дёшево за объём и дорого только за то, что реально пойдёт в публикацию.

Российский ход: YandexGPT 5 Pro и GigaChat Ultra

Если вы делаете контент в регулируемых нишах (банки, фарма, юр-консультации) и требуется хранение данных в РФ, два варианта: YandexGPT 5 Pro и GigaChat Ultra (запущена Сбером в марте 2026 — флагман с режимом reasoning).

Качество. На сценариях Shorts оба заметно уступают западной тройке. По независимым бенчмаркам (mysummit.school 2026), GigaChat Ultra с включённым reasoning даже теряет 3.3% на менеджерских задачах против non-thinking — добавление «размышления» иногда вредит. Для драмы и сторителлинга оба пишут «правильно по школе»: банально, ровно, без щепоток.

Когда брать. Только если: контент регулируемый, юристы запретили выпускать данные за границу РФ, или важна интеграция с Алисой / SberDevices. Во всех остальных случаях ChatGPT 5.5 через ChadGPT/BotHub (доступ из РФ за рубли) выйдет дешевле и качественнее.

Промпт-шаблон, который работает на любой из них

Плохой промпт убьёт даже Opus 4.7. Хороший промпт вытащит даже DeepSeek V4 Flash. Шаблон, который мы используем как стартовый:

Ты — сценарист вертикальных видео (YouTube Shorts / TikTok / Reels).

ЖЕСТКИЕ ПРАВИЛА:
— длина озвучки: 22–28 секунд (≈ 65–80 слов, RU)
— первая фраза (5–8 слов) — hook, без слов «давайте», «в этом видео», «представьте себе»
— одна сюжетная линия, без боковых ответвлений
— ритм: чередуй короткие предложения (4–6 слов) и средние (8–11 слов)
— финал: либо петля (вопрос, который вернёт зрителя в начало), либо конкретное действие (без «подписывайтесь»)
— ноль клише: «в эпоху ИИ», «революционный», «бесшовно», «гармонично» — бан

КОНТЕКСТ КАНАЛА:
ниша: {ниша}
тон: {спокойный аналитик / интригующий рассказчик / саркастичный комментатор}
аудитория: {аудитория}
запрещённые темы: {список}

ЗАДАЧА:
Напиши сценарий по идее: «{идея}»

ВЕРНИ ТОЛЬКО JSON:
{"hook": "...", "body": "...", "loop_or_cta": "...", "word_count": N}

Ключ — три блока: жёсткие правила, контекст канала, задача. Без контекста канала любая модель будет писать «среднее» — а среднего на Shorts недостаточно для алгоритма.

Как Welder использует эти модели (без маркетинга)

Честно. Под капотом Welder AI не одна модель, а каскад. На разных шагах пайплайна — разные провайдеры. Почему так:

Storyboard (раскадровка сценария на сцены) — Gemini 3.5 Flash через OpenRouter. Выбран за headroom в 8K output-токенов: storyboard на 10 кадров вылезает за 2–3K токенов, и тут важно дать модели запас.
Cinematic chat (быстрые микро-вызовы для уточнений) — Gemini 3 Flash Preview через KIE. Reasoning-модель на этом узком лейне саботирует сама себя — выдаёт пустой ответ из-за finish_reason=length. Мы выяснили это в апреле 2026 и развели лейны.
Voiceover prompt-инжиниринг (системный промпт, который превращает идею в кадры) — живёт в БД как override, не в коде. Меняем без деплоя, проверяем на проде за 60 секунд. См. как это устроено в нашей архитектуре провайдер-каскада.

Ключ: нельзя выбрать одну LLM и закрепить. Цены движутся, флагманы меняются раз в 2–3 месяца, у каждой модели свой режим, где она ломается. Каскад с возможностью переключать модель ENV-флагом без передеплоя — единственный устойчивый дизайн.

Для одиночного автора это сложно — собирать прокси, ключи, кэш. Поэтому Welder отдаёт результат, а не модель: вы пишете «история про античного полководца», получаете 10 готовых вертикальных роликов с озвучкой ElevenLabs v3, обложкой и расписанием публикаций — внутри сработала та комбинация LLM, которая в этот момент даёт лучший ratio качество/цена.

Что выбрать под ваш канал

Короткое дерево решений:

Соло-автор, 1 канал, до 10 видео в неделю. Берите Claude Opus 4.7 или GPT-5.5 напрямую через ChadGPT/BotHub. $15–25 в месяц на сценарии, ноль головной боли. Качество выше, чем у DeepSeek или Gemini, время редактирования — минимальное.
Агентство, 3–6 каналов, 100+ роликов в неделю. Каскад: Gemini 3.1 Pro или DeepSeek V4 Flash на черновики, Opus 4.7 на финальную полировку 10% лучших. Месячный счёт — $80–150.
Длинный сериал на одной ноте (true crime, история, wellness). Только Claude Opus 4.7. Никакая дешёвая модель не вытянет 50-серийный канон без дрейфа стиля. См. как устроены серии Shorts.
Регулируемая ниша (фарма, банки, юр.). YandexGPT 5 Pro или GigaChat Ultra — для контента, который должен быть compliance-чистым. Скучнее, но безопаснее.
Не хочется выбирать модель руками. Откройте Welder — стартовый тариф от 990 ₽ (тарифы) включает каскад из четырёх провайдеров с автоматическим переключением. Без VPN, оплата картой РФ.

Любая LLM сейчас умеет писать сценарии. Вопрос только в том, сколько вашего времени уйдёт на исправление после. Это и есть единственная метрика, которая имеет значение для серийного AI-канала.

Дальше — попробуйте

Лучший способ понять разницу — не читать ещё одну статью, а прогнать одну и ту же идею через две модели и сравнить. Возьмите вашу следующую идею Shorts, напишите её в Claude (или прямо в Welder, где она пройдёт через каскад) — и посмотрите, сколько времени уйдёт на редактуру до состояния «можно публиковать».

Если результат вас устроит — у вас уже есть рабочий процесс. Если нет — попробуйте сменить модель и промпт. На рынке июня 2026 нет одного победителя; есть пять кандидатов, и у каждого своя ниша.