Welder AI релиз май 2026: голос, длинные ролики, рендер

Что мы выкатили в первой половине мая: единые голоса персонажей через всю серию, ролики длиннее 8 секунд и стабильный рендер.

Главное за 30 секунд

В первой половине мая 2026 мы выпустили серию апдейтов под одну задачу — сделать так, чтобы пайплайн Welder не ронялся на длинных диалоговых роликах. Главное — единые голоса персонажей через всю серию: теперь два-три героя говорят одним и тем же голосом во всех сценах, а не «перевоплощаются» при каждой 8-секундной нарезке Veo 3.

Это была боль всей индустрии. Veo 3.1 требует 3–5 регенераций на сложные звуковые сцены, Sora 2 рекомендует «полировать в посте». Мы переложили эту работу с пользователя на пайплайн.

Помимо голоса — три большие точки:

Ролики длиннее 8 секунд. Любой шортс на 30–60 секунд теперь это связанная цепочка сцен, а не рваная склейка.
Серии больше не «теряются». Если задача застряла на одном из шагов — пайплайн сам её разлочит и доведёт до конца.
Рендер не выпадает на финальной сборке. Даже если внешний сервис генерации видео не вернул последний кадр — итоговый MP4 всё равно соберётся.

Что это значит на серии видео в месяц — ниже, с цифрами.

Контекст: где мы стоим в мае 2026

Рынок коротких ИИ-видео живёт между двумя «эталонами»: Sora 2 (OpenAI) с клипами 20–25 секунд в одном проходе и Veo 3.1 (Google DeepMind) с 8-секундными бёрстами в 4K@60fps. У обоих своя слабость — длина и качество звука. Подробнее мы разбирали это в Sora 2 и Veo 3.1: новый стандарт качества AI-Shorts 2026.

Welder поверх — это не отдельная модель, а оркестратор: ниша → сценарий → персонажи → сцены → озвучка → склейка. Базовая модель видео — Veo 3 / Veo 2. Наша работа в мае была не «обучить новую сеть», а снять с пользователя ручную возню, которую обычно требует Veo 3 — особенно на серийных каналах, где одна и та же история живёт через 6–8 роликов в неделю.

Голос: один герой — один голос через всю серию

Раньше, если у вас в сцене был диалог двух персонажей, видео-модель могла дать на следующую сцену другие голоса — даже при одинаковом промпте. Это убивает faceless-каналы с одним нарратором, агентство с серией про античных богов, любой проект, где «герой опознаваем по голосу». По данным независимого теста на GLBGPT (январь 2026), сложные звуковые сцены в Veo 3.1 требуют в среднем 3–5 регенераций, чтобы получить желаемый результат.

Что мы изменили:

Сценарий теперь идёт в видео-модель структурированно — реплика, говорящий, эмоция, тон. Не просто стена текста.
Голос каждого персонажа фиксируется на первой сцене и пришивается ко всей цепочке. Герой «Александр» звучит одинаково в сцене 1 и в сцене 8 — это уже не лотерея.
Канонический диалог собирается до того, как уйдёт в рендер. Видео-модель получает чистую структуру, а не пытается парсить черновик.

На практике: в наших тестах на нише «Античные мифы» (12 серий по 3 сцены) сходимость голоса по сценам выросла с ~62% до ~95%. По нашим оценкам, это экономит 1–2 регенерации на серию — а это $0.5 за регенерацию, или около ₽45–90 за каждый сэкономленный прогон.

Если интересно, какой именно TTS-движок мы используем для финального звука и почему ElevenLabs v3 для русского выигрывает у Murf и OpenAI Voice — у нас есть отдельный тест Озвучка AI-Shorts 2026: ElevenLabs v3 vs OpenAI vs Murf.

Длинные ролики: 60 секунд через связанные сцены

Простая правда: в мае 2026 ни одна публичная модель не делает 60-секундное видео одним проходом. Sora 2 — 20–25 секунд, Veo 3.1 — 8 секунд, Runway Gen-4 — около 10 секунд, Kling 1.6 — 5–10. Чтобы сделать 60-секундный шортс, нужна цепочка сцен. Мы перепрошили этот этап целиком.

Что изменилось для пользователя:

Можно переписать сценарий целиком одним кликом — без необходимости править каждую сцену руками. Удобно, когда после первой генерации хочется поменять тон или акцент.
Сцены делятся детерминированно — длительность, количество, переходы считаются без AI-разброса. Серия из 7 эпизодов даёт одно и то же количество сцен, не «как повезёт».
Связь между сценами держится на последнем кадре: последний кадр предыдущей сцены идёт как референс в следующую. В интерфейсе это видно как древовидный список со связями — можно проследить визуальную последовательность.
Если первая сцена готова — кнопка «Сгенерировать остальные» появляется прямо над списком. Не нужно искать её в трёх местах.

Отдельное правило: новый персонаж = новая сцена. Если в эпизоде появляется герой, которого не было раньше — генерируется новая сцена с keyframe-склейкой, а не «впихнуть в кадр». Так видео-модель не путается и держит консистентность.

Стабильность рендера: что больше не ломается

Это менее эффектная, но более «деньги-сохраняющая» часть релиза. Раньше серия могла встать на одном из шагов, и пользователь видел подвешенное состояние без объяснения, что делать. Теперь:

Зависшие задачи перезапускаются автоматически. Если генерация персонажей или сцен застряла на стороне внешнего сервиса — пайплайн сам её разлочивает, без вашего участия.
Финальный MP4 не теряется на сборке. Раньше, если видео-модель не вернула один из служебных параметров, мог пропасть весь ролик. Сейчас резервный путь его всё равно соберёт.
Превью эпизодов больше не моргают из-за кэша CDN. Подписанные ссылки на изображения стали стабильнее.
Если внешний сервис генерации картинок отказал по политике контента — Welder автоматически переключается на резервный путь и санирует промпт, чтобы серия не встала из-за одного слова.
Левая панель шагов корректно показывает прогресс даже на старых черновиках — мы научились восстанавливать состояние из артефактов.

Главный эффект для пользователя: доля «потерянных» серий из-за инфраструктуры упала примерно в 4 раза по нашим внутренним замерам за последние 7 дней. Для тарифа Creator (₽2,075/мес, 5 000 ◈, ≈6 серий в месяц) это разница между «6 серий пришли» и «3 пришли, 3 надо перезапустить вручную». Если ещё не знакомы с тарифами — /pricing с разбором.

Сценарий: резерв на случай, если основной сервис лёг

Тихая, но важная часть. Раньше, если наш основной сервис генерации сценариев уходил в техобслуживание — серия вставала. Теперь у Welder есть три уровня резерва: если основной не отвечает за разумное время, пайплайн идёт на резервный, затем на ещё один. Серии больше не зависят от того, как себя чувствует один конкретный AI-провайдер сегодня.

Дополнительно: мы подняли таймаут на сценарии, чтобы резерв успевал отрабатывать без обрывов, и убрали «обрезание» русского текста на длинных сценариях — старая боль «история обрывается на полуслове» закрыта.

Что это значит на практике: за последнюю неделю мы видим почти ноль «упавших» серий из-за сценарного шага — против примерно 12% месяц назад. Подробное сравнение моделей для AI-сценариев — ChatGPT-5 vs Claude 4.7 vs Gemini 2.5 для AI-Shorts 2026.

Welder vs Veo 3 vs Sora 2: где мы стоим

Честный взгляд. Welder не выигрывает у Veo 3.1 в качестве отдельного кадра — мы работаем поверх Veo. И не выигрывает у Sora 2 в длине одного клипа — Sora 2 рисует 20–25 секунд, мы зависим от 8-секундных бёрстов Veo 3. Зато выигрываем в оркестрации.

Параметр	Welder AI (май 2026)	Veo 3.1 (raw)	Sora 2 (raw)
Длина непрерывного клипа	8 сек × N связанных сцен	8 сек	20–25 сек
Разрешение	До 1080p (4K на Studio)	4K @ 60fps	1080p
Мульти-голос (RU)	Один голос на героя через всю серию + ElevenLabs v3	3–5 регенераций на сложный диалог	Рекомендуют доводить в посте
Сценарий → видео	Сквозной пайплайн с правкой на каждом шаге	Только промпт	Только промпт
Цена за серию (RU)	от ₽137 (Starter) до ₽271 (Studio)	≈$0.5 за 8 сек × N	$20/мес в ChatGPT Plus
Карта РФ	Да, без VPN	Через прокси	Через прокси

Где мы выигрываем: оркестрация (ниша → 10 готовых роликов), русские голоса с фиксацией по серии, оплата с российской карты, прогнозируемая стоимость на ролик. Где проигрываем: качество одного кадра у Veo 3.1 в чистом виде и длина одного клипа у Sora 2.

Если вам нужен один киношный 25-секундный кусок — берите Sora 2 напрямую. Если нужно 6 серий по 60 секунд каждую неделю — Welder снимет с вас половину рутины.

Что планируем дальше

Без обещаний — прозрачно. Приоритеты на июнь 2026:

Клон собственного голоса за 30 секунд через ElevenLabs Voice Lab, с автоматической привязкой к персонажам серии.
4K-экспорт на Creator — пока 4K доступен только на Studio. 1080p уже стало индустриальным минимумом, 4K — следующий шаг.
API-доступ для Studio — движемся итерациями, без даты, но не на «когда-нибудь».
Перепаковка одного ролика в 5 форматов: Reels → TikTok → Shorts → VK Клипы → Telegram — одной кнопкой, с под-форматным ресайзом и адаптацией подписей. Конкуренты Opus Clip и Submagic делают это с длинного видео; мы делаем с native short-form.
Локализация RU → EN одной кнопкой: переписать сценарий, сгенерировать английский голос, переложить субтитры. Это для тех, кто хочет выйти на западный рынок без второго пайплайна.

Если что-то из этого критично для вашего канала — напишите в саппорт. Мы приоритизируем по реальным запросам пользователей, а не по гипотезам команды.

Что делать прямо сейчас

Если вы уже на Welder — все обновления применены автоматически, перенастраивать ничего не нужно. Попробуйте серию с диалогом двух персонажей — увидите фиксацию голосов на практике. На сложной нише (исторические диалоги, подкаст-фрагменты, мифологические сюжеты) разница ощутима с первого прогона.

Если ещё не запускали — на регистрацию приходит 1 500 ◈, этого хватает примерно на 2 короткие серии для теста. Достаточно, чтобы понять, ложится ли пайплайн на вашу нишу. Если планируете faceless-канал с нуля — наш свежий гайд Faceless канал на ИИ за выходные 2026: план 48 часов объясняет, что делать в первые два дня после регистрации.

Откройте dashboard и сделайте первую серию — это пять кликов и одно описание ниши. Дальше пайплайн отработает сам.