Skip to main contentWelder AI: voiceover-серии и соцсети — апдейт мая 2026
WWelder AI

Welder AI: voiceover-серии и соцсети — апдейт мая 2026

Обновления8 минWelder AI

Welder AI: voiceover-серии и соцсети — апдейт мая 2026

Voiceover теперь живёт как сериал эпизодов. Кинематик публикует в соцсети прямо из чассиса. И captions больше не зависают.

Главное за 30 секунд

С момента прошлого апдейта Welder ушло 9 итераций (iter-146 → iter-154). Главное — мы перестали смотреть на «voiceover-режим» как на одиночный ролик. Теперь это полноценная серия эпизодов: один сценарий, единые персонажи, ref-sheet картинок, единый голос — и шесть-семь готовых роликов на канал за неделю, а не один с заметкой «продолжение в следующий вторник».

Параллельно — три большие точки:

  • Кинематик-флоу публикует в соцсети прямо из wizard-чассиса: TikTok, Instagram Reels, YouTube Shorts, без выхода в отдельный publish-tab.
  • Captions с text-fallback: если Submagic-уровневые анимированные субтитры не докрутились за 60 секунд — пользователю отдаётся текстовая версия, а не зависший спиннер.
  • Self-heal пайплайна залатан в шести точках, где ETL мог застрять и съесть деньги пользователя без результата.

Если вы прошли через первую часть мая, вторая половина — это «теперь не падает» и «теперь это серия». Подробности с цифрами ниже.

Voiceover-серии: один эпизод → семь (iter-147)

До iter-147 voiceover в Welder был одноразовым: вы запускали проект, получали ролик, всё. Если хотелось продолжения — приходилось копировать сценарий вручную, заново выбирать голос, заново описывать персонажей. На faceless-канал это разбивалось об усталость на третьей серии.

В iter-147 voiceover скопировал модель cinematic: сериал → эпизоды → отдельные runs внутри эпизода. Теперь страница серии содержит список эпизодов, эпизод открывается в /episodes/[id] как полноценное рабочее пространство, и кнопка «Создать ролик» внутри эпизода запускает новый run без повторного ввода ниши, голоса и персонажей.

Что это даёт на практике для контент-плана:

  • 6–8 эпизодов в неделю на одного нарратора без переключения контекста. Если вы планируете ритм публикаций, у нас есть свежий Контент-план AI-канала на 30 дней с шаблоном сетки.
  • Единый голос по серии — фиксируется на первом ролике, держится до конца сезона. Это закрывает старую боль faceless-каналов, где Veo 3.1 raw требовал 3–5 регенераций на консистентный голос в сложных сценах.
  • Превью эпизодов — иконка строится из первого кадра visual_cuts JSONB (iter-148). Карточки эпизодов больше не одинаково-серые, видно, где какой ролик.

Сравнительно: похожую идею «серий» сейчас делают Captions (через Avatar Series) и HeyGen (через HeyGen Studio с Avatar IV). Captions ориентирован на пользователей с лицом в кадре, HeyGen — на корпоративные аватары. Welder заходит с третьей стороны: faceless-серии с собственным актёрским составом и без человека в кадре. Развёрнутое сравнение по аватарам и talking-head — AI-аватары 2026: HeyGen, Synthesia, D-ID, Tavus и Welder.

Character ref-sheet i2i: единые персонажи между чанками

Связанная вещь, отдельная история. В iter-147 для voiceover мы выкатили полный каскад Poyo → KIE → OpenRouter для генерации reference-листа персонажей. LLM выбирает каст из сценария, генерирует одну размеченную картинку со всеми персонажами серии, и в каждом следующем cut'е выбирается нужный персонаж — а не «нарисуй похожего парня в кепке».

Это сохраняет лицо героя через 8-секундные бёрсты Veo 3.1 — главную слабость всех генеративных моделей в мае 2026. Когда модели одного провайдера падают (контент-полиси, рейт-лимиты), пайплайн уходит в tier-2, потом в tier-3 (OpenRouter с inlined appearance prompt, iter-147.2). Падать перестало.

В iter-148 мы дополнительно убили leak: persona reference больше не «протекает» в style master image — теперь рамки кадра и framing-rules применяются динамически к каждому чанку, а не наследуют общий референс.

Кинематик в соцсети: TikTok, Reels, YouTube из чассиса (iter-146/150)

Раньше после рендера кинематик-эпизода вы попадали на отдельную страницу публикации, теряя контекст wizard'а. С iter-146 (флаг SOCIAL_CINEMATIC_ENABLED) и iter-150 это собрано внутри wizard-чассиса: сайдбар «Соцсети» с карточками подключения TikTok / Instagram / YouTube прямо рядом с превью ролика.

Что добавили:

  • Подключение по OAuth-origin cinematic_step11 (iter-146): после авторизации соцсети вы возвращаетесь не на главную, а обратно в wizard, на тот же шаг.
  • Smart-redirect: если эпизод готов, а пользователь ещё стоит на онбординге, мы перекидываем в карточку публикации — не нужно искать «куда нажать» в трёх местах.
  • Snapshot-сохранение Publish при рефреше (через episode_id-колонку): если вы случайно обновили страницу — состояние карточек коннекта не сбросилось.
  • Multi-reviewer-bypass (iter-153): отдельные sandbox-аккаунты для ревьюеров Meta / TikTok / YouTube App Review — это инфраструктурная часть, чтобы пройти все три магазина параллельно.

Для контекста: конкуренты в RU-сегменте здесь делятся на две группы. Opus Clip и Submagic заточены под repurpose из длинного видео и публикуют через свои интеграции, но не строят native short-form с нуля. Captions делает обе вещи, но интерфейс публикации — отдельный шаг после монтажа. У Welder сборка и публикация теперь сходятся в одном wizard'е, что для серийной работы важнее, чем «больше галочек настроек».

Если интересно, как именно работают алгоритмы платформ и почему публикация в одно окно ускоряет рост — у нас есть Алгоритмы Shorts 2026: TikTok, Reels, YouTube — что важно.

Captions defense-in-depth (iter-151)

Главное по субтитрам в iter-151: раньше при сбое анимированных captions пользователь видел зависший спиннер — теперь видит читаемый текстовый fallback. Это «defense in depth», то есть многоуровневая защита, не одна точка.

Что под капотом:

  1. Основной путь — анимированные captions через style-aware рендер (Submagic-уровень: жирный шрифт, акценты на ключевых словах, синхронизация по фонеме).
  2. Tier 2 — если style-aware рендер не успел за 60 секунд: статичный текстовый блок с правильным таймингом из ASR.
  3. 24-часовая обсервабилити: метрики по доле fallback-срабатываний, отдельный алерт, если она превышает 5% за сутки.

Если выбираете между сервисами субтитров и стилями оформления — мы недавно опубликовали Субтитры в AI-Shorts 2026: +27% удержания в TikTok и Reels с разбором, какой стиль работает на какой аудитории.

Сравнительно, Submagic ($24/мес) и Captions ($19.99/мес) делают это лучше нас в части тонких визуальных эффектов: glow на ключевом слове, bounce-анимация, эмодзи-инжект. Welder здесь догоняет, не лидирует. Зато у нас captions входят в стоимость серии (от ₽137 за ролик на Starter), не отдельной подпиской.

Single-WAV voiceover архитектура (iter-146)

Тихая, но фундаментальная вещь. До iter-146 voiceover собирался из chunk'ов аудио, склеивался ffmpeg'ом, и любая ошибка на одном чанке валила весь рендер. С iter-146 пайплайн делает один master-WAV на весь эпизод, а chunk'и — это уже срезы для синхронизации с видео.

Эффект:

  • Stuck-recovery для chunk-audio — если задача застряла в audio_running, /run-полл сам её разлочивает (iter-150 уже растянул chunk-audio-tick maxDuration с 60 до 120 секунд, потому что STT обрезал 70+-секундные WAV'ы из-за lambda-таймаута).
  • Composite recovery — если ffmpeg-композитор упал на сборке, мы возвращаемся к last-known-good master WAV и пере-собираем только композит.
  • Real-ASR transcribe (gpt-4o-mini-transcribe, iter-145.4): captions теперь синхронизируются с реальной длиной озвучки, а не с предсказанием storyboard'а. Это лечит старую боль «титры опередили голос на 0.4 секунды».

Под капотом для русского TTS мы по-прежнему используем ElevenLabs v3. По нашему собственному замеру (Озвучка AI-Shorts 2026: ElevenLabs vs OpenAI vs Murf) Eleven остаётся лучшим выбором для русского. В мае 2026 OpenAI выпустил gpt-audio-mini (≈$15 за 1М символов против $180 у ElevenLabs), но качество эмоциональной окраски на RU всё ещё уступает Eleven v3. Заметка про gpt-audio-mini теперь pinned в TTS-режиме с system-prompt (iter-146.1) — иначе модель уходила в чат-фолбэк со словами «специалист, который поможет разобраться».

Self-heal: шесть точек, где раньше теряли деньги

Что былоЧто починилиIter
Char-refs застревали без таймаута → застрявшая серияStatus-constraint + skip-providers + graceful fallback на 3 tier'аiter-149
Object-leak от style master картинки → персонажи плылиKill leak + dynamic-framing rules per chunkiter-148
Captions UI-counter показывал «не готово», когда audio закончилсяTreat captions as done when audio stage finishediter-147.5
Chunk-audio completion gate ронял весь рендер при advisory captionsRelax gate — captions advisory в single-WAV архiter-147.4
web_jobs column конфликт → падал char-refs OR-fallbackКолонка result (не output) + voiceover_character_refs в kind CHECKiter-147.3
Publish-снапшот терялся при рефрешеepisode_id колонка + scope по episodestep11

Общий эффект для пользователя: доля «потерянных» серий из-за инфраструктуры в логах step11 ушла к нулю за последние 14 дней. Это переводится в простое: на тарифе Creator (₽2,075/мес, 5 000 ◈) если вы заказали 6 серий в месяц — приходят все 6, а не 4 с подвешенным состоянием. Подробнее по тарифам — /pricing.

Где мы стоим: Welder vs Veo 3.1 vs Sora 2 на серии

Честный взгляд после второй части мая. Не «у нас всё лучше», а где в стеке мы.

ПараметрWelder AI (май 2026)Veo 3.1 (raw)Sora 2
Серии эпизодовVoiceover + cinematic — встроеноТолько промпт за промптомТолько промпт
Публикация в соцсетиИз wizard в TikTok / Reels / YouTubeНетНет (Sora 2 закрылась 12 мая 2026)
Captions с text-fallbackДа, defense-in-depthНетНет
Единый голос/character ref-sheetVOICE LOCK + i2i casterДоводить вручнуюДоводить в посте
Карта РФДа, без VPNЧерез проксиДоступа нет
Цена за серию (RU)от ₽137 (Starter)≈$0.5/8 сек × N

Где мы выигрываем: серии, оркестрация, публикация в одно окно, RU-платежи. Где проигрываем: качество отдельного кадра у Veo 3.1 raw, отдельные тонкости captions у Submagic / Captions. Если нужен один киношный шот — берите Veo 3.1 напрямую (мы тоже работаем поверх него). Если нужно запускать сериал, монетизировать через TikTok Creator Rewards и спать ночью — Welder снимает с вас 80% рутины и инфраструктурного риска.

После закрытия Sora 2 пользователи активно мигрируют на Veo 3.1 и связанные пайплайны — мы разбирали маршрут миграции в Sora 2 закрылась: на что мигрировать AI-каналу в 2026. С iter-154 мы дополнительно дописали явную AI-disclosure в Terms и Privacy для прохождения Meta App Review и Google OAuth Verification — это легально-страховочная часть, без которой автопубликация в Instagram и YouTube невозможна на серьёзном объёме.

Что планируем до конца июня 2026

Без обещаний, прозрачно по приоритетам:

  1. API-доступ для тарифа Studio — на руках долгожданный wave, движемся итерациями.
  2. 4K-экспорт на Creator — пока 4K только на Studio, перенастройка рендер-этапа в плане.
  3. Voice-cloning self-serve — собственный голос за 30 секунд через ElevenLabs Voice Lab, привязка к персонажам серии.
  4. Repurpose-режим: long-form → шесть нативных шортсов с пересборкой сценария и captions, не просто crop. Здесь мы будем сравнивать себя с Opus Clip напрямую.
  5. Локализация RU → EN одной кнопкой: переписать сценарий, сгенерировать EN-голос, ремэп подписей. Это закрывает запрос на «выйти на западный рынок без второго пайплайна».

Если что-то из этого критично для вашего канала — напишите в саппорт или ответьте на этот пост. Мы приоритизируем по реальным запросам, а не по гипотезам команды.

Что делать сейчас

Если вы уже на Welder — обновления применены автоматически, перенастраивать ничего не нужно. Попробуйте создать voiceover-серию из 3 эпизодов — увидите, как меняется ритм работы по сравнению с одиночными роликами.

Если ещё не запускали — на регистрацию приходит 1 500 ◈, этого хватает на 2–3 короткие серии для теста ниши. Достаточно, чтобы понять, ложится ли пайплайн на ваш формат — особенно если планируете faceless с regular ритмом публикаций.

Откройте dashboard и запустите первую серию — пять кликов, одно описание ниши, и пайплайн отработает сам.

#update#welder#voiceover#соцсети#captions#veo-3-1#релиз#ии-канал