Главное за 30 секунд
С момента прошлого апдейта Welder ушло 9 итераций (iter-146 → iter-154). Главное — мы перестали смотреть на «voiceover-режим» как на одиночный ролик. Теперь это полноценная серия эпизодов: один сценарий, единые персонажи, ref-sheet картинок, единый голос — и шесть-семь готовых роликов на канал за неделю, а не один с заметкой «продолжение в следующий вторник».
Параллельно — три большие точки:
- Кинематик-флоу публикует в соцсети прямо из wizard-чассиса: TikTok, Instagram Reels, YouTube Shorts, без выхода в отдельный publish-tab.
- Captions с text-fallback: если Submagic-уровневые анимированные субтитры не докрутились за 60 секунд — пользователю отдаётся текстовая версия, а не зависший спиннер.
- Self-heal пайплайна залатан в шести точках, где ETL мог застрять и съесть деньги пользователя без результата.
Если вы прошли через первую часть мая, вторая половина — это «теперь не падает» и «теперь это серия». Подробности с цифрами ниже.
Voiceover-серии: один эпизод → семь (iter-147)
До iter-147 voiceover в Welder был одноразовым: вы запускали проект, получали ролик, всё. Если хотелось продолжения — приходилось копировать сценарий вручную, заново выбирать голос, заново описывать персонажей. На faceless-канал это разбивалось об усталость на третьей серии.
В iter-147 voiceover скопировал модель cinematic: сериал → эпизоды → отдельные runs внутри эпизода. Теперь страница серии содержит список эпизодов, эпизод открывается в /episodes/[id] как полноценное рабочее пространство, и кнопка «Создать ролик» внутри эпизода запускает новый run без повторного ввода ниши, голоса и персонажей.
Что это даёт на практике для контент-плана:
- 6–8 эпизодов в неделю на одного нарратора без переключения контекста. Если вы планируете ритм публикаций, у нас есть свежий Контент-план AI-канала на 30 дней с шаблоном сетки.
- Единый голос по серии — фиксируется на первом ролике, держится до конца сезона. Это закрывает старую боль faceless-каналов, где Veo 3.1 raw требовал 3–5 регенераций на консистентный голос в сложных сценах.
- Превью эпизодов — иконка строится из первого кадра visual_cuts JSONB (iter-148). Карточки эпизодов больше не одинаково-серые, видно, где какой ролик.
Сравнительно: похожую идею «серий» сейчас делают Captions (через Avatar Series) и HeyGen (через HeyGen Studio с Avatar IV). Captions ориентирован на пользователей с лицом в кадре, HeyGen — на корпоративные аватары. Welder заходит с третьей стороны: faceless-серии с собственным актёрским составом и без человека в кадре. Развёрнутое сравнение по аватарам и talking-head — AI-аватары 2026: HeyGen, Synthesia, D-ID, Tavus и Welder.
Character ref-sheet i2i: единые персонажи между чанками
Связанная вещь, отдельная история. В iter-147 для voiceover мы выкатили полный каскад Poyo → KIE → OpenRouter для генерации reference-листа персонажей. LLM выбирает каст из сценария, генерирует одну размеченную картинку со всеми персонажами серии, и в каждом следующем cut'е выбирается нужный персонаж — а не «нарисуй похожего парня в кепке».
Это сохраняет лицо героя через 8-секундные бёрсты Veo 3.1 — главную слабость всех генеративных моделей в мае 2026. Когда модели одного провайдера падают (контент-полиси, рейт-лимиты), пайплайн уходит в tier-2, потом в tier-3 (OpenRouter с inlined appearance prompt, iter-147.2). Падать перестало.
В iter-148 мы дополнительно убили leak: persona reference больше не «протекает» в style master image — теперь рамки кадра и framing-rules применяются динамически к каждому чанку, а не наследуют общий референс.
Кинематик в соцсети: TikTok, Reels, YouTube из чассиса (iter-146/150)
Раньше после рендера кинематик-эпизода вы попадали на отдельную страницу публикации, теряя контекст wizard'а. С iter-146 (флаг SOCIAL_CINEMATIC_ENABLED) и iter-150 это собрано внутри wizard-чассиса: сайдбар «Соцсети» с карточками подключения TikTok / Instagram / YouTube прямо рядом с превью ролика.
Что добавили:
- Подключение по OAuth-origin
cinematic_step11(iter-146): после авторизации соцсети вы возвращаетесь не на главную, а обратно в wizard, на тот же шаг. - Smart-redirect: если эпизод готов, а пользователь ещё стоит на онбординге, мы перекидываем в карточку публикации — не нужно искать «куда нажать» в трёх местах.
- Snapshot-сохранение Publish при рефреше (через
episode_id-колонку): если вы случайно обновили страницу — состояние карточек коннекта не сбросилось. - Multi-reviewer-bypass (iter-153): отдельные sandbox-аккаунты для ревьюеров Meta / TikTok / YouTube App Review — это инфраструктурная часть, чтобы пройти все три магазина параллельно.
Для контекста: конкуренты в RU-сегменте здесь делятся на две группы. Opus Clip и Submagic заточены под repurpose из длинного видео и публикуют через свои интеграции, но не строят native short-form с нуля. Captions делает обе вещи, но интерфейс публикации — отдельный шаг после монтажа. У Welder сборка и публикация теперь сходятся в одном wizard'е, что для серийной работы важнее, чем «больше галочек настроек».
Если интересно, как именно работают алгоритмы платформ и почему публикация в одно окно ускоряет рост — у нас есть Алгоритмы Shorts 2026: TikTok, Reels, YouTube — что важно.
Captions defense-in-depth (iter-151)
Главное по субтитрам в iter-151: раньше при сбое анимированных captions пользователь видел зависший спиннер — теперь видит читаемый текстовый fallback. Это «defense in depth», то есть многоуровневая защита, не одна точка.
Что под капотом:
- Основной путь — анимированные captions через style-aware рендер (Submagic-уровень: жирный шрифт, акценты на ключевых словах, синхронизация по фонеме).
- Tier 2 — если style-aware рендер не успел за 60 секунд: статичный текстовый блок с правильным таймингом из ASR.
- 24-часовая обсервабилити: метрики по доле fallback-срабатываний, отдельный алерт, если она превышает 5% за сутки.
Если выбираете между сервисами субтитров и стилями оформления — мы недавно опубликовали Субтитры в AI-Shorts 2026: +27% удержания в TikTok и Reels с разбором, какой стиль работает на какой аудитории.
Сравнительно, Submagic ($24/мес) и Captions ($19.99/мес) делают это лучше нас в части тонких визуальных эффектов: glow на ключевом слове, bounce-анимация, эмодзи-инжект. Welder здесь догоняет, не лидирует. Зато у нас captions входят в стоимость серии (от ₽137 за ролик на Starter), не отдельной подпиской.
Single-WAV voiceover архитектура (iter-146)
Тихая, но фундаментальная вещь. До iter-146 voiceover собирался из chunk'ов аудио, склеивался ffmpeg'ом, и любая ошибка на одном чанке валила весь рендер. С iter-146 пайплайн делает один master-WAV на весь эпизод, а chunk'и — это уже срезы для синхронизации с видео.
Эффект:
- Stuck-recovery для chunk-audio — если задача застряла в
audio_running,/run-полл сам её разлочивает (iter-150 уже растянулchunk-audio-tick maxDurationс 60 до 120 секунд, потому что STT обрезал 70+-секундные WAV'ы из-за lambda-таймаута). - Composite recovery — если ffmpeg-композитор упал на сборке, мы возвращаемся к last-known-good master WAV и пере-собираем только композит.
- Real-ASR transcribe (gpt-4o-mini-transcribe, iter-145.4): captions теперь синхронизируются с реальной длиной озвучки, а не с предсказанием storyboard'а. Это лечит старую боль «титры опередили голос на 0.4 секунды».
Под капотом для русского TTS мы по-прежнему используем ElevenLabs v3. По нашему собственному замеру (Озвучка AI-Shorts 2026: ElevenLabs vs OpenAI vs Murf) Eleven остаётся лучшим выбором для русского. В мае 2026 OpenAI выпустил gpt-audio-mini (≈$15 за 1М символов против $180 у ElevenLabs), но качество эмоциональной окраски на RU всё ещё уступает Eleven v3. Заметка про gpt-audio-mini теперь pinned в TTS-режиме с system-prompt (iter-146.1) — иначе модель уходила в чат-фолбэк со словами «специалист, который поможет разобраться».
Self-heal: шесть точек, где раньше теряли деньги
| Что было | Что починили | Iter |
|---|---|---|
| Char-refs застревали без таймаута → застрявшая серия | Status-constraint + skip-providers + graceful fallback на 3 tier'а | iter-149 |
| Object-leak от style master картинки → персонажи плыли | Kill leak + dynamic-framing rules per chunk | iter-148 |
| Captions UI-counter показывал «не готово», когда audio закончился | Treat captions as done when audio stage finished | iter-147.5 |
| Chunk-audio completion gate ронял весь рендер при advisory captions | Relax gate — captions advisory в single-WAV арх | iter-147.4 |
| web_jobs column конфликт → падал char-refs OR-fallback | Колонка result (не output) + voiceover_character_refs в kind CHECK | iter-147.3 |
| Publish-снапшот терялся при рефреше | episode_id колонка + scope по episode | step11 |
Общий эффект для пользователя: доля «потерянных» серий из-за инфраструктуры в логах step11 ушла к нулю за последние 14 дней. Это переводится в простое: на тарифе Creator (₽2,075/мес, 5 000 ◈) если вы заказали 6 серий в месяц — приходят все 6, а не 4 с подвешенным состоянием. Подробнее по тарифам — /pricing.
Где мы стоим: Welder vs Veo 3.1 vs Sora 2 на серии
Честный взгляд после второй части мая. Не «у нас всё лучше», а где в стеке мы.
| Параметр | Welder AI (май 2026) | Veo 3.1 (raw) | Sora 2 |
|---|---|---|---|
| Серии эпизодов | Voiceover + cinematic — встроено | Только промпт за промптом | Только промпт |
| Публикация в соцсети | Из wizard в TikTok / Reels / YouTube | Нет | Нет (Sora 2 закрылась 12 мая 2026) |
| Captions с text-fallback | Да, defense-in-depth | Нет | Нет |
| Единый голос/character ref-sheet | VOICE LOCK + i2i caster | Доводить вручную | Доводить в посте |
| Карта РФ | Да, без VPN | Через прокси | Доступа нет |
| Цена за серию (RU) | от ₽137 (Starter) | ≈$0.5/8 сек × N | — |
Где мы выигрываем: серии, оркестрация, публикация в одно окно, RU-платежи. Где проигрываем: качество отдельного кадра у Veo 3.1 raw, отдельные тонкости captions у Submagic / Captions. Если нужен один киношный шот — берите Veo 3.1 напрямую (мы тоже работаем поверх него). Если нужно запускать сериал, монетизировать через TikTok Creator Rewards и спать ночью — Welder снимает с вас 80% рутины и инфраструктурного риска.
После закрытия Sora 2 пользователи активно мигрируют на Veo 3.1 и связанные пайплайны — мы разбирали маршрут миграции в Sora 2 закрылась: на что мигрировать AI-каналу в 2026. С iter-154 мы дополнительно дописали явную AI-disclosure в Terms и Privacy для прохождения Meta App Review и Google OAuth Verification — это легально-страховочная часть, без которой автопубликация в Instagram и YouTube невозможна на серьёзном объёме.
Что планируем до конца июня 2026
Без обещаний, прозрачно по приоритетам:
- API-доступ для тарифа Studio — на руках долгожданный wave, движемся итерациями.
- 4K-экспорт на Creator — пока 4K только на Studio, перенастройка рендер-этапа в плане.
- Voice-cloning self-serve — собственный голос за 30 секунд через ElevenLabs Voice Lab, привязка к персонажам серии.
- Repurpose-режим: long-form → шесть нативных шортсов с пересборкой сценария и captions, не просто crop. Здесь мы будем сравнивать себя с Opus Clip напрямую.
- Локализация RU → EN одной кнопкой: переписать сценарий, сгенерировать EN-голос, ремэп подписей. Это закрывает запрос на «выйти на западный рынок без второго пайплайна».
Если что-то из этого критично для вашего канала — напишите в саппорт или ответьте на этот пост. Мы приоритизируем по реальным запросам, а не по гипотезам команды.
Что делать сейчас
Если вы уже на Welder — обновления применены автоматически, перенастраивать ничего не нужно. Попробуйте создать voiceover-серию из 3 эпизодов — увидите, как меняется ритм работы по сравнению с одиночными роликами.
Если ещё не запускали — на регистрацию приходит 1 500 ◈, этого хватает на 2–3 короткие серии для теста ниши. Достаточно, чтобы понять, ложится ли пайплайн на ваш формат — особенно если планируете faceless с regular ритмом публикаций.
Откройте dashboard и запустите первую серию — пять кликов, одно описание ниши, и пайплайн отработает сам.