Главное за 30 секунд
85% мобильного видео смотрят без звука — в транспорте, в офисе, в кровати рядом со спящим партнёром. Если ваш AI-Short без субтитров — для большинства зрителей это просто немое мельтешение, которое они смотают за 0.6 секунды.
По данным OpusClip за январь–март 2026 (выборка 13.5 млн клипов), 80.2% виральных Shorts используют burned-in captions, и 78.6% из них — анимированные word-by-word. Видео с анимированными субтитрами удерживают зрителя на 15–20% дольше статичных, а статичные — заметно дольше «голых».
Дальше — 6 правил читаемости под кириллицу, safe-zone в 9:16, шесть инструментов в сравнительной таблице (CapCut, Submagic, Captions.ai, Opus Clip, VEED, Welder), три рабочих шаблона стиля и план на 7 дней, чтобы поднять retention своего AI-канала, не ломая пайплайн.
Почему субтитры — это про деньги, а не про эстетику
Один из самых дорогих мифов 2024–25 годов: «у меня крутой голос ElevenLabs, subtitle лишний шум». На самом деле, субтитр в Shorts делает три отдельные вещи, каждая из которых конвертируется в просмотры.
Удержание. Анимированные субтитры дают +12–20% к average view duration — это прямой вход в рекомендации TikTok и YouTube Shorts. Метрика «percent watched» — один из топ-3 ранкинговых сигналов в обоих алгоритмах. На AI-Shorts эффект ещё заметнее: голос ElevenLabs звучит чисто, но мозг зрителя в фоновом скролле обрабатывает текст быстрее звука, и решение «свайпнуть/остаться» принимается за первую секунду.
Алгоритмический сигнал. TikTok и YouTube читают распознанный текст как контентную метку. Burned-in captions с правильными ключевыми словами — это бесплатный SEO-слой поверх description и hashtags. Для русскоязычных AI-каналов это особенно важно: модерация YouTube в 2026 сильнее доверяет визуальному распознаванию, чем загруженным .srt.
Доступность. Глухие, слабослышащие, люди в тихих помещениях, школьники на уроках — это десятки процентов аудитории. На каналах формата «история / факт / научпоп» доля «звук-офф» доходит до 90%.
Если вы делаете AI-Shorts по пайплайну Welder, у вас уже есть точные тайминги озвучки — добавить субтитр стоит почти ноль, а ROI измеряется десятками процентов retention.
6 правил читаемости — стандарт-минимум 2026
Это не «лучшие практики», а тот низ, ниже которого видео гарантированно теряет 10–25% удержания. Пройдите по списку перед каждой публикацией.
1. Sans-serif bold, никакой стилизации. В 9:16 на 6-дюймовом экране любой serif или handwritten шрифт превращается в кашу. Возьмите Inter, Manrope, Montserrat или TT Norms — все с хорошей кириллицей. Вес 700–800, не ниже.
2. Размер 7–9% от высоты кадра. В каноне 1080×1920 это 140–180 пикселей по высоте глифа. Меньше — нечитаемо на 5.4-дюймовых iPhone SE, больше — лезет за safe-zone.
3. Контраст: белый + чёрная обводка 2–4 px. Это стандарт TikTok по умолчанию, и он лучший. Альтернатива — белый текст на полупрозрачной плашке (RGBA black 0.4–0.6), но плашка съедает 12–18% площади и отнимает внимание от кадра. Используйте только если фон видео слишком пёстрый.
4. Не более 6 слов на кадр. В режиме «фраза-за-фразой» — 2–4 слова. В режиме «word-by-word karaoke» — одно слово в крупном выделении плюс фрагмент строки бледнее.
5. Тайминг ±100 мс от речи. Если субтитр опаздывает на четверть секунды — мозг ловит рассинхрон и переключается. ElevenLabs возвращает per-word timings; Submagic и Captions делают это автоматически через Deepgram/AssemblyAI.
6. Один шрифт на канал. Серийный AI-канал = бренд. Сменили шрифт между роликами — потеряли узнаваемость на ленте. Заведите style guide и держитесь его.
Safe-zone в 9:16: где UI накрывает субтитры
Канвас 1080×1920, но реально «ваш» — только середина. TikTok съедает нижние 25% и верхние 15% UI-элементами: лайки, кнопка share, аватар, никнейм, sound-метка, description. Аналогично — Reels и Shorts (детали и точные карты разобраны в гайде по safe-zone).
Для субтитров оптимальный коридор — 35–65% высоты кадра, по центру. Это:
- ниже логотипа канала, если он есть
- выше нижней UI-планки
- в зоне, где взгляд естественно фокусируется
Если вы привыкли клеить субтитр снизу (как в кино) — переучивайтесь. В вертикальном формате нижняя треть — это UI-помойка, а не место для смысла.
Для горизонтальных Shorts (Long-form репурпоз в 16:9 → 9:16 letterbox) safe-zone уезжает на ±10% — всегда проверяйте превью в TikTok-апликации, а не только в Premiere.
Три рабочих шаблона стиля под нишу
Не любой стиль работает на любой нише. Ниже — три проверенных, с маппингом на типы AI-каналов.
| Шаблон | Как выглядит | Где работает | Retention bump | Чем сделать |
|---|---|---|---|---|
| Karaoke word-by-word | 1 слово крупно, остальные бледнее | Сторителлинг, история, мистика, факты | +18–22% | Submagic Hormozi, Captions Karaoke |
| Phrase-by-phrase | 2–4 слова, центр, статично | Lifestyle, кухня, советы, how-to | +10–14% | CapCut Auto-Captions, VEED |
| Highlight + emoji | Фраза + жёлтое/зелёное выделение ключа + эмодзи | Юмор, развлекалово, scroll-stop хуки | +15–18% | Submagic Trendy, Opus Clip Big Word |
Правило простое: чем эмоциональнее ниша — тем сильнее анимация. На научпопе и канале про русскую кухню переборщить с jumping-emoji легко: 60-летняя бабушка-зритель закроет. На канале с городскими легендами — наоборот, чем драматичнее — тем лучше.
Сравнение инструментов captions 2026
Я протестировал 6 решений на одном и том же 45-секундном AI-Short (русская озвучка ElevenLabs, формат вертикальной мини-истории). Метрики: точность распознавания кириллицы, цена за минуту обработки, watermark на free, API-доступ, время рендера.
| Инструмент | Цена 2026 | Точность RU | Шаблоны/анимация | Free + watermark | API | Кому подходит |
|---|---|---|---|---|---|---|
| CapCut | бесплатно | 88–92% | базовая, ручная анимация | без watermark | нет | Универсал-в-редакторе, если делаете 1–10 видео в неделю |
| Submagic | от $16/мес | 94–96% (Deepgram) | premium-шаблоны (Hormozi, Beast, Trendy) | 3 видео/мес с watermark | да | Батч 30+ Shorts/нед, нужна узнаваемая анимация |
| Captions.ai | $12.99/мес (год), $19.99/мес | 92–94% | karaoke даже на free-плане | watermark + 30 мин/мес | нет | Соло-креатор, только karaoke-стиль |
| Opus Clip | $19/мес | 90–93% + перевод на 20+ языков | средние шаблоны, big-word | да + watermark | да | Репурпоз long-form в Shorts + локализация |
| VEED.IO | $18/мес | 91–93% | широкий редактор, не только captions | watermark + 30 мин | да | Полный онлайн-редактор, не только субтитры |
| Welder AI | от 290 ₽/серия | 95%+ (привязка к ElevenLabs таймингам) | RU-first burned-in на выходе | бесплатные кредиты на старте, без watermark на платных тарифах | внутри пайплайна | Серийный AI-канал, без второго проходящего тула |
Есть ловушка с биллингом: Captions.ai и Submagic считают минуту обработки, а не финального видео. 60-секундный ролик при двух перерендерах съест 3 минуты квоты. На небольших объёмах нормально, на 60+ Shorts в месяц переходите на годовой план или batch-инструмент.
Если уже выбираете тариф — посмотрите нашу прозрачную модель оплаты: один счёт за весь пайплайн, без отдельной подписки на captions.
Workflow в Welder — субтитры на выходе автоматически
Ключевая идея воркфлоу Welder: субтитры не делаются отдельным инструментом — они выжигаются на финальной сборке.
Вот пайплайн в режиме voiceover:
- Сценарий → разбивка на блоки по 1–3 секунды (в формате 7-3-30)
- Озвучка ElevenLabs v3 → per-word timings возвращаются вместе с аудио
- Сцены (Veo 3.1 / Sora 2 / Kling 3) рендерятся под длительность каждого блока
- Финальная сборка ffmpeg: видеослой + аудио + drawtext с теми же таймингами
Ключевое отличие от CapCut/Submagic-постпроцесса: вы не транскрибируете аудио заново. Тайминги уже точны до миллисекунды, потому что они пришли из TTS, а не из STT. Нет шансов на «Москва» превратиться в «маска» из-за акустики.
Для канала на 60 Shorts/мес это экономит 8–12 часов рутины и $19–29/мес подписки. И, что важнее, держит pipeline консистентным — все ролики канала используют один шрифт, один цвет, одну safe-zone. Если вы строили story bible под серии, subtitle-стиль — такой же канон, как голос героя.
В режиме cinematic (где идёт Veo 3.1 без TTS Eleven) субтитры пока опциональны — добавляются через постпроцесс. В voiceover — встроены по дефолту.
Есть и побочный плюс: если у вас 60 Shorts/мес, средний рендер захватывает ~3–4 минуты на ролик. Внешний captions-инструмент добавляет к каждому видео отдельный загруз/выгруз ~2 минуты + 30–60 секунд на проверку, что не криво легло. На месячном объёме это 4–6 часов работы руками, которые в Welder-пайплайне не существуют как класс. Для агентств с 6 каналами одновременно — это разница между «нужен джун-монтажёр на $800» и «нет, не нужен».
Что делать с локализацией
Если вы планируете один и тот же AI-Short в RU+EN+ES (а в 2026 это база для роста): берите гайд по дубляжу, но субтитры лучше регенерировать с нуля под каждый язык, а не «переводить» английский в русский.
Причина: тайминги дубляжа другие (русская дорожка на 15–25% длиннее английской), а ключевые слова под алгоритм TikTok-RU и TikTok-EN — разные. Сегмент Submagic + Opus Clip-перевод не сравнится с тем, чтобы пройти TTS дважды и снять тайминги отдельно.
Чек-лист перед публикацией
Прогоните каждый Short перед загрузкой. Это 90 секунд, и ловит 90% брака.
- Sans-serif bold, вес ≥700, кириллица не ломается
- Размер глифа 7–9% от высоты кадра (≥140 px в 1080×1920)
- Контраст соблюдён: белый + 2–4 px обводка или плашка
- Все субтитры в полосе 35–65% по вертикали
- Не более 6 слов в кадре, в karaoke — 1–2
- Тайминги ±100 мс от речи (sound-on тест на наушниках)
- Sound-off тест: ролик читается без звука с первой секунды
- Шрифт совпадает с другими роликами канала (style guide)
- Нет CapCut/Submagic-watermark на финальном MP4
- CTA в финальном кадре читается, не перекрывает кнопку «подписаться»
Если пунктов меньше 8 из 10 — переделывайте. На канале с 60 Shorts/мес одна слабая публикация съедает не только свои просмотры, но и алгоритмический буст на следующие 2–3 видео (TikTok смотрит на «качество автора», а не «качество видео»).
План на 7 дней — внедрить captions без слома пайплайна
Если у вас уже есть работающий канал, не меняйте всё сразу. Этот план сохраняет cadence и поднимает retention поэтапно.
День 1–2. Выберите один шаблон (рекомендую karaoke word-by-word — даёт максимум на сторителлинге). Прогоните 2 свежих видео. Замерьте average view duration в YouTube Studio / TikTok Analytics за 48 часов.
День 3–4. Добавьте highlight ключевого слова (жёлтый = #ffd60a, как у нашего hero-блока). Прогоните ещё 2 видео.
День 5. Запустите A/B-тест по гайду: один Short с karaoke vs один без субтитров вообще. Замерьте через 72 часа: должна быть видна разница в 8–15% по retention.
День 6. Перенесите шрифт и safe-zone в style guide канала. Закрепите в Notion или в шапке вашего Welder-проекта.
День 7. Перерендерите 3 лучших старых видео с новым шаблоном и перезалейте под новыми тайтлами. На TikTok это работает: YouTube — только как пост со сториз/комьюнити, не как повторная заливка.
К концу недели у вас должен быть устойчивый прирост +10–15% к average view duration и +6–9% к completion rate на свежих публикациях. Дальше — масштабируйте до 30+ Shorts/мес.
Запустите серию с burned-in субтитрами
Если вы делаете AI-Shorts в Welder — субтитры уже встроены в voiceover-пайплайн: один шрифт, точные тайминги, safe-zone из коробки. Не нужны CapCut, Submagic, Captions — только сценарий и ниша.
Создайте пробную серию из 5 роликов, прогоните по чек-листу из этой статьи и посмотрите, как отреагирует ваш TikTok через 72 часа. Если интуиция и цифры из статьи верны — average view duration на роликах с burned-in captions будет на 10–20% выше, чем на ваших последних публикациях без них.