Главное за 30 секунд
В мае 2026 у автора русского AI-канала есть пять серьёзных TTS-движков: ElevenLabs v3 и v2 Multilingual (≈$0.27 за минуту русской речи через API), OpenAI TTS-1-HD ($30 за 1M символов, около $0.027 за минуту, но с проблемами на букве «г»), Murf AI (от $19/мес за 200+ голосов на 20+ языках), PlayHT (Unlimited-тариф $29/мес лимитированной акцией, 900+ голосов на 142 языках) и Resemble AI ($0.006 за секунду pay-as-you-go, 149+ языков на новом Rapid Voice Clone 2.0).
Для русского языка качество ранжируется так: ElevenLabs v2 Multilingual — самый стабильный workhorse без акцентного дрейфа, ElevenLabs v3 — лучшие эмоции, но меньше контроля. PlayHT — близко второе место по натуральности, выигрывает по объёму при batch-продакшне. OpenAI TTS дёшев и быстр, но регулярно ошибается на ударениях, числах и аббревиатурах. Murf даёт корпоративную стабильность ценой выразительности. Resemble — единственный из пятёрки с pay-as-you-go и тонким контролем эмоций через API.
Ниже — методика, цены, лимиты, и что мы выбрали для Welder.
Что считал и на чём тестировал
Методика — 12 промптов общей длиной ~9 000 символов: 4 нарратива в жанрах True Crime, мифология, дикая природа, монетизация; в каждом по три кадра. Сценарии написаны Claude 4.7 Sonnet с заготовкой под Veo 3.2. На каждый сервис — один и тот же текст, один и тот же диктор-«пресет» (женский, серьёзный, нейтральный темп), без ручной правки.
Замеры:
- стоимость минуты при средней плотности ~900 символов/мин;
- ошибки на 1 000 символов (ударение, неверный падеж, замена слова, мисспелл аббревиатур);
- completion rate в Shorts по 8 опубликованным роликам на тестовом канале — этот же сигнал ловят все площадки. Подробнее про метрику читайте в материале про TikTok SEO для AI-Shorts и звук на -14 LUFS;
- лимиты по коммерческому использованию и voice cloning.
Источники цен брали напрямую с сайтов продуктов и из агрегаторов на май 2026 — там, где данные расходились, отдавал приоритет официальной странице.
Сравнительная таблица: пять движков по ключевым параметрам
| Сервис | Стартовая цена | Стоимость минуты RU | Voice cloning | Поддержка RU | Лучшее применение |
|---|---|---|---|---|---|
| ElevenLabs v2 Multilingual | $5/мес Starter, $22/мес Creator | ≈$0.27 (API, Creator+) | От Creator ($22) — Instant; Pro ($99) — Professional | Native в 29 языках Multilingual v2 | Workhorse для серий, ровный голос |
| ElevenLabs v3 | те же планы | сопоставимо v2 | Те же тарифы | 70+ языков, включая RU | Performance-driven контент, эмоции |
| OpenAI TTS-1-HD | от $0 (pay-as-you-go) | ≈$0.027 ($30/1M chars × 900) | Нет | Secondary, проблемы с «г» и числами | Дешёвые черновики, пилот |
| Murf AI | $19/мес (Creator annual) | ≈$0.10 при 24 ч/год | Только Enterprise (custom) | RU в 20+ языках | Корпоративные пояснения, e-learning |
| PlayHT Unlimited | $29/мес (промо) | $0 на безлимите | 10 Instant clones на Creator | 142 языка, RU включён | Batch-продакшн ≥20 роликов/мес |
| Resemble AI | от $0.006/сек | ≈$0.36/мин | Rapid Voice Clone 2.0 от 20 сек аудио | 149+ языков на новой версии | Эмоциональный контроль, API |
Источники: ElevenLabs API Pricing, OpenAI Pricing, Murf Pricing, Typecast: Comparing AI Voice Cloning Services 2026.
ElevenLabs v3 и v2 Multilingual — рабочая лошадка рынка
Два flagship-движка в одной экосистеме — v2 Multilingual и v3. Для русского языка v2 Multilingual в мае 2026 остаётся выбором по умолчанию: голос звучит ровнее, реже срывается на акцент, лучше держит длинные нарративы 60–90 секунд без интонационного дрейфа. v3 моложе, его 70+ языков впечатляют, и в performance-сценах он даёт эмоциональный диапазон, которого нет ни у кого, — но он же чаще сбивается на ударениях и хуже отзывается на тонкую настройку style/stability.
Цены: тарифы Starter ($5/мес), Creator ($22/мес), Pro ($99/мес), Scale ($330/мес) — все с коммерческими правами. По данным BIGVU на 2026 год, минута русской речи через API на Creator-плане ≈ $0.27 — это базовая точка отсчёта.
Два нюанса для AI-каналов. Первый — voice cloning: Instant Clone доступен от $22 Creator, Professional Clone от $99 Pro (>30 минут чистого исходника); подробный workflow клонирования мы разобрали в гайде по голосовому клону за 15 минут. Второй — модель Flash/Turbo v2.5: на ней символы списываются по 0.5–1 кредита и стриминг отдаёт первый звук за 75 мс. Для real-time чатов это магия, для Shorts — overkill, качество ниже Multilingual v2.
OpenAI Voice — дешёво, быстро, но English-first
Линейка OpenAI на 2026 год — три модели: TTS-1 (быстрая, обычная), TTS-1-HD ($30 за 1M символов — примерно $0.027 за минуту русской речи), gpt-realtime для голосовых агентов с биллингом $32/1M input и $64/1M output audio tokens. Все три знают русский, по официальной документации — список 50+ языков.
Главная проблема — голоса остаются English-first. По обсуждениям в OpenAI Developer Community на 2026 год, модель путает пронунсиацию буквы «г» (использует русское произношение там, где украинский или белорусский требуют другого), сбивается на числах, фамилиях и аббревиатурах, не поддерживает SSML phoneme override — пофиксить ударение через теги невозможно. На длинных нарративах больше 30–40 секунд это превращается в десяток поправок и три-четыре переснятых строки.
Когда стоит выбирать: пилот канала, MVP-озвучка для теста гипотезы, голос-агенты с короткими репликами через gpt-realtime API. Для серийного контента русского рынка — нет.
Murf AI — корпоративный TTS с русским в обвязке
Murf занимает другую нишу: B2B-озвучка для e-learning, корпоративных видео и пояснений к продуктам. Тарифы 2026: Creator $19/мес (annual) или $29/мес (monthly) с 24 часами генерации в год, Business $66/мес annual за 96 часов, Enterprise — кастом. Бесплатный план 10 минут в total без коммерческих прав и без скачивания.
Для русского в каталоге около 200+ голосов на 20+ языках с native-озвучкой по русскому. Качество звука ровное, но эмоций меньше, чем у ElevenLabs v3 или PlayHT. Voice cloning доступен только на Enterprise — для соло-автора это блокер: ни на Creator, ни на Business клон не получить, придётся идти к ElevenLabs или PlayHT.
Где Murf реально хорош: озвучка длинных пояснительных видео, серии корпоративного контента, IVR и e-learning, где нужны 30+ минут спокойного нарратива без эмоциональных пиков. Для коротких роликов с дофамином в первой секунде Murf проиграет — нужна более «живая» интонация.
PlayHT — 142 языка и Unlimited-промо
PlayHT в 2026 году серьёзно отгрыз долю у ElevenLabs за счёт двух вещей: каталог в 900+ голосов на 142 языках и нестандартный Unlimited-тариф $29/мес (annual, лимитированная промо-цена). Free даёт 12 500 символов/мес и один Instant Clone; Creator — $31.20/мес (annual) с 3M символов в год и десятью Instant Clones; Enterprise — кастом.
Для русского качество близко к ElevenLabs v2 Multilingual, иногда лучше на нарративных интонациях, иногда хуже на цифрах. Главный аргумент — экономика batch-продакшна: если вы делаете 30+ Shorts в месяц (а это та цифра, к которой стремится любой серьёзный AI-канал по нашим расчётам в материале Batch-продакшн AI-канала), Unlimited PlayHT отбивается уже на 10-м ролике против Creator-плана ElevenLabs.
Cross-language voice cloning из 30 секунд аудио — единственная фича, которая позволяет переозвучить английский кейс русским голосом и наоборот без перезаписи. Для каналов на двух языках это экономит часы.
Resemble AI — pay-as-you-go и контроль эмоций
Resemble — единственный из пятёрки с честным pay-as-you-go: $0.006 за секунду генерации, без месячных платежей. Минута русской речи — $0.36, дороже ElevenLabs, но без подписочного риска. На API даётся самый тонкий контроль параметров: эмоциональный тюнинг, скорость, питч, паузы — близко к Suno v4 и Stable Audio для музыки, только для голоса; обзор музыкальных движков делали в материале про музыку для AI-Shorts.
Главная фича 2026 — Rapid Voice Clone 2.0: качественный клон из 20 секунд исходника, 149+ языков на выходе. Это та же лига, что и ElevenLabs Professional Clone, но порог входа в 30 раз ниже по объёму данных.
Когда выбирать Resemble: продакт, где нужен API с эмоциональным контролем, низкий объём (до 5 часов в месяц), и где важно тонкое управление просодией. Для серийного канала с однотипными роликами — оверкилл.
Как считать стоимость на канал
Закроем экономикой. Возьмём типичный AI-канал на 30 Shorts/мес по 45 секунд → ~22 минут озвучки → ~20 000 символов в месяц.
| Сервис | Месяц | Год | Что входит |
|---|---|---|---|
| ElevenLabs Creator | $22 | $264 | 100 000 символов, Instant Clone, коммерческие права |
| OpenAI TTS-1-HD | ~$0.60 | ~$7.20 | Pay-as-you-go, без клона, без подписки |
| Murf Creator (annual) | $19 | $228 | 24 ч/год — впритык, без клона |
| PlayHT Unlimited | $29 | $348 | Безлимит символов, 10 Instant Clones |
| Resemble pay-as-you-go | ~$7.92 | ~$95 | 22 мин × $0.36, эмоциональный контроль |
Дешевле всех на бумаге — OpenAI, но качество для русского нарратива не дотягивает. Лучший баланс «цена/качество» — ElevenLabs Creator при <90 000 символов в мес; PlayHT Unlimited выигрывает с 130 000+ символов (это уже ~150 Shorts в месяц — масштабы агентства).
Welder при пакетной цене ₽290 за серию из 5–7 роликов включает озвучку ElevenLabs Multilingual в стоимость и не требует от автора управлять API-кредитами; полный прайс — на странице тарифов.
Что выбрать под ваш сценарий — и сделать первое видео
Сухая рекомендация, без воды:
- Соло-автор канала на 10–30 Shorts/мес — ElevenLabs Creator ($22) с Instant Clone своего голоса. Лучший RU-звук, предсказуемые расходы, ровная просодия.
- Агентство с 3+ каналами и 100+ роликов в месяц — PlayHT Unlimited ($29 промо) для основного объёма + ElevenLabs Pro для премиум-сегмента.
- Корпоративный e-learning, объясняющее видео >5 минут — Murf Business ($66 annual) — спокойный нарратив, native RU, выгрузка в нужных форматах.
- MVP-канал, проверка гипотезы за неделю — OpenAI TTS-1-HD pay-as-you-go: $5 хватит на 200+ минут проб.
- Продакт с API-интеграцией и контролем эмоций — Resemble AI, особенно если нужен voice cloning из 20 секунд.
Если не хотите выбирать движок и считать кредиты — Welder делает это за вас: загружаете тему, выбираете нишу, получаете 5–7 готовых вертикальных роликов с озвучкой ElevenLabs, обложками и подписями. Цена начинается от ₽290 за серию.