Главное за 30 секунд
В июне 2026 у автора AI-Shorts есть четыре серьёзных способа сделать саундтрек: Suno v5.5 ($8/мес на годовой Pro, релиз 26 марта 2026), Udio v2 ($10/мес, единственный с inpainting треков), Stable Audio 2.5 ($11.99/мес, единственный с MIDI-экспортом) и ElevenLabs Music v2 ($5–99/мес или $0.40/мин через API после релиза 27 мая 2026).
Suno выигрывает по вокалу и универсальности — туда идут, если нужны полные песни с куплетом, припевом и осмысленным текстом. Udio лучше держит инструменталку и редактирует кусочки трека хирургически. Stable Audio — выбор под бит, лайнер и фоновую подложку для voiceover. ElevenLabs — самый дешёвый поминутный API, идеальный, когда трек собирается программно внутри пайплайна вроде Welder.
Далее — фактический тест на 9 промптах под 9:16-вертикали для YouTube Shorts, TikTok, Reels и VK Клипов, плюс честный разбор копирайта и монетизации в РФ. Если перед чтением хочется освежить базу тарифов на видео-генерацию, там всё разложено.
Параметры теста
Я прогнал каждый сервис через одинаковый набор задач, типичных для AI-канала на 30–60 секунд. Девять промптов разделил на три категории:
- Лирический трек (3 промпта): «грустная инди-баллада про советский плацкарт», «русский панк-рок припев про дедлайн», «лоу-фай хип-хоп с женским вокалом про осенний Питер».
- Инструментал под voiceover (3 промпта): «синематичный orchestral build-up под историю про античность», «минималистичный piano-loop под научпоп», «эмбиент-подкладка под медитативный визуал».
- Хук-бит для алгоритма (3 промпта): «глитч-биит первой секунды для TikTok-хука», «epic trailer drop для YouTube Shorts с быстрым нарастанием», «boom-bap bassline для VK Клипов».
Каждый трек оценивал по пяти параметрам: качество вокала (если есть), чистота сведения, попадание в промпт, длина без артефактов, готовность к Content ID. Результаты — в финальной таблице.
Suno v5.5 — лидер по вокалу и универсальности
Suno v5.5 вышел 26 марта 2026 и стал дефолтной моделью для платных тиров. Главное изменение по сравнению с v4: вокал больше не звучит роботом. Появилось дыхание, естественное вибрато, осмысленное произношение русского — последнее особенно важно для аудитории welderai.ru.
Компания Suno в феврале 2026 имела оценку $2.45 млрд и ARR $300 млн при ~2 миллионах платных подписчиков, по данным Music Business Worldwide. Это лидер рынка по доле и единственный, кто параллельно с v5.5 запустил полноценный встроенный DAW под названием Suno Studio — туда экспортируются до 12 стемов, чтобы досвести трек руками.
По моим девяти промптам Suno безоговорочно победил в лирической категории. Баллада про плацкарт получилась с осмысленной рифмой, припев панк-рока действительно звучал злым, лоу-фай-вокал не «гулял». В инструментальной категории — третье место: оркестровый build-up получился ватным, не хватало нижних частот. В хук-битах — второе.
Цена в 2026: Suno Pro $8/мес на годовой подписке, $10 помесячно, 2500 кредитов в месяц — это примерно 500 песен и полные коммерческие права. Premier $24–30/мес снимает лимиты и даёт приоритетную генерацию. Базовый тариф для канала, который заливает 60+ Shorts в месяц по гайду про solo-режим.
Важный нюанс: до апреля 2026 Suno генерировал треки, которые могли неосознанно повторять защищённые мелодии. После v5.5 разработчики добавили фильтр и расширили лицензированный датасет — риск Content ID-клейма упал, но не до нуля. Перед заливкой в YouTube стоит проверять через бесплатный сервис вроде Tunebat AI Detect.
Udio v2 — inpainting и UMG-лицензия
Udio в октябре 2025 урегулировал иск Universal Music Group и в 2026 запускает совместную лицензированную платформу с UMG, по данным TLDL. Это означает, что Udio — единственный из тройки, у кого формально нет проблемы с правами на тренировочные данные основных лейблов. Для агентств, которые делают видео заказчикам в фармацевтике, банках или госкорпорациях, это решающий аргумент.
Главная фича — inpainting. Можно выделить любой 2-секундный кусок сгенерированного трека и переписать только его: «замени гитарное соло на саксофон с 0:18 по 0:24» — и Udio регенерирует только этот сегмент, сохраняя весь остальной микс. Ни Suno, ни Stable Audio, ни ElevenLabs так не умеют.
Цена $10/мес — простой и понятный тариф. На моих 9 промптах Udio выиграл инструментальную категорию: piano-loop звучал чище и точнее держал такт, чем у конкурентов; эмбиент-подкладка получилась лучше всех. Вокальные треки — слабее, чем у Suno: русский акцент местами заметен.
Ключевая особенность для AI-Shorts — выход 48 кГц стерео по умолчанию. Это профессиональный стандарт, который выживает после YouTube-перекодирования заметно лучше, чем 44.1 кГц от других сервисов.
Udio пишет музыку, но не дублирует голос актёра. Если задача — локализовать готовый ролик с lip-sync, это совсем другой пайплайн с HeyGen или Synthesia — он живёт в отдельной нише.
Stable Audio 2.5 — sound design и MIDI-экспорт
Stable Audio от Stability AI занимает узкую нишу — sound design, биты, инструментальные подкладки. Тариф $11.99/мес, обучен на лицензированном датасете AudioSparx и партнёров, что даёт самую чистую с юридической точки зрения коммерческую лицензию в тройке.
Главная техническая фича 2026 года — экспорт MIDI. Только Stable Audio в этой категории позволяет вытащить ноты сгенерированного трека и доделать его в Logic Pro, Ableton или FL Studio. Для AI-канала это редко нужно, но если у вас уже есть продакшен — это серьёзный аргумент.
На моих хук-битах Stable Audio выиграл уверенно: глитч-биит первой секунды получился острым, drop для трейлера сработал на тестовых превью алгоритма TikTok как качественный хук. В вокальной категории Stable Audio не участвует вообще — он не умеет петь, что честно прописано в документации.
Куда Stable Audio попадает в пайплайне AI-канала: 5–10-секундные intro-стинги, фоновая подкладка под voiceover (где вокал будет мешать), биты для брэнд-маркера канала. Один общий 5-секундный intro-бит на серию эпизодов резко повышает узнаваемость канала в ленте.
ElevenLabs Music v2 — тёмная лошадка
ElevenLabs выпустил Music v2 27 мая 2026 и сразу срезал цены: API подешевел на 50%, self-serve тарифы — на 40%, по данным блога ElevenLabs. Сейчас это самое дешёвое API в категории: примерно $0.40 за минуту сгенерированной музыки, против $0.80 до апдейта.
Для ручной работы цены такие: ElevenMusic Starter $5/мес, Creator $22/мес, Pro $99/мес, Scale $330/мес. На бесплатном плане iOS-приложения — 7 песен в день. На API — оплата по фактической длительности, что выгодно тем, кто пишет короткие 30-секундные треки.
Ключевая фича Music v2 — inpainting, доведённый до API-уровня. То есть разработчик может встроить регенерацию участка прямо в свой инструмент. Это редкий случай, когда продуктовая команда (например, Welder) может предложить пользователю редактирование саундтрека внутри собственного интерфейса без перехода в Udio.
Качество v2 на моих 9 промптах: близко к Suno v5.5 по вокалу (немного позади на русском), на уровне Udio по инструменталу, слабее Stable Audio по чистым битам. Сильная сторона — стабильность качества от трека к треку и отсутствие "глюков" на длинных композициях.
Главный минус на июнь 2026: API всё ещё в "coming soon" для self-serve. Enterprise-клиенты получают доступ через сейлзов, остальные ждут открытого релиза. По прогнозу — июль 2026.
Сравнительная таблица: цены, лицензии, фичи
| Параметр | Suno v5.5 | Udio v2 | Stable Audio 2.5 | ElevenLabs Music v2 |
|---|---|---|---|---|
| Цена (старт) | $8/мес (Pro годовой) | $10/мес | $11.99/мес | $5/мес (Starter) |
| Цена API | Нет публичного API | Нет публичного API | $0.04/трек (бета) | ~$0.40/мин |
| Лимит треков | ~500/мес на Pro | Безлимит на base | 500/мес | 7/день (free) |
| Вокал на русском | Лучший в категории | Хороший | Не умеет | Хороший |
| Inpainting (правка куска) | Через Studio (стемы) | Да, нативно | Нет | Да, API |
| MIDI-экспорт | Нет | Нет | Да | Нет |
| Стемы | До 12 | До 4 | Нет | До 8 |
| Семпл-рейт | 44.1 кГц | 48 кГц | 44.1 кГц | 48 кГц |
| Коммерческая лицензия | Pro+ | Все платные | Все платные | Creator+ |
| Лицензированный датасет | Частично (v5.5+) | Да (UMG deal 2025) | Да (AudioSparx) | Частично |
| Лучший сценарий | Песни с вокалом | Инструменталки | Биты и sound design | Программный пайплайн |
Цифры — на 2 июня 2026 по публичным источникам и собственному тесту автора.
Что выбрать под задачу AI-Shorts
Если у вас один канал и максимум 60 видео в месяц — берите Suno Pro за $8/мес на годовой подписке. 500 треков покрывают любую разумную нагрузку, вокал на русском лучший в индустрии, есть DAW для досведения. Это дефолт.
Если вы агентство и делаете видео для брендов в зарегулированных индустриях (фарма, банки, страховка) — Udio. UMG-лицензия 2025 года и чистый датасет дают возможность подписывать договоры с заказчиками без лишних оговорок про "AI training data risks".
Если вам нужны только короткие хуки, стинги и фоновые подложки, а вокала у вас нет вообще (классический voiceover-канал) — Stable Audio 2.5. Дешевле выйдет, чем Suno, и MIDI-экспорт пригодится для брэнд-маркера канала.
Если вы строите свой продукт поверх API (например, 24/7-стрим без новых видео) — ElevenLabs Music v2 API. $0.40 за минуту — самая низкая цена на рынке, плюс inpainting на API-уровне.
Реалистичный сетап для большинства русскоязычных AI-каналов: Suno Pro как основной генератор + Stable Audio в free-тире для intro-стингов. Суммарная стоимость — $8/мес, или около 700 ₽ по курсу июня 2026.
Копирайт, Content ID и монетизация в РФ
Хорошая новость: на июнь 2026 AI-генерированная музыка обычно не попадает в Content ID-базу YouTube, поэтому свежие треки от Suno, Udio и Stable Audio проходят без клейма. Это подтверждается данными Miraflow: платформам важно, что у вас есть права на использование, а не кто автор — человек или модель.
Плохая новость: каждый сервис требует свой тариф для коммерческого использования. На бесплатных планах Suno и ElevenLabs права остаются у платформы — это значит, что трек технически можно использовать, но не для монетизации канала. Перед заливкой проверьте, что подписаны на платный тариф минимум $5–10/мес.
Ещё одна тонкость 2026 года: YouTube расширил инструмент Replace Song — теперь, если на ваш ролик пришёл Content ID-клейм, можно сгенерировать royalty-free инструменталку прямо в YouTube Studio и заменить трек без перезалива и без потери watch history. Это страховка на случай, если AI-музыка всё же случайно процитирует защищённую мелодию.
По данным Outlierkit, оригинальный аудио-трек на Shorts даёт на 20–40% больше дохода с просмотра, чем лицензированная музыка из каталога TikTok/YouTube. Причина: с лицензированной музыки платформа удерживает долю на правообладателя, прежде чем посчитать ваши 45% от пула.
Для авторов из РФ остаётся ограничение, не связанное с музыкой: монетизация YPP не выводится без AdSense через третью страну (Казахстан, Армения, Сербия, Грузия), а TikTok Creativity Program официально недоступна. Заработать в рублях напрямую — только через брендовые партнёрства и партнёрки, где 1000 просмотров стоит 150–400 ₽ в зависимости от ниши.
Что дальше — связка с Welder
Музыка — это последний слой сборки AI-Shorts. До него у вас уже должен быть готов сценарий, voiceover, картинка/видео, субтитры с правильным ритмом и обложка. Музыкальный трек — это не первая задача, а финишная.
Welder сейчас не генерирует музыку внутри пайплайна — мы намеренно вынесли это во внешние инструменты, чтобы вы выбирали под свою задачу. Внутри Welder: сценарий через нашего LLM-сценариста, голос ElevenLabs v3 (платно) или OpenAI Voice (по умолчанию), картинка Veo 3.1 / Veo 2 / Sora 2 в зависимости от тарифа, сборка и автосубтитры. Музыкальный трек подкладываете сами в финальный mp4.
Если вы только начинаете и не хотите разбираться сразу с двумя сервисами — стартуйте без музыки. Голос плюс правильный хук первой секунды уже даёт работающее видео. Музыку добавите со второго месяца, когда поймёте свою нишу и звук канала.
Действие на сегодня: откройте Welder, соберите первую серию из 3 коротких видео без музыки, посмотрите на retention в YouTube Studio. Если retention выше 50% — переходите на Suno Pro и добавляйте intro-стинг от Stable Audio. Так стоимость музыки на одно видео упадёт ниже 2 ₽.