Перейти к содержимомуUGC на ИИ для Wildberries и Ozon 2026: цены и пайплайн
WWelder AI

UGC на ИИ для Wildberries и Ozon 2026: цены и пайплайн

Монетизация9 минWelder AI

UGC на ИИ для Wildberries и Ozon 2026: цены и пайплайн

Как собрать видеообложку карточки товара за 90 минут на Veo 3.1 + ElevenLabs, что брать с клиента и где WB режет AI-видео.

Главное за 30 секунд

К маю 2026 видеообложка на карточке товара выросла из «приятного бонуса» в базовую норму: по данным Ozon Seller, карточки с видео конвертят на +30% выше статичных. Wildberries разрешает до 3 роликов на карточку — 50 МБ, MP4/FLV, до 3 минут. Ozon ставит свой стандарт под видеообложку 6–15 секунд.

При этом средняя цена UGC-видео для одной карточки в РФ — 1 500–8 000 ₽, на Kwork стартует от 500 ₽, на Профи.ру тянет до 30 000 ₽ за пакет. Сам ролик собирается за 90 минут на пайплайне Veo 3.1 + ElevenLabs v3 + Welder AI. Маркетплейсы не запрещают использовать ИИ — нужно лишь, чтобы видео не выглядело «ИИ-видео». Ниже — пайплайн, требования, тарифы клиенту и пять причин, по которым модерация WB режет AI-карточку.

Почему карточка без видео — это слитый трафик

В 2026 рекламные алгоритмы WB и Ozon учитывают глубину просмотра карточки как сигнал релевантности. Видео держит пользователя на странице товара в среднем на 18–25 секунд дольше — этого хватает, чтобы система отнесла трафик к «тёплому» и подняла товар в выдаче. Конверсия в добавление в корзину растёт пропорционально.

По данным IAB Digital Video Ad Spend 2026, 86% покупателей цифрового видео уже используют генеративный ИИ для рекламных креативов, а к концу года ИИ будет генерировать примерно 40% всей видеорекламы. Маркетплейсы — следующий пласт после соцсетей: в РФ селлеры массово ищут продакшен карточек, а классическая съёмка с моделью и студией стартует от 15 000 ₽ за один ролик.

ИИ-видео закрывает этот рынок снизу: 1 500–3 000 ₽ за карточку, готово за вечер, без съёмочного дня. На vc.ru и Habr уже выходят лонгриды о связке «нейросеть + карточка WB». Это не «будущее» — это ниша, в которой соло-специалист сейчас может выставить три тарифа и набрать клиентов за неделю.

Что хотят WB и Ozon от видео в 2026

Ключевые требования у обоих маркетплейсов почти сошлись, но детали важны:

ПараметрWildberriesOzon
ФорматыMP4, FLVMP4, MOV
Размердо 50 МБдо 100 МБ
Длинадо 3 минут (рекомендация 20–60 сек)до 60 сек (видеообложка), до 5 мин (карточка)
Соотношение9:16 / 1:1 / 16:99:16 / 1:1
Кол-во роликовдо 3 на карточку1 обложка + до 5 в карусели
Запретыкопирайт-музыка, лица селебов, водяные знакито же + резкие переходы кадров, текст мельче 24 px

Wildberries сам рекомендует 20–60 секунд для одежды и аксессуаров; 1–3 минуты — для техники с инструкцией. Ozon с конца 2025 ввёл отдельный слот под «видеообложку» — короткий ролик 6–15 секунд, который автоматически проигрывается в выдаче и резко поднимает CTR. Если делать видеообложку и карточный ролик одновременно — клиент берёт два продукта в одном чеке.

Маркетплейсы не запрещают AI, но требуют, чтобы товар на видео совпадал с реальным товаром на фото и в описании. То есть: ИИ-генерация фона, моделей, рук, голоса — можно. Полностью выдуманный продукт — нельзя, модерация снимет. Это ключевой момент: пайплайн строится вокруг image-to-video из реальной фотки SKU, а не вокруг чистого text-to-video.

Пайплайн UGC-видео на ИИ за 90 минут

Рабочий пайплайн под одну карточку в мае 2026 выглядит так.

Шаг 1 — фото товара (5 мин). Берёте одну качественную фотографию товара, желательно на белом фоне или в реальной обстановке. Если у клиента нет фото — заказываете предметку у фотографа за 800–1 500 ₽ или снимаете сами на смартфон со светом от окна.

Шаг 2 — image-to-video (10 мин). Через Veo 3.1 image-to-video ($0.15–0.40 за секунду в Vertex AI) разворачиваете фото в 6–8-секундный клип: модель показывает продукт, поворачивает в руках, открывает упаковку. Альтернативы — Kling 3, Hailuo 02, Luma Ray2 — мы их подробно сравнили в обзоре image-to-video моделей. Для серии карточек удобнее Welder AI: он держит один и тот же стиль между роликами без ручной перенастройки промпта.

Шаг 3 — talking-head вставка (15 мин). Если клиенту нужен «разговорный» UGC-формат с лицом — собираете аватар в HeyGen Avatar IV или Synthesia: загружаете скрипт, выбираете славянского пресета, получаете 20-секундный клип с lip-sync. Цена — от $0.07 за секунду. Подробный разбор аватаров есть в нашем сравнении HeyGen vs Synthesia vs D-ID.

Шаг 4 — голос RU (5 мин). Закадровый текст или реплики аватара озвучиваете в ElevenLabs v3 — там 8 готовых русскоязычных голосов и клонирование с 30-секундного образца. Альтернативы: OpenAI Voice (TTS-1-HD), Murf, российский GigaChat-Voice. Для маркетплейсов лучше брать тёплый женский голос 25–35 лет — он стабильно даёт более высокую досмотренность в исследованиях A/B.

Шаг 5 — субтитры и сборка (20 мин). Прогоняете аудио через Submagic или Captions для динамических субтитров. На WB и Ozon субтитры обязательны: 42% пользователей смотрят без звука, потому что листают в общественных местах. Финал собирается в CapCut или Welder — вертикаль 9:16, длина 25–45 секунд, темп 1 кадр-смена каждые 2–3 секунды.

Шаг 6 — экспорт + загрузка (10 мин). MP4, H.264, 1080×1920, битрейт 8–12 Мбит/с, без водяных знаков. Загружаете в кабинет селлера. Модерация WB занимает 24–48 часов, Ozon — обычно до 24 часов. Любые правки — повторная очередь, поэтому пройти QA до загрузки важнее, чем сэкономить пять минут.

Итого: 90 минут чистого времени, $1–3 себестоимости на ИИ-кредитах, без съёмочной группы и павильона.

Инструменты: что для чего

Не все ИИ-инструменты одинаково подходят под маркетплейсы. Где-то Welder выигрывает за счёт RU-первого пайплайна, где-то проигрывает Sora 2 по фотореализму. Честно по состоянию на май 2026:

  • Sora 2 (OpenAI) — лучший фотореализм и физика, встроенный ambient audio, но максимум 25 секунд, нет публичного API (только через ChatGPT Plus за $20/мес), нет нормального русского голоса. Хорошо для разовых «вау-карточек» премиальной косметики или одежды.

  • Veo 3.1 (Google DeepMind) — лучший контроль камеры, image-to-video из одной фотки товара, цена $0.15–0.40 за секунду через Vertex AI. Идёт для массового продакшена 50–200 карточек/мес. Минус: всё API, нужны навыки, оплата зарубежной картой.

  • Welder AI — пайплайн поверх Veo 3 / Veo 2 + ElevenLabs + RU-сценарист. Тариф Creator — 2 075 ₽/мес за 5 000 кредитов (~6 серий, или 30–40 карточек по 6–8 секунд). Берёт промпт «крем для лица, 30 сек UGC от девушки 25 лет» и возвращает готовый ролик. Подробно сравнивали Welder с конкурентами в тесте на 12 промптах. Сильная сторона для маркетплейсов — стабильный стиль между серией карточек.

  • HeyGen Avatar IV / Synthesia — для talking-head формата «девушка рассказывает о товаре в кадре». От $24/мес, lip-sync для RU работает, но иногда «деревянная» мимика. Synthesia дороже, но качество чуть лучше.

  • Fabula AI — российский сервис с пресетами размеров WB/Ozon из коробки. Удобно соло-селлеру без агентства, но качество ниже Veo 3.1 и Welder. Хорош как «второй инструмент» под быстрые правки.

  • GigaChat / Шедеврум — российский стек для текстов и иллюстраций карточки. Видео пока слабое, но текстовку под товар и инфографику — генерят прилично. Бесплатно для частных лиц.

  • Suno v4 / Stable Audio — для саундтрека и звуковых эффектов. Suno с коммерческой подпиской ($10/мес) — единственный безопасный вариант для маркетплейса, иначе модерация снимет за копирайт.

Если клиент не готов платить зарубежной картой и просит «всё в РФ», связка Welder + Fabula + GigaChat закрывает 80% задач. Цены конкурентов и общую экономику AI-видео в РФ мы разбирали отдельно — там есть калькулятор себестоимости.

Сколько брать с клиента: тарифы 2026

На рынке РФ в мае 2026 цена видео-карточки выглядит так:

УровеньКтоЦена за карточкуЧто входит
BottomKwork-фрилансер500–1 500 ₽1 ролик 15–30 сек, без аватара, шаблонный голос
MidСоло-специалист1 500–4 000 ₽image-to-video + RU-голос ElevenLabs + субтитры
Upper-midUGC-агентство 2–4 чел4 000–8 000 ₽сценарий + аватар + 2 версии под A/B-тест
PremiumСтудия с продакшеном12 000–30 000 ₽бренд-гайдлайн, серия 6–10 карточек, отчёт по метрикам

Рекомендуемые тарифы для соло-специалиста или мини-агентства, которое заходит на рынок в 2026:

  • Старт: 2 500 ₽ за карточку при заказе от 3 шт. Себестоимость 200–400 ₽ на ИИ-кредитах, остальное — ваше время и компетенция.
  • Пакет: 12 000 ₽ за 6 карточек (2 000 ₽/шт.). Берут селлеры с линейкой товаров или сезонной коллекцией.
  • Подписка: 25 000 ₽/мес за 12 карточек + 4 правки в месяц. Удобно агентствам, держит cash flow стабильным и убирает торги по каждой задаче.

Главное при продаже клиенту — не «видео на нейросети», а «видеообложка, которая поднимает CTR карточки на 15–30% и сокращает CAC в WB Реклама». Это язык, который продаёт. Точные цифры по эффекту видео и шаблон коммерческого предложения мы собрали в гайде по AI-видео под заказ — там же примеры писем первым клиентам. Тарифы на Welder под продакшен карточек — на странице цен.

Где модерация режет AI-видео и как это обойти

За первые две недели мая 2026 пять основных причин отказов модерации на WB и Ozon:

1. «Кривые руки» моделей. Veo 2 и Kling 1.6 регулярно выдают 6 пальцев или ломаные запястья. Лечится двумя путями: image-to-video поверх реальной фотки руки или жёсткий промпт «natural human hands, 5 fingers, anatomically correct, no extra digits». Veo 3.1 и Sora 2 проблему почти закрыли, но проверять кадры всё равно нужно.

2. Не тот товар в кадре. Если AI-модель показывает крем чуть другой формы, цвета крышки или объёма — модератор WB снимет ролик как «вводящий в заблуждение». Решение: использовать image-to-video из реальной фотки SKU клиента, а не text-to-video. Это правило №1 в продакшене карточек на ИИ.

3. Водяные знаки бесплатных тарифов. Sora через Plus, Welder Free — иногда оставляют логотип в углу. Лечится тарифом без водяного: Welder Starter (825 ₽/мес) уже без, как и Veo через API. Перед загрузкой посмотрите финал в полный экран — мелкий ватермарк глазами заметен не сразу.

4. Копирайт-музыка. Любая «фоновая мелодия» с YouTube или ИИ-музыка без чистых прав — снимут. Используйте Suno v4 с коммерческой подпиской, Stable Audio с лицензией, либо стандартные библиотеки YouTube Audio Library. Лицензию сохраняйте в проектную папку клиента — модерация WB иногда запрашивает.

5. Слишком «ИИ-эстетика». Модератор и алгоритм маркетплейса распознают типичный «плёночный размытый AI-look» и снижают вес карточки. Решение: добавляйте лёгкую дрожь камеры (handheld preset в Veo 3.1), реальные тени, естественные звуки помещения. Sora 2 в этом сильнее всех — у неё ambient audio из коробки. Welder с пресетом «UGC selfie» делает примерно то же на одной кнопке.

Отдельно: если делаете много карточек одному клиенту, чередуйте стили — не лейте 20 одинаково снятых «UGC от девушки на кухне». Алгоритм видит шаблон, считает контент дубликатом и понижает выдачу всех роликов в серии. Лучшая практика — 3 разных сценария на серию из 6 карточек (продукт в руках / на столе / в использовании).

Что делать дальше

Видеообложка на карточке — это не «ещё одна точка касания», а главный сигнал релевантности для алгоритма WB и Ozon в 2026. Не делать её — означает терять 15–30% выручки с того же рекламного бюджета.

Запускаться лучше так:

  1. Возьмите один свой товар или попросите 3–5 фотографий у знакомого селлера.
  2. Соберите первый ролик за 90 минут по пайплайну выше. Welder быстрее всего стартует, потому что не требует промптовых скиллов и оплачивается в рублях.
  3. Сравните CTR карточки до и после публикации — этого хватит, чтобы прийти к следующему клиенту с конкретным числом, а не общими словами.

Заведите аккаунт, прогоните одну карточку и посмотрите, что получается на вашем продукте.

#monetization#ugc#wildberries#ozon#карточка-товара#ии-видео#veo-3#маркетплейсы