12 March 2026

Зачем селлеру на маркетплейсах собственное хранилище данных

Presurgery_admin.png

У вас есть личный кабинет на Ozon, на Wildberries, возможно на Яндекс.Маркете. Вы используете MPStats, чтобы смотреть конкурентов. У вас есть 1С, куда бухгалтерия вносит себестоимость и расходы. Возможно, есть CRM или Google-таблица, куда менеджеры записывают контакты поставщиков и условия. Возможно, есть Excel-файл с план-фактом, который ведёт финансист раз в неделю. Всё это — разрозненные источники данных, каждый из которых показывает кусочек картины. Проблема не в том, что данных мало. Проблема в том, что они лежат в разных местах, обновляются в разное время и никогда не совпадают друг с другом.

Этот документ объясняет, как мы собираем все эти данные в одном месте, зачем это нужно и что это даёт на практике. Мы — Koveh Studio, дата-инженерная студия в Австрии и Москве. Мы строим хранилища данных (DWH), аналитику и AI-решения для селлеров на маркетплейсах. Мы уже построили DWH для PrimeKraft (Черноголовка, спортивное питание), и мы хотим, чтобы вы стали нашим следующим партнёром. Ниже — подробное объяснение того, что мы делаем, как это работает и почему это меняет бизнес.

Ваши данные сегодня: знакомая ситуация

Представьте обычный понедельник. Категорийный менеджер открывает личный кабинет Ozon, выгружает данные о продажах за выходные в Excel. Потом открывает Wildberries, делает то же самое. Потом пытается свести эти данные в одну таблицу, чтобы понять общую картину. На это уходит два-три часа. Цифры за выходные, которые он свёл — уже устарели, потому что пока он сводил, прошло ещё полдня.

Финансист в это время открывает 1С, сверяет себестоимость, вносит данные о логистике, пытается посчитать реальную маржу по каждому товару. Но в 1С нет данных о комиссии Ozon, нет данных о рекламных расходах на Wildberries, нет данных о возвратах за последнюю неделю. Чтобы получить полную картину, ему нужно запросить данные у категорийного менеджера, который ещё не закончил свою сводку. В итоге реальная unit-экономика по товару считается раз в месяц, а решения о ценах и закупках принимаются на ощущениях.

Маркетолог открывает MPStats, смотрит долю рынка и позиции конкурентов. Но MPStats — это отдельная система, она не связана с вашими продажами. Маркетолог видит, что конкурент снизил цену, но не может за минуту оценить, как это повлияет на вашу маржу. Чтобы это понять, нужно опять открыть Excel, найти себестоимость, вычесть комиссию, логистику, рекламу. К тому моменту, когда расчёт готов, конкурент уже поднял цену обратно.

Руководитель бизнеса хочет видеть простую вещь: сколько мы зарабатываем на каждом товаре, на каждом маркетплейсе, за каждый день. Он спрашивает менеджера — и получает ответ через два дня. Или получает цифру, в которую не уверен сам менеджер, потому что формулы в Excel запутались, а данные за последний день ещё не обновились.

Если вы узнали свою ситуацию, вы не одиноки. Так работает подавляющее большинство селлеров — от небольших компаний с оборотом в миллион рублей до крупных с оборотами в сотни миллионов. Проблема не в людях. Проблема в инструментах. Личные кабинеты маркетплейсов не предназначены для глубокой аналитики. MPStats показывает рынок, но не вашу внутреннюю экономику. 1С хранит бухгалтерию, но не данные маркетплейсов. Excel всё ещё самый популярный аналитический инструмент в России — и одновременно самый хрупкий: одна ошибка в формуле, и весь отчёт некорректен.

Что такое Data Warehouse и как оно решает проблему

Data Warehouse — это хранилище данных. Звучит скучно. Но на практике это одна из тех вещей, которые меняют бизнес необратимо: попробовав, вы не захотите вернуться к старому формату.

Суть простая. Все данные из всех источников собираются автоматически в одно место. Из Ozon — заказы, продажи, возвраты, финансовые отчёты, рекламные кампании, остатки на складах, отзывы покупателей. Из Wildberries — то же самое. Из MPStats — данные о конкурентах, ценах, доле рынка, трафике карточек. Из 1С — себестоимость, расходы, поставщики. Из рекламных кабинетов — затраты на рекламу по каждому товару. Всё это загружается на ваш сервер каждый день (или каждый час — зависит от того, насколько быстро вам нужны данные).

Данные не просто складываются в кучу. Они проходят через обработку: чистятся от дубликатов, приводятся к единому формату, объединяются между собой. Продажи из Ozon объединяются с себестоимостью из 1С и расходами на рекламу. В результате получается готовая таблица, в которой по каждому товару, каждому дню, каждому маркетплейсу видна реальная маржа. Не та маржа, которую показывает Ozon (там не учитывается себестоимость и половина расходов), а настоящая — с учётом всех компонентов.

Поверх этих данных строятся дашборды — интерактивные отчёты с графиками и фильтрами. Вы открываете дашборд утром и видите всё: выручка за вчера, сравнение с прошлой неделей, маржинальность каждого SKU, остатки на складах, динамика возвратов, позиции конкурентов. Без ручного труда. Без Excel. Без двухдневного ожидания.

Что это значит для вашего бизнеса конкретно

Если вы — компания вроде FitnesSHOCK (спортивное питание и косметика), у вас десятки или сотни SKU, которые продаются на нескольких маркетплейсах. Каждый товар имеет свою себестоимость, свою комиссию, свою логистику, свои рекламные расходы. Чтобы понять, какой товар реально приносит прибыль, нужно свести данные из трёх-четырёх систем. В Data Warehouse это происходит автоматически. Вы открываете дашборд и видите: «Протеиновый батончик X — маржа 18% на Ozon, маржа 12% на Wildberries, возвраты 3%, реклама съедает 5% выручки». Решения принимаются за минуту, а не за два дня.

Если вы — компания вроде LOVULAR (подгузники, детская гигиена), вам критически важна оборачиваемость товара на складах. Подгузники имеют срок годности, они занимают много места, и неликвид — это прямые убытки. Data Warehouse показывает оборачиваемость каждого SKU на каждом складе. Вы видите, что на складе в Казани остатков на три месяца, а на складе в Москве — на неделю. Перераспределяете товар — экономите на хранении и избегаете потерь.

Если вы — компания вроде Barinoff (сиропы, соусы, производство в Орловской области), у вас есть производство с планированием выпуска и дистрибьюция на маркетплейсах. Вам нужно видеть не только продажи, но и прогноз спроса: сколько каждого вкуса сиропа нужно произвести в следующем месяце. Data Warehouse собирает исторические данные о продажах и подключает модель прогнозирования. Вы видите: «Сироп Манго — рост 15% месяц к месяцу, прогноз на апрель — 3 200 бутылок». Планируете производство по данным, а не по ощущениям.

Если вы — компания вроде REDMOND или Scarlett (бытовая техника), у вас сотни товаров в десятках категорий. Личный кабинет маркетплейса показывает продажи в штуках и рублях, но не показывает, какие товары каннибализируют друг друга, какие конкуренты атакуют ваши позиции и где вы теряете маржу. Data Warehouse объединяет ваши данные с данными MPStats и показывает полную картину: доля рынка по категориям, ценовое позиционирование относительно конкурентов, корреляция между рекламными расходами и продажами.

Если вы — компания вроде Illy или PRO PLAN (FMCG-бренд), вам важно понимать эффективность каждого канала дистрибуции. Data Warehouse объединяет данные из всех каналов (маркетплейсы, собственный интернет-магазин, дистрибьюторы) и показывает, где каждый рубль приносит максимальную отдачу.

Как это работает технически — простыми словами

Вам не нужно разбираться в технических деталях. Но полезно понимать общую схему, чтобы представлять, что происходит за кулисами.

Есть программа Apache Airflow — это планировщик задач. Каждый день в три часа ночи она запускает сборщиков данных. Один сборщик обращается к Ozon API и скачивает все заказы, продажи и возвраты за вчерашний день. Другой — к Wildberries. Третий — к MPStats. Четвёртый — забирает данные из 1С (через файловую выгрузку или API). Все эти данные сохраняются в сыром виде на сервере.

Потом включается обработка. Программа берёт сырые данные, чистит их (удаляет дубликаты, исправляет форматы), объединяет между собой и загружает в аналитическую базу данных. Мы используем ClickHouse — это база данных, которую создал Яндекс специально для аналитики. Она работает в десятки раз быстрее обычных баз на аналитических запросах: там, где PostgreSQL считает минуту, ClickHouse считает 5-10 секунд.

Поверх ClickHouse подключается Yandex DataLens — инструмент для визуализации данных. Вы открываете дашборд в браузере и видите графики, таблицы, фильтры. Всё обновляется автоматически. Никакого ручного труда.

Дополнительно мы настраиваем Telegram-бот, который каждое утро присылает вам краткую сводку: выручка за вчера, топ товаров, аномалии (резкое падение продаж, массовые возвраты). Через бот можно запросить данные: «маржинальность SKU-12345 за март» — и получить ответ за секунду. Можем добавить бота в Макс, автосообщение на очту, или интерактивный вебсайт.

Вся система работает в Docker-контейнерах на сервере. Сервер может быть вашим, облачным (Яндекс.Облако), или нашим (на этапе разработки). Все данные принадлежат вам. Код написан и задокументирован, хранится в Git. Если захотите сменить подрядчика — новый инженер продолжит работу с первого дня.

Что вы получаете — пошагово

Первое и главное — единый источник правды. Все данные из всех источников собраны в одном месте. Когда менеджер говорит «маржа 20%», а финансист говорит «маржа 12%» — это потому что они считают по-разному и берут данные из разных источников. Data Warehouse устраняет эту проблему: формулы зафиксированы, данные одинаковые для всех. Маржа — значит маржа, с учётом себестоимости, логистики, комиссии, рекламы, возвратов и хранения.

Второе — актуальность. Данные обновляются каждый день автоматически. Вы не ждёте два дня, пока менеджер сведёт таблицу. Утром открываете дашборд — данные за вчера уже там. Если нужно быстрее — можно настроить обновление каждый час, каждые 15 минут или чаще. Если позволяет API, то можно собирать данные в реальном времени при помощи Debezium и Kafka.

Третье — глубина. Личный кабинет маркетплейса показывает продажи и заказы. Data Warehouse показывает unit-экономику по каждому SKU, по каждому складу, по каждому дню. Вы видите не просто «продано 100 штук», а «продано 100 штук, себестоимость 50 000 рублей, логистика 8 000, комиссия 12 000, реклама 5 000, возвраты 3 000, чистая прибыль 22 000, маржа 16%». По каждому товару. Каждый день. Автоматически.

Четвёртое — конкурентный анализ. Через MPStats мы загружаем данные о ваших конкурентах: их цены, продажи (оценочные), доля рынка, трафик карточек. Всё это показывается в том же дашборде, рядом с вашими данными. Вы видите: «Конкурент X снизил цену на 15%, его продажи выросли на 30%, наша доля упала с 8% до 6%». Это не абстрактная аналитика — это основа для конкретного решения.

Пятое — прогнозирование. Когда у вас есть шесть месяцев исторических данных в структурированном виде, можно подключить модель прогнозирования спроса. Модель анализирует сезонность, тренды, влияние цен и рекламы — и прогнозирует продажи по каждому SKU на каждый день. Это помогает планировать закупки и избегать ситуаций, когда товар закончился на складе или наоборот — лежит без движения.

Шестое — работа с AI. Когда данные лежат в структурированной базе, к ним можно подключить AI-инструменты. Cursor AI выполняет SQL-запросы по вашей просьбе: вы пишете «покажи товары с падающей маржой за последний месяц» — и получаете таблицу. YandexGPT или ChatGPT анализируют ваши данные и генерируют инсайты. Это невозможно, пока данные лежат в Excel на рабочем столе менеджера.

MPStats — хороший инструмент, но не заменяет DWH

MPStats — это отличный инструмент. Мы сами им пользуемся и рекомендуем клиентам. Но MPStats решает одну задачу: показывает рынок. Он не знает вашу себестоимость. Он не знает, сколько вы тратите на рекламу. Он не знает, какие условия у вашего поставщика. Он не может посчитать вашу реальную маржу.

Data Warehouse не заменяет MPStats — он дополняет его. Мы загружаем данные из MPStats в ваше хранилище и объединяем с вашими внутренними данными. В результате вы видите не просто «конкурент продаёт 500 штук в день», а «конкурент продаёт 500 штук в день по цене 1 200 рублей, наша себестоимость 800 рублей, если мы снизим цену до 1 100, наша маржа составит 11%, а при текущих объёмах это приносит X рублей в месяц». Это качественно другой уровень аналитики.

То же самое с 1С. 1С — великолепная бухгалтерская система, но она не предназначена для аналитики маркетплейсов. Она не знает, что такое SKU на Ozon, не видит рекламные кампании, не считает unit-экономику. Data Warehouse берёт данные из 1С (себестоимость, закупочные цены, расходы) и объединяет с данными маркетплейсов. Ваш бухгалтер продолжает работать в 1С как обычно, но теперь его данные автоматически попадают в общую аналитику.

Как мы работаем

Процесс начинается с разговора. Мы созваниваемся, вы рассказываете, как устроен ваш бизнес: какие маркетплейсы, сколько товаров, какие данные есть, какие решения нужно принимать. Мы задаём вопросы: что вы считаете сейчас, чего не хватает, какие отчёты нужны каждый день, кто будет пользоваться системой. Этот разговор бесплатный.

После разговора мы готовим предложение. Не абстрактное «DWH за полмиллиона», а конкретный список работ с часами и стоимостью: аудит — столько часов, настройка инфраструктуры — столько, подключение Ozon API — столько, создание дашборда — столько. Вы видите, за что платите. Подробнее в прайс-листе.

Работа начинается с настройки инфраструктуры: поднимаем сервер, устанавливаем все необходимые программы. Это два-четыре дня. Потом подключаем первый источник данных — обычно основной маркетплейс. Через неделю вы уже видите живые данные в дашборде. Дальше каждую неделю добавляем новые источники и витрины. Через месяц — пилотная версия с основными метриками. Через три-четыре месяца — полная система с аналитикой и прогнозированием.

Мы показываем результат каждую неделю. Не слайды и обещания, а живую систему: «Вот новый дашборд, вот подключили 1С, вот данные за вчера». Если что-то не так — мы узнаём об этом сразу, а не через три месяца.

Сколько это стоит

Час работы — 4 000 рублей (45 евро). Все цены прозрачны и привязаны к конкретным работам.

Минимальный проект для селлера с двумя маркетплейсами: подключение Ozon и Wildberries, базовая unit-экономика, один дашборд, Telegram-бот с ежедневным отчётом выйдет в 500–800 тыс. рублей и проект займет два месяца. Этого достаточно, чтобы увидеть реальную картину бизнеса и начать принимать решения по данным.

Средний проект: всё вышеперечисленное плюс данные из 1С, MPStats, рекламные кабинеты, три дашборда для разных отделов, расширенная unit-экономика, конкурентный анализ, автоматический деплой выйдет в 1–1,5 млн. рублей и проект займет три-шесть месяцев.

Полный проект с прогнозированием, динамическим ценообразованием, анализом отзывов через AI, обучением команды выйдет в 1,5–2 млн. рублей и проект займет шесть-восемь месяцев.

Поддержка после запуска: 4 000 рублей в час. Типичная поддержка — четыре-восемь часов в месяц (16–32 000 рублей). Это покрывает обновление API-сборщиков при изменениях маркетплейсов, добавление новых метрик и дашбордов, консультации.

Сервер на этапе разработки: 1 000 рублей в месяц (наш сервер). Яндекс.Облако: от 10 000 рублей в месяц (со скидкой 15–25% как партнёры Яндекса).

Мы не берём плату «за DWH». Мы берём плату за конкретные часы конкретной работы. Если подключение Ozon API занимает полтора часа — вы платите 6 000 рублей за полтора часа, а не 50 000 за «интеграцию». Так как мы используем стандартные технологии, вы можете всегда нанять штатного инженера для поддержки и развития системы.

Почему 500–800 тыс. рублей — это не дорого

Посчитаем. Один аналитик на зарплате стоит 100–200 000 рублей в месяц. При этом большую часть времени он тратит на ручной сбор данных из личных кабинетов, сведение в Excel, проверку формул. Data Warehouse делает эту работу автоматически. Аналитик вместо сбора данных начинает анализировать данные — то, для чего его нанимали.

Посчитаем ещё. Если вы неправильно оцениваете маржинальность товара на 3% из-за того, что не учитываете все расходы, и у вас оборот 10 миллионов рублей в месяц — вы теряете 300 000 рублей в месяц. Каждый месяц. Простой Data Warehouse стоит 500–800 тыс. рублей один раз и показывает реальную маржу с первой недели.

Посчитаем ещё. Если у вас товар лежит на складе без движения, вы платите за хранение. На Wildberries стоимость хранения растёт с каждой неделей. Если Data Warehouse показал, что товар X на складе Y не продаётся — вы переместили его на другой склад или снизили цену. Экономия может составить десятки тысяч рублей в месяц.

Data Warehouse окупается за 4-12 месяцев. Дальше — чистая экономия. Все формулы, алгоритмы будут эволюционировать вместе с вашим бизнесом и каждая инвестиция в Data Warehouse, дата-аналитику и AI принесёт всё больше пользы и конкурентного преимущества.

Примеры дашбордов, которые мы строим

Дашборд руководителя: общая выручка по всем маркетплейсам, количество заказов, средний чек, маржинальность, возвраты. Всё в динамике по дням, с фильтрами по маркетплейсу и категории. Открывается утром, читается за минуту.

Дашборд категорийного менеджера: unit-экономика по каждому SKU. Маржинальность с разбивкой на все компоненты: закупка, логистика, комиссия, реклама, возвраты, хранение. Фильтр по маркетплейсу, складу, периоду. Можно увидеть, какие товары убыточны, и принять решение: снять с продажи, изменить цену, перераспределить по складам.

Дашборд конкурентного анализа: данные из MPStats. Доля рынка в категории, сравнение цен с конкурентами, динамика продаж конкурентов. Можно выбрать конкретного конкурента и сравнить по каждому SKU.

Дашборд складов: остатки по каждому складу, оборачиваемость в днях, рекомендации по перераспределению. Показывает, где товар «зависает», а где заканчивается.

Дашборд рекламы: расходы на рекламу по каждому товару, ROI каждой кампании, конверсия из показа в заказ. Показывает, какие товары имеет смысл рекламировать, а какие — нет.

Все дашборды подключены к ClickHouse напрямую. Когда вы меняете фильтр, DataLens выполняет запрос и обновляет данные за секунду.

Отказоустойчивость: что если Wildberries ляжет

Внешние API ненадёжны. Wildberries может упасть на несколько часов. Ozon может изменить формат ответа. MPStats может вернуть пустые данные. Наши пайплайны написаны с учётом этих сценариев. Если API не отвечает, система повторяет запрос через пять минут. Максимум три попытки. Если не удалось — система отправляет уведомление в Telegram-бот и продолжает работу с остальными источниками.

Когда Wildberries восстанавливается, система автоматически загружает пропущенные данные (Backfilling). Вы об этом даже не узнаете, если не заглянете в логи. Все пропуски заполняются, данные не теряются.

Кроме того, все сырые данные сохраняются в неизменном виде. Если через полгода вам понадобится метрика, которую мы изначально не загружали — мы извлечём её из сырых данных без повторного обращения к API. Это страховка от любых изменений.

Прогнозирование спроса — зачем и как

Когда в Data Warehouse собраны данные за шесть и более месяцев, можно подключить модель прогнозирования. Модель анализирует историю продаж, учитывает сезонность, тренды, влияние цен и рекламы, и выдаёт прогноз на каждый день по каждому SKU и складу.

Для компании вроде Barinoff (производство сиропов) это означает: «На апрель 2026 прогнозируем рост продаж Сироп Манго на 12%, снижение Сироп Клубника на 5%. Рекомендуем увеличить производство Манго на 400 бутылок и снизить Клубника на 200». Для компании вроде LOVULAR (подгузники) это означает: «Подгузники размер 3 — прогноз на складе Москва: 15 000 пачек в месяц, текущий остаток: 22 000 пачек, рекомендуем не заказывать до следующей поставки».

Прогноз не заменяет ваш опыт. Он даёт количественную основу для решений, которые вы и так принимаете. Разница в том, что решение «увеличить производство Манго» основано на модели, которая проанализировала тысячи точек данных, а не на интуиции менеджера, который помнит, что «в прошлом году Манго продавался хорошо».

На выходе вы получаете не одну цифру «продадим столько-то», а рабочую модель спроса. В дашборде видно базовый прогноз, доверительный интервал и несколько сценариев: базовый, сильный, осторожный. Отдельно показываем вклад факторов: как на спрос влияют цена, сезонность, реклама, акции маркетплейса, наличие на складе и поведение конкурентов. Там, где это уместно, даём и более строгую статистику: significance, p-value, feature importance, backtesting. То есть вы видите не просто красивый график, а понимаете, почему модель делает именно такой вывод и на какие рычаги действительно можно влиять.

Прогноз строится по тем разрезам, в которых вы реально управляете бизнесом: по SKU, складу, категории, бренду и атрибутам товара вроде цвета, размера или вкуса. Это важно, потому что бизнесу нужно понимать не только общий объём на месяц, но и структуру спроса внутри него. Для производства вроде Barinoff это означает план выпуска по каждой позиции и вкусу. Для fashion-селлера — план закупки по размерам и цветам. Под капотом могут быть регрессии, деревья решений, бустинг, ансамбли и LOOCV для проверки устойчивости модели. Но для вас главное другое: прогноз читается быстро, выглядит понятно и помогает принимать решения по ассортименту, закупке, рекламе и цене без гадания.

AI и анализ отзывов

AI-агенты анализируют отзывы покупателей — ваши и конкурентов. Каждый отзыв автоматически классифицируется по темам: качество товара, упаковка, скорость доставки, соответствие описанию, цена. Определяется тональность: положительный, нейтральный, негативный.

Результат — не список из 5000 отзывов, которые нужно читать вручную. Результат — агрегированная картина: «Товар X — 30% негативных отзывов связаны с упаковкой. Конкурент Y — 40% негатива про доставку». Это конкретный сигнал к действию: улучшить упаковку или подчеркнуть в карточке товара, что у вас быстрая доставка. Все пожелания по улучшению продукта, которые оставили пользователи, ИИ сохранит в базе данных и тоже покажет в дашборде.

Мы также настраиваем проверки, которые сверяют цены и остатки на разных платформах, отслеживают аномалии (резкое падение рейтинга, массовые возвраты) и предупреждают через Telegram-бот, когда что-то идёт не так.

Обучение команды работе с AI

Мы проводим мастер-классы по Cursor AI (Antigravity/Claude Code). Cursor — это среда разработки со встроенным AI-ассистентом. Он подключается к вашей базе данных и помогает: генерирует SQL-запросы по текстовому описанию, анализирует данные, строит отчёты. Аналитик пишет «покажи товары с падающей маржой» — Cursor генерирует запрос и показывает результат.

Даниил Ковех, основатель Koveh Studio, проводил мастер-классы по AI для издательства Альпина и Сбера и интегрировал ИИ в Австрийские компании. Стоимость восьмичасового курса — 80 000 рублей. На курсе может присутствовать до 10 человек. Курс включает практику на реальных данных вашей компании. В связке с Data Warehouse это делает команду значительно продуктивнее: аналитик перестаёт быть человеком, который вручную сводит Excel, и становится человеком, который задаёт вопросы и получает ответы.

Кто мы

Koveh Studio — инженерная студия, основанная Даниилом Ковехом. Даниил — дата-инженер и фуллстек с шестилетним опытом – ex-KPMG Austria, ex-Uniqa Insurance Group, построил Data Warehouse для PrimeKraft (Черноголовка).

В команде: Дарвин Фархутдинов — FMCG-консультант, ex-Procter & Gamble, исследователь рынка маркетплейсов, Эдуард Купеев – Дата Аналитик, Ex-ТБанк, бакалавр МГУ. Дарья Киселёва — Senior Data Engineer, специалист по Azure, Snowflake, ClickHouse, Databricks. Юрий Новиков — ML-специалист, ex-Wildberries, магистр МФТИ. Анна Ковех — директор и юрист. Фёдор Шубочкин — креативщик.

Мы партнёры Яндекс.Облака и MPStats. У нас так же есть собственная дата платформа на koveh.com: веб-приложение для работы с базами данных, визуализация ETL-процессов, AI-чат поверх ваших данных.

Почему мы, а не кто-то другой

Мы не начинаем каждый проект с чистого листа. У нас уже есть готовые и проверенные интеграции с Ozon, Wildberries, MPStats и типовая архитектура для маркетплейсных данных. Это не набор сырых скриптов, а поддерживаемая система: сборщики версионируются, код хранится в Git, обновления ставятся предсказуемо, а изменения в API не превращаются в аврал на две недели. Мы уже прошли через типичные edge cases: пустые ответы, нестабильные эндпоинты, лимиты, изменение формата полей, задние доезды данных. Поэтому для нового клиента мы не изобретаем всё заново, а быстро адаптируем готовую основу под его ассортимент, процессы и метрики.

У нас есть заготовленные схемы данных в ClickHouse под задачи селлера: unit-экономика по SKU, оборачиваемость по складам, возвраты, реклама, сравнение с конкурентами, динамика доли рынка. Это важно, потому что основная ценность не в том, чтобы просто «залить данные в базу», а в том, чтобы сразу получить правильную аналитическую модель. Если архитектура продумана заранее, вы быстрее выходите на рабочие дашборды и меньше платите за переделки через три месяца.

У нас также есть CI/CD: код автоматически тестируется и разворачивается без ручной возни на сервере. Для клиента это означает простую вещь: система обновляется аккуратно, с меньшим количеством ошибок и без хаоса. Если маркетплейс меняет API или вам нужно добавить новый отчёт, это становится нормальной инженерной задачей, а не дорогим мини-проектом с нуля.

Мы не продаём стратегию продвижения, креативы и «волшебные советы по маркетплейсам». Это не наша зона. Вы лучше знаете свой товар, свою аудиторию и свои гипотезы роста. Наша зона — данные, архитектура, аналитика, автоматизация и модели, на которые можно опереться в реальном управлении бизнесом.

Данные принадлежат вам

Это принципиальный момент. Весь код, написанный в рамках проекта, передаётся вам. Хранится в вашем Git-репозитории с документацией. Данные лежат на вашем сервере. Вы не зависите от нас. Если завтра вы решите взять инженера в штат или сменить подрядчика — он откроет репозиторий, прочитает README и продолжит работу с первого дня.

В отличие от SaaS-платформ, где данные лежат на чужих серверах и вы теряете доступ при отмене подписки, Data Warehouse — это ваша инфраструктура. Вы контролируете всё: что хранить, как обрабатывать, кому давать доступ. Полный контроль.

Типичный день с Data Warehouse

Чтобы вы лучше представили, как меняется работа, опишем обычный день после запуска системы. Ночью, пока все спят, Airflow запускает сборщиков. К трём часам ночи данные за вчерашний день загружены из Ozon, Wildberries, MPStats. К четырём — данные очищены, объединены с себестоимостью из 1С, витрины пересчитаны. К пяти — проверки качества пройдены: количество загруженных строк совпадает с ожидаемым, аномалий нет.

В шесть утра Telegram-бот отправляет руководителю сводку за вчера. Выручка по каждому маркетплейсу, сравнение с тем же днём прошлой недели, топ-5 товаров по росту, топ-5 по падению, количество возвратов. Всё — в одном сообщении, которое можно прочитать за минуту, пока пьёшь кофе.

В девять категорийный менеджер открывает дашборд в DataLens. Все данные актуальны. Он не тратит три часа на сведение Excel — он сразу переходит к анализу. Смотрит, какие товары потеряли маржу. Видит, что конкурент FitnesSHOCK снизил цену на протеиновый батончик на 8%. Оценивает, как это влияет на продажи. Принимает решение: снизить цену на 5% или усилить рекламу. Решение основано на цифрах, которые обновились несколько часов назад, а не на данных за прошлую неделю.

В обед финансист открывает свой дашборд. Видит unit-экономику по каждому SKU за последний месяц. Находит три товара, которые убыточны — комиссия и логистика превышают наценку. Передаёт информацию категорийному менеджеру для решения: убрать из ассортимента, поднять цену или перенести на другой склад.

В течение дня, если нужна какая-то конкретная цифра, любой сотрудник пишет в Telegram-бот: «продажи SKU-12345 за февраль». Бот за секунду возвращает ответ. Без звонков, без просьб к аналитику, без ожидания.

Динамическое ценообразование — как это работает для селлера

Цена на маркетплейсе — это не фиксированная величина. Она зависит от десятков факторов: цены конкурентов, спрос, остатки на складе, сезонность, рекламная активность, акции маркетплейса. Менеджер, который вручную мониторит цены конкурентов и корректирует свои — тратит часы на работу, которую машина делает за секунды.

Когда в Data Warehouse собраны все данные (ваши продажи, цены конкурентов, остатки, расходы), можно подключить модель динамического ценообразования. Модель анализирует все факторы и выдаёт рекомендацию: «Товар X — конкурент снизил цену на 12%, ваши остатки высокие, спрос падает. Рекомендация: снизить цену на 7% для поддержания оборачиваемости. При новой цене маржа составит 14%, что выше порога рентабельности».

Модель не принимает решения за вас. Она даёт рекомендацию с объяснением, а менеджер решает. Но вместо того чтобы вручную считать в Excel, сколько заработаете при каждом варианте цены, вы получаете готовый расчёт за секунду. Для компании с сотнями SKU — таких как REDMOND, Canon, Puma, New Balance — это меняет масштаб принятия решений: не десять пересчётов в день, а тысяча.

Склады и логистика — зона скрытых убытков

Для многих селлеров логистика и хранение — самая большая статья расходов после себестоимости. Маркетплейсы берут плату за хранение, и она растёт, если товар долго не продаётся. На Wildberries стоимость хранения увеличивается каждую неделю. На Ozon — действуют свои тарифы, которые зависят от категории и размера.

Data Warehouse собирает данные об остатках по каждому складу и рассчитывает оборачиваемость: сколько дней товар лежит на складе до продажи. Если оборачиваемость на складе в Казани — 90 дней, а в Москве — 15 дней, это сигнал: товар в Казани «висит» и генерирует расходы на хранение. Нужно или перераспределить, или снизить цену для ускорения продаж.

Для компаний с десятками SKU и несколькими складами (а большинство селлеров из вашего списка — именно такие) оптимизация складов может сэкономить 5–15% от расходов на логистику. На обороте 10 миллионов рублей в месяц это 50–150 тысяч рублей ежемесячно. Data Warehouse делает эту оптимизацию возможной, потому что показывает данные, которые иначе пришлось бы собирать вручную из нескольких систем.

Реклама на маркетплейсах — считаем ROI правильно

Рекламные кабинеты Ozon и Wildberries показывают, сколько вы потратили и сколько показов/кликов получили. Но они не показывают главное: сколько вы заработали с каждого рубля рекламного бюджета. Чтобы посчитать реальный ROI рекламной кампании, нужно объединить данные о расходах на рекламу с данными о продажах и маржинальности. Это невозможно в рамках рекламного кабинета — там нет вашей себестоимости.

Data Warehouse решает эту задачу. Расходы на рекламу загружаются из API рекламных кабинетов и привязываются к каждому SKU. Затем объединяются с данными о продажах и unit-экономикой. Результат: «Рекламная кампания X на товар Y: потрачено 15 000 рублей, дополнительных продаж на 120 000 рублей, дополнительная маржа 25 000 рублей. ROI рекламы — 167%». По каждому товару, по каждой кампании.

Такой расчёт показывает, какие товары имеет смысл рекламировать, а какие — нет. Часто оказывается, что 80% рекламного бюджета приносят 20% результата. Data Warehouse помогает найти эти 20% и перераспределить бюджет.

Возвраты — скрытая проблема

Возвраты — это не только потерянные продажи. Это расходы на обратную логистику, повреждение товара при перевозке, снижение рейтинга карточки. Личный кабинет маркетплейса показывает количество возвратов, но не показывает структуру: почему возвращают, какие товары возвращают чаще, есть ли связь между причиной возврата и конкретным складом или регионом.

Data Warehouse собирает данные о возвратах с детализацией: причина, дата, SKU, склад, регион. Дашборд показывает: «Товар X — процент возвратов 8%, основная причина — не соответствует описанию (45%). Товар Y — процент возвратов 2%, средний по категории». Это позволяет принять конкретное решение: обновить описание карточки, изменить фото, или выяснить, что товар с конкретного склада приходит повреждённым.

Для компаний с сотнями SKU — как ACOOLA (одежда), Kapika (обувь для детей), New Balance (спортивная обувь) — анализ возвратов может выявить системные проблемы, которые не видны при ручном просмотре: определённые размеры возвращают чаще, определённые склады генерируют больше повреждений, определённые регионы имеют повышенный процент возвратов.

Безопасность и контроль

Все ваши данные хранятся на вашем сервере. API-ключи и токены доступа хранятся в зашифрованном хранилище (Key Vault), а не в коде. Все соединения шифруются. Доступ к серверу — только через SSH с ключами. Каждый пользователь системы имеет минимально необходимые права.

Мы подписываем NDA перед началом работы. Мы не передаём данные одного клиента другому. Мы не используем ваши данные для обучения моделей для других клиентов. После завершения проекта весь код и данные принадлежат вам.

Если вам нужна дополнительная безопасность (VPN, двухфакторная аутентификация, изолированная сеть), мы настроим. Стоимость базового корпоративного VPN — от 12 000 рублей. Для крупных компаний вроде Canon, Fujifilm, Puma — это стандартное требование, и мы к нему готовы.

Что будет через год

Data Warehouse — это не разовый проект, а платформа, которая развивается вместе с вашим бизнесом. Через год у вас накопится достаточно данных для серьёзного прогнозирования: модели станут точнее, паттерны сезонности — чётче. Вы сможете планировать закупки на квартал вперёд с точностью, которая невозможна при ручном планировании.

Вы сможете добавлять новые источники данных по мере необходимости. Решили выйти на Яндекс.Маркет — подключили API за полтора часа. Решили интегрировать CRM — подключили за три часа. Решили собирать данные с сайтов конкурентов через скрейпинг — подключили за восемь часов. Архитектура системы спроектирована для роста: добавление нового источника — это не переделка всего, а добавление одного модуля.

Через год ваши конкуренты, которые всё ещё сводят данные в Excel, будут принимать решения на основании данных за прошлую неделю. Вы — на основании данных за вчера. Они будут гадать, какой товар рекламировать. Вы — знать. Они будут удивляться, почему маржа упала. Вы — видеть это в реальном времени и реагировать.

Daniil Kovekh
Daniil Kovekh
Data & Full Stack Engineer