Прогнозирование спроса — одна из самых выгодных задач для применения машинного обучения в бизнесе. Разница между точным и неточным прогнозом напрямую конвертируется в деньги: лишние запасы замораживают оборотный капитал, снижают ликвидность и ведут к списаниям; дефицит приводит к потере выручки, разочарованию клиентов и их возможному переходу к конкурентам. При этом российский рынок имеет специфику, которая делает слепое копирование западных ML-решений нерабочим. Разберем, что реально работает, какие модели применяются, и каких ошибок стоит избегать.
Почему прогнозирование спроса — приоритетная задача для ML
Классические методы прогнозирования (ARIMA, экспоненциальное сглаживание, экспертные оценки) работают приемлемо на стабильных рынках с предсказуемой сезонностью и редкими структурными изменениями. Российский рынок является принципиально другим: резкие изменения курса валют, санкционные шоки, перебои в цепочках поставок, масштабная замена брендов после ухода западных компаний, приход новых азиатских игроков. В такой среде алгоритмы, которые хорошо экстраполируют прошлое, системно ошибаются, потому что оно перестало быть надежным ориентиром для будущего.
ML-модели потенциально лучше справляются с нелинейными зависимостями и умеют учитывать сотни переменных одновременно: погодные условия, локальные события, активность конкурентов, макроэкономические индикаторы, динамику цен, промо-акции, поведение смежных категорий. Необходимо понимать, что качество модели определяется качеством данных, правильностью постановки задачи и учетом локальной специфики, которую стандартные западные решения не принимают во внимание.
Какие модели применяются и где они эффективны
Gradient Boosting (XGBoost, LightGBM, CatBoost). Это эффективный инструмент российского бизнеса в задачах прогнозирования. CatBoost (российская разработка Яндекса) особенно популярна, поскольку хорошо работает с категориальными признаками (регион, SKU, канал продаж, тип покупателя) без сложной предобработки и кодирования. Модели градиентного бустинга стабильно показывают точность на уровне MAPE 10-15% на период 4-8 недель в ретейле и FMCG, при условии чистых исторических данных за более чем два года. Их главное преимущество в интерпретирумости: можно объяснить, какие признаки оказали наибольшее влияние на прогноз, что важно для принятия управленческих решений.
Нейронные сети (LSTM, Temporal Fusion Transformer) являются более мощным инструментом для длинных временных рядов с выраженной многоуровневой сезонностью (день недели, неделя месяца, квартал, год) и сложными нелинейными зависимостями. TFT (Temporal Fusion Transformer, разработанный в Google DeepMind) демонстрирует высокую точность на горизонтах 3-6 месяцев и умеет работать с несколькими временными рядами одновременно, учитывая взаимовлияние категорий. Однако эти модели требуют значительно больше данных (от 3-5 лет истории на SKU-уровне) и существенных вычислительных ресурсов. В российском контексте они оправданы для крупных ретейлеров с тысячами SKU и отлаженным data pipeline.
Иерархические модели — это отдельный класс решений для компаний с разветвленной географической или продуктовой структурой: федеральная сеть, где нужен согласованный прогноз одновременно на уровне отдельного магазина, региона и всей сети. Иерархические модели решают принципиальную проблему: если строить прогнозы независимо на каждом уровне, сумма прогнозов магазинов не совпадает с прогнозом по сети, что создаст противоречия в планировании запасов и закупок. Иерархические подходы гарантируют математическую согласованность прогнозов по всей структуре.
Probabilistic forecasting (вероятностное прогнозирование). Вместо точечного прогноза («в мае продадим 1000 единиц») оно выдает интервал с вероятностями («с вероятностью 80% продажи будут в диапазоне 850-1150 единиц, с вероятностью 95% — в диапазоне 720-1280 единиц»). Для управления запасами это существенно ценнее точечного прогноза, поскольку позволяет задать целевой уровень сервиса и рассчитать оптимальный страховой запас под него. Компания сама выбирает: поддерживать 95% доступность топ-SKU или допустить 10% дефицит ради снижения замороженного капитала.
Специфика российского рынка: что нужно учитывать
Структурные разрывы в данных. За недавнее время в России был ряд событий, который кардинально изменил поведение рынка: 2020 год (COVID и резкое изменение потребительского поведения), 2022 год (санкции, уход западных брендов, логистические разрывы), 2023-2024 годы (формирование новой нормальности). Стандартные ML-модели, обученные на данных 2018-2024 гг., будут придавать большее значение поведению рынка до 2022 года, которое больше не актуально. Решение в том, чтобы работать с укороченными обучающими выборками (например, только 2022-2024 гг.), вводить бинарные переменные для структурных разрывов, или использовать сочетание моделей с разными временными горизонтами.
Замена брендов и реструктуризация категорий. После 2022 года многие товарные категории пережили масштабную замену западных брендов российскими или азиатскими аналогами. Историческая зависимость «бренд X — объем продаж» разрушена, новые бренды пока не имеют истории на рынке. ML-модели, обученные на уровне брендов, становятся нерелевантными. Необходимо переходить на прогнозирование на уровне потребительских сегментов и функциональных характеристик товаров, поскольку категориальные модели с характеристиками продукта (ценовой сегмент, функциональная группа, страна производства) оказываются более устойчивыми.
Высокая волатильность цен и курсовые эффекты. Колебания курса рубля напрямую влияют на себестоимость и отпускные цены импортных товаров, что в свою очередь воздействует на спрос. Прогнозные модели, не включающие курсовую динамику как признак, системно ошибаются в периоды девальвации и резкого укрепления рубля. Добавление макроэкономических переменных (курс USD/EUR к рублю, ключевая ставка ЦБ, индекс потребительских цен) значительно улучшает качество прогноза для импортозависимых категорий.
Региональная неоднородность. Потребительское поведение в Москве, Краснодаре, Новосибирске и Владивостоке существенно различается по уровню доходов, сезонности, доступности каналов. Единая федеральная модель без региональных коэффициентов дает хороший прогноз на национальном уровне, но неприемлемые ошибки на уровне регионов. Оптимальный подход в построении иерархических моделей с региональными кластерами, или отдельных моделей для крупных региональных групп.
Кейс: прогнозирование спроса для ретейлера бытовой техники
Компания: федеральный ретейлер с более чем 200 магазинами и 15 000 активных SKU. Проблема: уровень стока (out-of-stock) по топ-SKU достигал 8-12% в пиковые периоды при одновременном затоваривании по медленно-оборачиваемым позициям. Объем замороженного капитала в излишних запасах составлял значительную часть оборотных средств, при этом дефицит топ-позиций напрямую приводил к потере выручки.
Для решения была построена двухуровневая интегрированная система, на первом уровне которой — LightGBM-модель для прогноза спроса по каждому SKU в каждом магазине на горизонт 4 недели. На втором уровне — оптимизатор заказов, который на основе прогнозного интервала, Lead Time конкретного поставщика и целевого уровня сервиса рассчитывал оптимальный заказ. Важно отметить, что система не просто давала прогноз, а была интегрирована в операционный процесс пополнения запасов.
Ключевые признаки модели: исторические продажи с лаговыми переменными на горизонте 1-52 недели, цена и промо-активность (тип и глубина скидки), сезонные паттерны (день недели, месяц, праздники), региональный кластер, тип и формат магазина (площадь, трафик), текущий остаток на складе, Lead Time поставщиков, количество конкурирующих SKU в категории. Дополнительно в модель был включен курс USD как прокси-переменная для ценовой волатильности импортных позиций.
В результате через 3 месяца после запуска в продакшн произошло снижение out-of-stock по топ-SKU с 10% до 4,2%, сокращение общего объема запасов на 18% при одновременном росте уровня сервиса. MAPE модели на тестовой выборке составила 11,3% против 19,7% у предыдущей системы на базе скользящего среднего с сезонной корректировкой. Финансовый эффект от высвобождения оборотного капитала и снижения потерь от дефицита окупил затраты на разработку в течение первого квартала эксплуатации.
Распространенные ошибки при внедрении
«Сначала данные, потом модель» — эту последовательность нарушают почти все. Компании нанимают ML-инженеров или покупают готовое коробочное решение, не убедившись, что данные о продажах чистые, полные и правильно атрибутированы по SKU, магазинам и периодам. Один год с некорректно учтенными промо-акциями или закрытыми магазинами без соответствующей маркировки полностью портит обучающую выборку. Правило простое: мусор на входе — мусор на выходе, независимо от сложности модели и квалификации команды.
Игнорирование экспертизы категорийных менеджеров. ML-модель не знает, что конкурент объявил о выводе аналогичного товара, что следующие 6 недель — высокий сезон для конкретной категории в конкретном регионе или что поставщик сообщил о задержке партии. Гибридный подход, где модельный прогноз дополняется структурированными экспертными корректировками, всегда превосходит автоматическое решение. Хорошая система предоставляет категорийным менеджерам удобный интерфейс для внесения корректировок с фиксацией причин, что заодно создает данные для дальнейшего улучшения модели.
Оптимизация не той метрики. MAPE — самая популярная метрика точности прогноза, но она плохо работает для товаров с редкими продажами (делитель близок к нулю, погрешность раздувается) и не учитывает асимметрию потерь (для многих категорий дефицит обходится дороже, чем затоваривание). Для розничного управления запасами правильнее оптимизировать по финансовым KPI (целевой уровень сервиса при заданном бюджете страхового запаса). Модель, дающая MAPE 15%, но обеспечивающая уровень сервиса 97%, может быть ценнее модели с MAPE 10%, которая систематически ошибается именно по топ-SKU в пиковый сезон.
Как выбрать подход: практический фреймворк
Одно из частых затруднений при старте проекта по прогнозированию состоит в выборе подходящего класса моделей с учетом данных, ресурсов и требований к результату. Приведем несколько практических ориентиров. Если история продаж меньше 18 месяцев или содержит значительные пропуски, начинайте с простых базовых моделей (скользящее среднее с сезонной корректировкой, экспоненциальное сглаживание), фиксируйте результат как бенчмарк и параллельно занимайтесь качеством данных. ML здесь не поможет, потому что не хватает сигнала для обучения. Если данные есть, но аналитических ресурсов мало, то выбирайте CatBoost или LightGBM, они требуют меньше настроек и хорошо работают «из коробки» с правильно сформированными признаками. Если данных много, есть команда ML-инженеров и задача требует долгосрочного прогноза более чем на три месяца, тогда ваш выбор — TFT или ансамблирование нескольких моделей с оптимизацией на финансовую метрику.
Отдельно стоит вопрос о готовых SaaS-решениях для прогнозирования спроса. На российском рынке присутствует несколько отечественных платформ и адаптированных западных продуктов, их преимущество в скорости внедрения и встроенной интеграции с популярными ERP-системами, недостаток — в ограниченной возможности кастомизации под специфику конкретной компании и отрасли. Решение «купить или построить» зависит от объема и специфичности задачи: для стандартного ретейла с типичной сезонностью готовое решение может быть достаточным; для категорий с высокой российской спецификой или нестандартными цепочками поставок собственная разработка нередко дает лучший результат.
Выводы
ML-прогнозирование спроса в России работает и дает измеримый финансовый результат при правильном внедрении. Ключевые условия успеха в качественной базе данных за период от 18 месяцев и более, учете структурных разрывов 2020 и 2022 годов, включении макроэкономических и категорийных признаков, отражающих российскую специфику, гибридном подходе с интеграцией экспертной экспертизы, и плотной интеграции модели в операционные процессы пополнения запасов. Прогноз, который существует сам по себе в виде красивого дашборда, но не влияет на закупочные решения, не создает бизнес-ценности.
Горизонт применения ML в управлении цепочками поставок расширяется: следующий шаг для компаний, уже внедривших прогнозирование спроса, в интеграции с динамическим ценообразованием, оптимизации ассортимента и управлении промо-активностью. Данные о прогнозируемом спросе позволяют не только правильно управлять запасами, но и оптимизировать промо-календарь: проводить акции именно тогда, когда дополнительный спрос не создает операционной перегрузки, и избегать промо в периоды, когда и без него ожидается высокий спрос. Зрелая ML-экосистема в цепочке поставок — это конкурентное преимущество, которое накапливается со временем: чем больше данных, тем точнее модели, тем выше операционная эффективность.
Для компаний, только начинающих этот путь, ключевой совет один: не ждите идеальных данных и идеального момента. Начните с пилота на одной категории или одном регионе, что позволит быстро получить первый результат, выявить специфические проблемы с данными и обучить команду работе с прогнозными моделями. Масштабирование на основе доказанной ценности всегда легче, чем попытка внедрить все сразу во всей компании.
