Данные на 2026-06-01
демо · синтетические данные

Качество модели

Под витриной — воспроизводимый ML-пайплайн. GroupKFold(5) по client_id + time-based holdout.

Метрики рассчитаны на синтетических данных — иллюстративны.

ML против правила (baseline)

отток · GroupKFold по клиенту
МетрикаML (CatBoost)ПравилоЛучше
PR-AUC0.3270.289▲ ML
ROC-AUC0.6450.586▲ ML
Lift @ топ-10%1.62×1.54×▲ ML
Recall @ топ-20%31%28%▲ ML
416
клиентов
6 578
срезов (multi-slicing)
22%
базовый отток

Важность признаков

вклад в прогноз оттока

Проверка на будущем периоде

time-based holdout

Обучение на ранних срезах, тест на последних 30% (имитация продакшена):

0.394
PR-AUC
0.623
ROC-AUC
1.37×
Lift @ 10%

Распределение скоринга оттока

Аналитика модели

Gains / lift-кривая

охват оттока по топ-N% риска

Обзвонив топ-20% по риску, ловим 31% всех ушедших (случайно — 20%).

Калибровка

прогноз vs факт

Чем ближе точки к диагонали, тем точнее вероятности.

Выбор порога

precision / recall от порога

Порог отсечки балансирует точность и охват.