Разработка и внедрение предсказательных моделей, анализ больших данных, повышение ключевых бизнес-метрик через машинное обучение.
---
- +исследовательский анализ данных (EDA) и предобработка.
- +разработка и валидация моделей ML под бизнес-задачи (рекомендации, скоринг, прогнозирование, детекция аномалий).
- +проведение A/B тестов и анализ результатов.
- +взаимодействие с инженерами данных для подготовки витрин.
- +мониторинг качества моделей в продакшене (ретриггеры, дрейф данных/цели).
- +документирование кода и результатов исследований.
---
- +высшее (математическое, компьютерные науки, физика, экономика с сильным уклоном в статистику). Магистратура/аспирантура приветствуется
- +уверенное знание линейной алгебры, математического анализа, теории вероятностей и матстатистики.
- +понимание принципов проверки гипотез (A/B тесты, p-value, мощность критерия).
- +знание метрик качества моделей (MAE, RMSE, Precision/Recall, ROC-AUC, Lift, LogLoss).
- +опыт реализации полного цикла ML-задачи (от EDA до деплоя).
- +глубокое понимание алгоритмов: Linear/Logistic Regression, Decision Trees, Random Forest, Gradient Boosting (XGBoost, LightGBM, CatBoost).
- +понимание компромисса смещения-дисперсии (bias-variance tradeoff), борьба с переобучением и дисбалансом классов.
- +свободное владение Python (pandas, numpy, scikit-learn, scipy, matplotlib, seaborn, statsmodels).
- +уверенное владение SQL (сложные запросы, оконные функции, CTE).
- +опыт работы с Git (ветки, merge requests, code review).
Будет плюсом:
Портфолио/код: наличие GitHub или участие в соревнованиях (Kaggle, ODS, AI Challenge).