Шукаємо ML-інженера (middle+/senior) для середньострокового проєкту (1–3 місяці) з побудови предиктивної ML-моделі. Суть завдання Побудувати модель, яка на момент T+24 години після інсталу прогнозує для кожного користувача: * очікуваний 6-місячний дохід з підписок та покупок * очікуваний 6-місячний ad revenue
Прогнози будуть агрегуватися на рівні кампаній / джерел трафіку та використовуватись для оптимізації закупки трафіку. Дані * BigQuery * ~6 млн користувачів * 1 рядок = 1 користувач * Повний 6-місячний горизонт по доходу * Install/context фічі + поведінка в перші 24 години
Що потрібно зробити * Feature engineering для табличних даних * Формування таргетів (subscription + ad revenue, 6m) * Навчання ML-моделі (CatBoost / LightGBM / XGBoost або подібне) * Робота з zero-inflated / long-tail revenue * Коректний time-based train/validation split * Перевірка якості не лише на user-level, а й на агрегованих сегментах * Inference pipeline + відтворюваний код * Коротка документація по підходу
Кого шукаємо * Досвід з tabular ML та регресійними задачами * Розуміння LTV / revenue prediction * Практичний досвід з CatBoost / LightGBM / XGBoost * Досвід роботи з великими датасетами (мільйони рядків) * Розуміння data leakage, time-split, бізнес-метрик