Обучающие задачи По мотивам онлайн-игр Студенческий контест по Machine Learning Первый открытый контест ok.ru: Возраст по графу Задача с секретом Предсказание ССЗ ok.ru: Связи пользователей Прогноз отклика аудитории на интернет-опрос Telecom Data Cup Ответы Mail.ru (Хакатон, МФТИ)
Участники
  • 1
    Сергей Старицын
  • 2
    Mikhail Novikov
  • 3
    Сергей Лавриков
  • 4
    Олег Табота
  • 5
    Антон Тимофеев
Задача "Telecom Data Cup — CSI Analyze (обновлено от 16 ноября)"

16 ноября - ВНИМАНИЕ! Датасет был увеличен в размере. Структура данных не изменена!

Было опрошено 9443 абонента. Результатом опроса является индекс удовлетворенности для каждого абонента, выраженный нулем (0 — доволен) и единицей (1 — не доволен). Необходимо с максимально возможной точностью выявить и предсказать недовольных клиентов.

Описание большинства признаков доступно здесь (файл xlsx). Значение некоторых признаков скрыто.

Метрикой задачи является ROC AUC. Ответом служит оценка принадлежности к классу, лежащая в диапазоне [0; 1] для каждого SK_ID.

Предсказание нужно сделать для 5221 абонентов в том же порядке, что и в subs_csi_test.csv. Столбцом, с переводом строк (Line Endings должно соответствовать формату Windows или Unix). Предварительные результаты будут формироваться по ответам для 2088 абонентов, а финальные по ответам для 3133 абонентов (40/60).

Максимальное количество загрузок решений в день — 5.
Количество выбираемых решений — 2.

Разрешено делиться идеями и методиками. Запрещается использование мультиаккаунтов, а также публикация полных бейзлайнов и решений до окончания соревнования. Рекомендуем ознакомиться с правилами проведения Telecom Data Cup.

Участников с лучшими результатами ждут ценные подарки: 
1 место — 400 000 рублей 
2 место — 200 000 рублей 
3 место — 100 000 рублей 
По традиции наших чемпионатов, призеры получат футболки с символикой чемпионата, а именно ТОП200.

Для удобства участников мы опубликовали лекции (в формате презентаций) по информационным технологиям. Они доступны по ссылке в репозитории. Там можно найти практически всю необходимую теоретическую базу.

Подсказки

SK_ID — это идентификатор симкарты. Вероятность того, что одному и тому же клиенту принадлежит два SK_ID из выборки крайне мала.

Сообщество MLBootCamp

Присоединяйтесь к нашему сообществу в Telegram. Вы всегда можете задать вопросы, получить советы экспертов в области Data Science. Первыми узнать о самых важных граалях. Кроме того, сообщество чемпионатов Mail.Ru Group — это нетворкинг, где легко найти единомышленников.