Студенческий контест по Machine Learning Обучающие задачи Первый открытый контест ok.ru: Возраст по графу По мотивам онлайн-игр Задача с секретом Предсказание ССЗ ok.ru: Связи пользователей Прогноз отклика аудитории на интернет-опрос Telecom Data Cup Ответы Mail.ru (Хакатон, МФТИ) SNA Hackathon - Коллаборативная система SNA Hackathon - Картинки SNA Hackathon - Тексты ML Boot Camp 9
Участники
  • 1
    Михаил Карачун
  • 2
    Евгений Цацорин
  • 3
    Иван Тямгин
  • 4
    Mikhail Novikov
  • 5
    Антон Тимофеев
Задача "Выход из он-лайн игры"

В этой задаче необходимо научиться предсказывать, остается ли участник в он-лайн игре или уходит из нее. Уходом считается отсутствие его в игре в течение недели.

 

Всего используется 12 признаков, вычисленных за 2 предыдущие недели:

  • maxPlayerLevel - максимальный уровень игры, который прошел игрок
  • numberOfAttemptedLevels - количество уровней, которые попытался пройти игрок
  • attemptsOnTheHighestLevel - число попыток, сделанных на самом высоком уровне
  • totalNumOfAttempts - общее число попыток
  • averageNumOfTurnsPerCompletedLevel - среднее количество ходов, выполненных на успешно пройденных уровнях
  • doReturnOnLowerLevels - делал ли игрок возвраты к игре на уже пройденных уровнях
  • numberOfBoostersUsed - количество использованных бустеров
  • fractionOfUsefullBoosters - количество бустеров, использованных во время успешных попыток (игрок прошел уровнь)
  • totalScore - общее количество набранных очков
  • totalBonusScore - общее количество набранных бонусных очков
  • totalStarsCount - общее количество набранных звезд
  • numberOfDaysActuallyPlayed - количество дней, когда пользователь играл в игру

Все предоставленные для задачи данные разбиты на две части: обучающую (x_train.csv и y_train.csv) и тестовую (x_test.csv). Каждая строка файлов x_train.csv и x_test.csv соответствует одному пользователю. Данные в строке разделены точкой с запятой. Первая строка содержит имена признаков. Файл y_train.csv содержит значения 1 или 0 в зависимости от того, остался пользователь в игре или вышел из нее соответственно.

Как обучающая (x_train.csv и y_train.csv), так и тестовая (x_test.csv) выборки содержат информацию о 25289 пользователях.

 

В качестве ответа для данной задачи принимается текстовый файл, каждая строка которого соответствует строке в файле x_test.csv и содержит значение от 0 до 1 (вероятность того, что пользователь останется в игре). В качестве критерия качества решения задачи используется логарифмическая функция потерь.

Количество посылок ограничено пятью в сутки.

 

Тестовая выборка случайным образом разбита на две части в соотношении 40/60. Результат на первых 40% будет определять положение участников в рейтинговой таблице на всем протяжении конкурса. Результат на оставшихся 60% станет известен после окончания конкурса и именно он определит финальную расстановку участников.

Желаем успехов!