Визуализация датасета

Открыто с: Среда, 29 марта 2023, 00:00
Срок сдачи: Воскресенье, 2 апреля 2023, 00:00

В качестве задания на отработку навыков по визуализации данных, мы предлагаем вам провести различные визуализации датасета с большим количеством атрибутов.

Это датасет с информацией о ~15 000 игроков из футбольного симулятора FIFA 18, особо актуальный в год проведения Чемпионата Мира в России. Ознакомиться с ним и скачать можно по ссылке с Kaggle, платформы для соревнований по машинному обучению.

FIFA18CompletePlayerDataset

Для выполнения этого задания, вам нужно будет сделать как минимум 4 визуализации для указанного датасета. Вы можете проявить свою фантазию или же использовать предложенные нами варианты визуализаций.

Примеры визуализации:

  • Гистограмма возраста игроков

  • Сравнение зависимости зарплаты от возраста игрока. Можно найти самые большие команды и сравнить эти зависимости между ними.

  • Гистограмма распределения одной из статистик по странам — например, средний и максимальный Performance

Review criteria

Решение должно соответствовать следующим критериям:

  1. Минимум две визуализации с помощью matplotlib

  2. Минимум две визуализации с помощью Plotly

  3. В каждой визуализации должен использоваться как минимум один атрибут, не использованный в других визуализациях

  4. Решением к заданию должен быть архив, в котором лежат IPYNB файлы визуализаций. Помимо самого кода визуализации и изображения, в ноутбуке должно присутствовать текстовое описание визуализации.

  5. В каждой визуализации должен быть указан заголовок и подписаны оси, если они есть

  6. К каждой визуализации должен быть описан вопрос, на который она отвечает, например:

  • Гистограмма возраста укажет на доминирующий возраст и особенности распределения

  • Гистограмма среднего Performance по странам определит стабильные и надежные страны, а гистограмма максимума — родины особо ярких игроков