Визуализация датасета
В качестве задания на отработку навыков по визуализации данных, мы предлагаем вам провести различные визуализации датасета с большим количеством атрибутов.
Это датасет с информацией о ~15 000 игроков из футбольного симулятора FIFA 18, особо актуальный в год проведения Чемпионата Мира в России. Ознакомиться с ним и скачать можно по ссылке с Kaggle, платформы для соревнований по машинному обучению.
Для выполнения этого задания, вам нужно будет сделать как минимум 4 визуализации для указанного датасета. Вы можете проявить свою фантазию или же использовать предложенные нами варианты визуализаций.
Примеры визуализации:
Гистограмма возраста игроков
Сравнение зависимости зарплаты от возраста игрока. Можно найти самые большие команды и сравнить эти зависимости между ними.
Гистограмма распределения одной из статистик по странам — например, средний и максимальный Performance
Review criteria
Решение должно соответствовать следующим критериям:
Минимум две визуализации с помощью matplotlib
Минимум две визуализации с помощью Plotly
В каждой визуализации должен использоваться как минимум один атрибут, не использованный в других визуализациях
Решением к заданию должен быть архив, в котором лежат IPYNB файлы визуализаций. Помимо самого кода визуализации и изображения, в ноутбуке должно присутствовать текстовое описание визуализации.
В каждой визуализации должен быть указан заголовок и подписаны оси, если они есть
К каждой визуализации должен быть описан вопрос, на который она отвечает, например:
Гистограмма возраста укажет на доминирующий возраст и особенности распределения
Гистограмма среднего Performance по странам определит стабильные и надежные страны, а гистограмма максимума — родины особо ярких игроков