Диаграммы

Персонажи, которые помогают нам визуализировать

Natalia Kiseleva
7 min readApr 13, 2023
комиксы Натальи Киселевой (eolay)

Визуализация данных — это представление данных в виде, который обеспечивает наиболее эффективную работу человека по их изучению. Это уже не новое направление, но сейчас востребованность быстро растет. Навыки визуализации данных пригодятся в бизнесе, статистике, аналитике, науке, образовании, разработке интерфейсов. В мире все больше и больше информации, и чтобы её воспринимать быстро, требуется её агрегировать и кодировать, представлять в удобном и понятном виде. Чтобы это делать корректно, не дезинформируя читателя, нужно знать правила визуализации данных.

Можно начать знакомство с визуализацией данных с изучения разных типов диаграмм, их применения, а также их ограничений. Нет такого понятия, как «плохая» диаграмма, но многие диаграммы узко применимы и требуют внимательности при работе с ними.

Чтобы знакомиться с диаграммами было веселее, представим, что каждая из них обладает своими чертами характера и внешностью. Надеюсь, благодаря иллюстрациям вам будет проще запомнить их милые особенности!

Мы разберем основные виды диаграмм

В мире применяется и регулярно изобретается огромное количество типов диаграмм, но большая часть из них имеет узкую сферу применения. Если ваша цель — быстро донести информацию до читателя, то не стоит использовать более сложную диаграмму вместо простой, это затруднит восприятие информации. Так что, даже если это может показаться вам скучным, самый простой и понятный вариант — обычно лучший выбор!

Итак начнем!

Первый персонаж мира диаграмм:

Линейчатая диаграмма (Бар-чарт)

Бар-чарт — прямолинейный и простой, он точно знает твое место в любом рейтинге, он не привередлив, ему нужно лишь два типа данных для построения, его можно легко построить в любой программе или даже нарисовать от руки.

У него есть лишь одна слабость, он переживает за свою точку опоры. Если нуля не видно на диаграмме — у бар-чарта серьезные проблемы. Не нервируйте парня, всегда начинайте столбики от нуля! Несмотря на всю крепкость и простоту этой диаграммы, попытка усложнить его — вредит ему больше прочих. Не используйте 3D, красивые градиенты или цветные фоны, когда работаете с бар-чартом. Он парень простой, не понимает всех этих наворотов!

Если посерьезнее, то:

Бар-чарт (линейчатая или столбчатая диаграмма) — это очень распространенная диаграмма. Числовая информация в бар-чарте кодируется высотой столбца. На одной оси — количественные данные, на другой обычно названия категорий или временные периоды. В основном, бар-чарт используется для сравнения категорий между собой по какому-то одному количественному признаку, для ранжирования категорий между собой (1–2–3 место), иногда используется для отображения динамики — например, показатели компании по месяцам или годам. Линейчатая диаграмма может быть вертикальной или горизонтальной, горизонтальную имеет смысл применять там, где у категорий длинные названия.

Если данные позволяют — то категории в бар-чарте лучше отсортировать в порядке убывания или возрастания количественного показателя. Если вы используете бар-чарт для отображения динамики, его нельзя делать горизонтальным.

Примеры:

  • Продажи по регионам
  • Продажи по кварталам
  • Страны по населению
  • Место участников в соревновании

График (Лайн-чарт)

Лайн-чарт — самая переменчивая из диаграмм, она обожает длинные и запутанные истории, но и сама может легко запутаться, если вы поставите ей две оси. Она не прочь погулять босиком, наличие нулевой отметки по оси Y желательно, но не обязательно — если вам нужно показывать именно динамику показателя. Данные должны отображаться последовательно, применять ее для категорий не стоит. Лайн-чарт носит в волосах яркую ленту — чтобы подчеркнуть главное! Она не любит, когда ее обзывают лапшой, и прекрасно знает, что чтобы отображать много линий на графике, нужно выделить самую главную.

Если посерьезнее:

Лайн-чарт (график) — это тоже очень распространенная диаграмма, на которой мы отображаем изменения значения показателя в течение времени. На ней мы видим не только конкретное значение в конкретный момент времени, но также наклон линии показывает нам скорость изменения этого показателя. Нулевую отметку на оси Y при необходимости можно скрыть, но если ноль показан — то читатель получит больше информации, так как без нулевой отметки он может визуально оценить только изменение данных, но не величину показателя. Например, трудно будет понять — во сколько раз изменился показатель, если не видно нуля.

Рекомендации по использованию графиков — если вам требуется отобразить не один ряд данных, а несколько, убедитесь, что у вас не получилось пестрой «лапши». Самый легкий прием при работе с большим количеством линий — сделать их все приглушенным одинаковым цветом, а самую важную линию выделить ярким цветом, акцентируя на ней внимание. Так вы предоставите читателю и контекст, и конкретные данные. Иначе будет трудно разобраться в множестве цветных линий.

Примеры:

  • Динамика прибыли по месяцам и годам
  • Уровень смертности в мире по годам
  • Цена на нефть за последние месяца
  • Динамика курса акций
  • И даже кардиограмма…

Мы часто можем видеть сочетания разных типов диаграмм на одном графике. Так Бар-чарт и Лайн-чарт часто встречаются на одном визуале. Не всегда к взаимному удовольствию, впрочем!..

комикс о совмещении разных видов диаграмм на одной визуализации

Круговая или пироговая диаграмма (Пай-чарт)

Пай-чарт — парень деловой и хозяйственный, он интересуется бизнесом, но главная его страсть — готовка! У него не очень хорошее зрение, и сравнивать данные на глаз у него получается довольно плохо, зато он очень наглядно может показать, сколько кусков пирога осталось в тарелке! Также как и Бар-чарт, он опасается 3D, потому что уверен, что оно его жутко полнит. Отдельной же слабостью Пай-чарта является любовь к небольшим компаниям. Он всегда рад принимать гостей, но если их придет больше 6, он будет переживать и волноваться… Ведь если в этой диаграмме больше 6–7 долей, она становится менее удобной в применении.

Круговая диаграмма отлично подходит, чтобы показать, как части целого соотносятся друг с другом и с целым, но эта диаграмма имеет ряд ограничений, ее редко применяют правильно.

Любые эффекты: градиент, тени и 3D — губительны для Пай-чарта, как и для многих других диаграмм. В идеале на пай-чарте можно отразить 3–4 доли целого, отсортировав их по убыванию, начиная от «полудня» по часовой стрелке. Мелкие доли лучше объединить в «Прочее», и разместить в конце. Легенду не стоит убирать далеко от пай-чарта, лучше подписать значение показателя и названия категорий прямо около секторов. Потому что сверять данные с удаленной легендой в пай-чарте будет сложно.

И напоследок — не пытайтесь кодировать в пай-чарте динамику или сравнение элементов, он для этого попросту не предназначен. Лучше всего он подходит для сравнение части с целым.

Примеры:

  • Доля молодежи в населении страны
  • Процент женщин в компании
  • Доля импортных комплектующих в продукте

Диаграмма рассеяния или Точечная диаграмма (Скаттерплот)

Скаттер-плот — очень любознательная диаграмма, обожает статистику и научную фантастику, обижается, когда ее (его?) считают задротом. Может отобразить больше параметров, чем другие диаграммы, и страшно этим гордится, потому что может увидеть между ними никем не замеченные связи и отношения. Правда, если данные слишком рассредоточены, то толку от них мало, так что скаттер-плот очень радуется, когда на диаграмме выявляется некоторый тренд — поэтому скаттер очень дружит с лайн-чарт.

Диаграмма рассеивания отображает данные точками (или кругами) на двух осях, каждая ось отвечает за определенный параметр. Например, на такой диаграмме можно посмотреть зависимости между возрастом и весом человека.

Такое расположение данных позволяет на большом количестве точек видеть некоторые закономерности. В скаттер-плоте действительно можно кодировать много различных параметров, например, группировать данные, раскрашивая их разным цветом, давая точкам разную форму в зависимости от группы, к которой они относятся. Размер кружка тоже может кодировать некоторый показатель. Но больше 3 параметров читателю воспринимать трудно. Поэтому достаточно использовать оси и либо цвет, либо размер кружка.

Примеры:

  • Вес и возраст
  • Возраст и заработная плата
  • Уровень жизни и средняя продолжительность жизни в странах, с учетом численности населения

Таблица

Эта дама имеет дело с большими объемами данных и с мелким шрифтом, поэтому у нее не очень хорошее зрение. Она любит полосатые костюмы, хотя знает, что они ей не идут, а также — пестрые шляпки. Но такой серьезной леди можно иметь маленькие слабости. Она не выносит неряшливости и небрежности, очень строга к соблюдению правил оформления текста. Но не считайте ее ханжой, она весьма современна и открыта новому. Хорошо ладит с некоторыми другими диаграммами — лайн-чартом и бар-чартом. Хоть и признает их лишь в миниатюрном виде.

Таблица — это представление данных в виде столбцов, строк и ячеек. Подходит как для чисел, так и для текстовых данных. Шапку таблицы рекомендуется выделить либо неярким цветом заливки, либо форматированием шрифта. Несколько методов выделения и форматирования одновременно использовать не рекомендуется. В зависимости от типа данных в столбцах используется выравнивание: чисел по правому краю, текста по левому. У данных в столбце, особенно у чисел, следует соблюдать одинаковый формат (разрядность). Таблица может быть снабжена дополнительными элементами — спарклайнами, гистограммами, значками.

Примеры:

  • Таблица доходов и расходов компании за месяц/год
  • Список сотрудников с их должностями, отделами и датой приема на работу
  • Таблица вылетов самолетов из аэропорта
  • Таблица с описанием товаров онлайн-магазина

Визуализация данных — очень интересная сфера на стыке двух разных дисциплин — дизайна и науки о данных! Она не только очень полезная, но так же разнообразная и интересная. Ее изучение точно пригодится вам для эффективного восприятия и передачи информации.

Надеюсь, вам понравилось это шутливое описание диаграмм!

Как выглядели бы и какими чертами характера обладали бы другие, более редкие диаграммы? Свои идеи можете писать тут в комментариях или мне в телеграм @eolay13.

Мне понравилось их персонифицировать и придумывать их черты характера, необычные свойства, шутки про их быт и жизнь можно посмотреть на странице проекта “Комиксы о диаграммах”. Возможно, список диаргамм будет пополняться!

Меня зовут Наталья Киселева, я занимаюсь визуализацией данных, ваяю дашборды, увлекаюсь комиксами и дата-артом. Пишу про все это в своем телеграм-канале https://t.me/datavizcomics !

Об этом и других моих проектах вы можете почитать на моем сайте:

Диаграммам и инструментам визуализации посвящен стикер-пак в телеграме, вы можете найти его по ссылке:

https://t.me/addstickers/dataviz

Всем спасибо за внимание!

--

--

Natalia Kiseleva

I’m an engineer. Love dataviz, programming, and drawing comics! @eolay13