Типовые ошибки в Excel: Как выбирать диаграммы по смыслу данных
Собрать разрозненные данные для отчета и представить их наглядно не самая простая задача для заказчика. Об этом не понаслышке знает Алексей Колоколов — он занимается проектами по аналитике и визуализации данных с 2009 года. В книге «Заставьте данные говорить» автор последовательно разбирает процесс составления отчета, начиная с подготовки данных и заканчивая оформлением в фирменном стиле.
Наверняка вы замечали: у одних сотрудников получается делать простые и понятные презентации, которые нравятся руководству и помогают донести свои мысли, а другие мучаются, переделывают, но начальник все равно остается недовольным. Делимся отрывком из книги, где Алексей рассказывает, какие диаграммы нужно использовать в конкретных случаях.
Базовые виды анализа
Рейтинг
Количественное сравнение по принципу «больше — меньше»: кто на первом месте, кто входит в топ-5 и с каким отрывом, а кто на сколько отстает.
Визуализация: столбцы горизонтальные и вертикальные
Динамика
Изменение показателей во времени: рост или падение выручки, численность персонала по месяцам и так далее.
Визуализация: обычно линии на временной шкале
Структура
Анализ состава целого, где акцент не на количестве, а на долях в 100%. Помогает понять, какие сегменты и категории вносят вклад в достижение показателя.
Визуализация: фигуры, разделенные на сектора
Распределение
Распределение величины на количественной шкале, постоянной или интервальной. Например, сегментация клиентов по возрасту или сумме чека.
Визуализация: диаграммы рассеяния, статистические гистограммы
Взаимосвязи
Отображает зависимости между показателями, а также логические связи между категориями. Например, как перемещаются финансовые потоки в холдинге.
Визуализация: графы и другие сложные диаграммы
Последние два вида анализа — распределение и взаимосвязи — редко используются в управленческой отчетности. Им место в статистическом анализе, где нужно искать корреляции и строить сложные графы. Чтобы презентовать отчет на совещании, необходимы простые и понятные визуализации, которые точно доносят смысл данных. Существуют более сложные виды анализа (факторный, когортный) — комбинации нескольких базовых. Для них есть продвинутые визуализации: одни тоже можно построить в Excel, а для других уже потребуются полноценные BI-системы. Но для начала надо разобраться с базой и не допускать ошибок на этом уровне.
Типовые ошибки
Кто-то скажет, что примеры ниже — это какие-то детские ошибки. Но на проектах в крупных корпорациях я регулярно вижу, как в своих отчетах их допускают вполне взрослые люди. Потому что «так принято» и «мы уже привыкли». Или потому что однажды директору понравился такой график, а теперь его все строят по поводу и без повода.
Псевдодинамика
Вот мы смотрим на график прибыли по менеджерам. Но какой вывод можно сделать из этой линии? Кажется, будто она изображает периоды роста и спада. Был пик у Машкова, потом — спад у Санникова, потом — снова пик у Скоморохова и дальше — плавный спад.
Если нужно сравнить прибыль по сотрудникам, то в первую очередь важно увидеть, кто на первом месте, в тройке, пятерке лидеров и с каким отрывом от остальных. То же самое и по отстающим. Но сортировка менеджеров по алфавиту не помогает понять, кто на каком месте. Да и линия графика оторвана от фамилий: сначала мы видим максимальное значение, а потом ищем глазами, к кому оно относится. По оси X мы сортируем категории только для динамики и статистических диаграмм. В остальных случаях упорядочиваем значения от большего к меньшему по оси Y.
Важно: линейный график можно использовать только для числовой или временной шкалы. И никогда — для показателей, которые нужно сравнивать между собой.
Чтобы сравнить сотрудников по размеру принесенной прибыли, отлично подходит гистограмма. Сразу видно: есть два лидера, есть менеджер Виноградов на третьем месте, а после него сразу двое конкурируют за четвертое. Вторая половина отдела идет с большим отставанием.
Понятно, что для серьезных выводов о производительности труда здесь недостаточно данных. Нужно сравнить факт с планом, объемом клиентской базы и другими показателями. Но сам факт на такой столбчатой диаграмме показан максимально ясно и понятно.
Неуместная воронка
Многие считают, что диаграмма «Воронка» — это символ продвинутой CRM-системы, крутой аналитики продаж. А потому, обнаружив ее в Excel или Power BI, стараются использовать при каждом удобном случае. Часто получается не к месту, и без объяснений не понять, что хотел донести до нас автор.
Здесь с помощью воронки пытались сравнить филиалы по количеству клиентов. Но со стороны это выглядит так:
- из Санкт-Петербурга 4024 клиента перешли в тюменский филиал;
- из них 2447 клиентов перешли в филиал в Перми;
- и так клиенты переходили по городам, пока не закончились. :)
Конечно, автор хотел показать другое — в каком филиале больше клиентов. То есть количественное сравнение по шкале — рейтинг. Для этого не нужно сдвигать столбцы на середину: строим их от нуля на обычной линейчатой диаграмме.
«Но в воронке ведь значения как раз идут от большего к меньшему! — говорят студенты. — Чем не рейтинг?» Объясню. Воронка нужна не для сравнения показателей. Диаграмма «Воронка» — частный случай динамики. И нужна она исключительно для визуализации поэтапного процесса, в котором на каждом этапе происходит отсев. Например, с ее помощью можно показать, как менялось количество клиентов от первого звонка менеджера до заключения договора. Вы видите, что после презентации мало клиентов доходят до демоверсии, зато потом высокая конверсия в коммерческое предложение и договор.
Не все пироги одинаково полезны Круговую диаграмму в народе называют «пирогом» (от англ. Pie Chart). И чаще всего ее используют не по назначению. Давайте посмотрим на эту визуализацию проектного портфеля.
Вроде бы все сделано правильно. Для структуры выбрана круговая диаграмма, на ней всего 5 секторов, есть подписи данных, категории умещаются по горизонтали. Но кому бы я ее ни показывал, всем она не нравится: кто-то предлагает вынести подписи наружу, кто-то говорит, что нужно поменять цвета… Но ее проблема в другом. Цель диаграммы — показать срез по этапам проектов на текущий момент. Здесь мы не сортируем этапы от большего к меньшему — они идут друг за другом: сначала планирование, потом проектирование, потом разработка и так далее. На самом деле это хронологическая последовательность, только не по календарным периодам, а по этапам проекта. Это не структура, а динамика — ее всегда отображаем слева направо по горизонтальной оси. Сразу видно, что 50 проектов сдано, 20 — на вводе в эксплуатацию, 40 — на этапе разработки и так далее. Подписи с процентами, обычные для круговой диаграммы, здесь не нужны и только запутывают.
Еще раз стоит обратить внимание на горизонтальную временную шкалу. Кому-то может показаться, что линейчатая диаграмма подойдет лучше, особенно при более длинных подписях.
Это будет пусть не фатальной, но ошибкой. Глаз по умолчанию воспринимает горизонтальные столбцы как ранжированный список, а нам нужен акцент на динамике.
Есть и другой пример неуместного использования «пирога», в котором пытались показать, из каких возрастных групп состоит наша клиентская база.
Сектора отсортированы именно так, как и нужно на круговой диаграмме, — от большего к меньшему. Но сегменты — это интервалы распределения по возрастам. То есть снова мы имеем дело с горизонтальной шкалой от минимума до максимума. Самый наглядный вариант — показать размер сегментов столбцами. Их уже не нужно делать цветными, как это было с секторами, и в легенде тоже нет необходимости — интервалы возрастов подписаны на оси Х.
Вы можете удивиться, почему исправления всех ошибок сводятся к диаграммам с горизонтальными либо вертикальными столбцами. Но это действительно самый функциональный способ визуализации.
Любой вид диаграмм нужно выбирать осознанно. Сначала определяем, что представляют собой данные по смыслу и какой это вид анализа данных. А уже потом выбираем подходящую диаграмму. Это не творческий, а исключительно логический процесс.
Для каждого вида анализа есть несколько вариантов уместных диаграмм. Выбирать правильно в каждом случае научат инструкции в следующих главах. Вы можете освоить мастерство визуализации данных, не будучи дизайнером.