Как лгать с помощью статистики
Статистика — мощный инструмент. В умелых руках она творит чудеса! Но с её помощью можно также легко обмануть людей. Какие приёмы маркетологи и ведущие новостей используют, чтобы ввести нас в заблуждение?
Начинать ось y не с нуля
Самый распространённый маркетинговый приём! Посмотрите на этот график пользователей твиттера:
Выглядит довольно здорово: последний столбик выше первого в 3 раза! Вот только отсчёт по оси y начинается не с 0, а со 100. Посмотрите на исправленный график:
Уже не так впечатляет, не правда ли? Видимо, твиттер в тот период нуждался в инвестициях
Вот ещё более впечатляющий пример. Chevrolet хвалится тем, сколько их внедорожников всё ещё работают, спустя 10 лет. Судя по графику, Nissan до них далеко: их столбик меньше раз в 10! Но если мы внимательно посмотрим на ось y…
Она начинается с 95%! И исправленный график показывает всю абсурдность рекламы. Так ли страшны 3% за 10 лет?
Подобным грешат и политики:
Разница есть, но она сильно преувеличена
Иногда начинать отсчёт не с нуля — нормально
Как ни странно, солгать можно и с помощью обратного приёма. Если в графике есть какая-то временная зависимость, то есть мы хотим посмотреть изменение параметра за какой-то срок, гораздо информативнее будет начать отсчёт не с нуля! Иначе мы можем вообще не увидеть изменений. Так, например, выглядит мировой финансовый кризис, если показать полный график:
Очевидно, кризис — в головах! Но если посмотреть на график поближе, становится ясно, что что-то произошло:
Также имеет смысл брать не весь доступный временной отрезок, а лишь его актуальную часть. Приведу пример со статистики своей группы. Если смотреть на график подписчиков, явно видно, когда выходили посты и насколько они были успешны:
Но если я включу во временной отрезок самый успешный пост, его величина сведёт эти колебания на нет!
Если вы хотите показать, насколько ваша страна богата, просто покажите график среднего дохода, который начинается в 14 веке. Рост будет невероятный!
Неподходящие графики
Люди изобрели целую кучу графиков! Гистограммы, круговые диаграммы, ящики с усами (да-да, и такое есть). Какой использовать для визуализации данных?
Зависит от того, чего вы хотите добиться. Например, такой график позволит людям легко понять соотношение данных:
А такой график во-первых, покажет ваши специфические вкусы, а во-вторых, запутает людей:
Из-за наклона соотношения площадей искажаются. Информация (та же самая, что на графике выше) воспринимается гораздо хуже. Можно довести график до абсурда, наклонив его ещё сильнее и повернув, скажем, зелёной стороной. Будут ли тогда вообще видны остальные части?
Используйте графики правильно:
Надеюсь, теперь вы не попадётесь на самые банальные уловки маркетологов. Вот вам напоследок шедевральная диаграмма Венна с использованием банана:
Хочу увидеть ящик с усами
Врет не статистика, а люди которые ее интерпретируют.
Причем не обязательно осознано.
Это может просто быть ошибочный сбор данных. Собирали про зайчиков, а на самом деле собрали про кроликов, а результаты обработали как по выработке меха.
Вообще надо с умом подходить к графикам всяким. А лучше не подходить если оно вам не надо)
Надо помнить, что статистика это наука. А занимаются ей часто люди не с научным складом ума.
Вот еще примерчик