?

Log in

как лгать с помощью статистики: графики - Поклонник деепричастий [entries|archive|friends|userinfo]
Anatoly Vorobey

[ website | Website ]
[ userinfo | livejournal userinfo ]
[ archive | journal archive ]

Links
[Links:| English-language weblog ]

как лгать с помощью статистики: графики [май. 7, 2017|12:22 am]
Anatoly Vorobey
[Tags|]

Три примера о том, как помочь читателю получить неверное представление с помощью графика.



Похоже на то, что в 2011-м году молодежь стала курить больше марихуаны, чем пить алкоголя? Но взгляните внимательнее на разные шкалы (в процентах) слева и справа.



Белые американки в возрасте 50-54 лет теперь чаще умирают от сердечных болезней, чем негритянки? Нет, смотрите опять-таки на шкалу каждой кривой.



Несколько другой случай, схожая проблема. Есть ли какая-то важность в том, что цена 1 биткоина превзошла цену одной унции золота? Рост биткоина (в долларах) имеет смысл, рост биткоина относительно золота тоже имеет смысл, но пересечение этим ростом произвольной отметки "1 биткоин/1 унция" ничем не важнее, чем столь же произвольной отметки "2 биткоин/1 унция" или "0.5 биткоин/1 унция". Пересечение кривых на этом графике ни для чего не важно и ни о чем не говорит.


Источники этих графиков:

http://www.cnbc.com/2017/04/20/beer-sales-are-going-to-fall-because-marijuana-is-getting-so-popular-wall-street-says.html

https://psmag.com/the-death-of-the-white-working-class-has-been-greatly-exaggerated-1c568d3e6b8c

https://twitter.com/wef/status/860688831699353601
СсылкаОтветить

Comments:
[User Picture]From: shultz_flory
2017-05-06 09:32 pm
В последнем случае обычно говорят «достиг психологически важной отметки».
(Ответить) (Thread)
[User Picture]From: kovla
2017-05-06 09:48 pm
В примере про биткойн корректно иллюстрируется динамика цен, то есть там нет ничего запутывающего или ложного. Кроме того, унция и один биткойн - естественные единицы для этих ресурсов, в то время как пол-унции или два биткойна уже нет. Сама новость, что биткойн обогнал золото, действительно, для обычного человека мало значения имеет. Возможно, для трейдеров это имеет какой-то дополнительный смысл. Но график сам верный.
(Ответить) (Parent) (Thread)
From: karpion
2017-05-06 11:05 pm
Воистину так.
(Ответить) (Parent) (Thread)
From: dmpogo
2017-05-07 02:15 pm
Плюс дает легко запоминающуюся оценку ( и для последующего - точку отсчета) 1 биткойн - это где то унция золота. Хороший факт помнить.
(Ответить) (Parent) (Thread)
[User Picture]From: yoksel_moksel
2017-05-06 09:53 pm
А можно ещё масштаб графика увеличивать, оставляя нулевую отметку далеко за его пределами, чтобы колебания графика казались значительными, тогда как на самом деле они в пределах статистической погрешности.

Примерно как на первом вашем рисунке.
(Ответить) (Thread)
[User Picture]From: dmitrmax
2017-05-06 11:29 pm
Или наоборот, упрятать всё под логорифм )
(Ответить) (Parent) (Thread)
[User Picture]From: yoksel_moksel
2017-05-06 11:56 pm
Я не припомню, чтобы логарифмическую шкалу употребляли не по делу. Разумеется, такое бывает, но, мне кажется, злоупотребления здесь редки.

Тем более, что логарифмическое представление соответствует нашим органам чувств, хорошо различающим слабые воздействия и притупляющими чувствительность при сильном воздействии.


Edited at 2017-05-06 23:57 (UTC)
(Ответить) (Parent) (Thread)
[User Picture]From: onodera
2017-05-07 08:33 am
> А можно ещё масштаб графика увеличивать, оставляя нулевую отметку далеко за его пределами, чтобы колебания графика казались значительными, тогда как на самом деле они в пределах статистической погрешности.

Все биржевые графики так рисуют.
(Ответить) (Parent) (Thread)
From: dmpogo
2017-05-07 02:17 pm
Вот это большая проблема с первым графиком, чем то что отметал Авва
(Ответить) (Parent) (Thread)
[User Picture]From: alexanderr
2017-05-06 10:32 pm
так где же ложь? я не вижу никакого обмана. на первом графике алкоголь упал с 78% до 75%, а марихуана выросла с 27% до 32%. алкоголь упал? упал. марихуана выросла? выросла. что не так??
(Ответить) (Thread)
From: karpion
2017-05-06 11:05 pm
График построен так, чтобы создать неверное представление о соотношении одного и другого. Для этого берутся две разных шкалы - хотя правильнее было бы положить всё на одну шкалу.
(Ответить) (Parent) (Thread)
[User Picture]From: occam_aga
2017-05-06 11:51 pm
Одно упало на 3.5% другое, выросло на 4.5%. Т.е из 100 человек 3 бросило пить, 4 начало курить. Что не так со сделанным выводом?

До этого пили 80, курили 28. Если отобразить на одной шкале, то будет выглядеть, как будто пить почти никто не бросил, а количество курящих сильно выросло.
(Ответить) (Parent) (Thread)
[User Picture]From: alexanderr
2017-05-07 12:48 am
вот именно. и второй график совершенно правильный тоже. я честно не понимаю, в чем "обман"
(Ответить) (Parent) (Thread)
[User Picture]From: occam_aga
2017-05-07 01:09 am
Я тут пост внимательнее перечитал :)
В заголовке обмана не предполагается. Претензия в том, что кто-то может додумать больше. Типа, курить стали больше чем пить.
(Ответить) (Parent) (Thread)
[User Picture]From: alexanderr
2017-05-07 04:28 am
заголовок: "как лгать с помощью статистики: графики"

лгать это не обман? а что же это тогда.

обычно, когда масштаб по осям разный, принято рисовать овальчик и стрелочку направо и налево. но здесь даже этого не нужно, первый и второй график естественно отнормированны на среднюю или там начальную величину. имеено так, как и учат строить правильные графики, чтобы данные занимали все поле.

такое ощущение, что тут рассказ скорее о том, какие бывают идиоты. ну, идиоты бывают разные, на всех не угодишь
(Ответить) (Parent) (Thread)
[User Picture]From: occam_aga
2017-05-07 04:47 am
Под заголовком я имел в виду, заголовок статьи - young adults ... shift from alcohol to cannabiss. Сначала подумал, что именно там предполагается ложь. Вобщем никто никого не понял :)
(Ответить) (Parent) (Thread)
[User Picture]From: tlkh
2017-05-07 08:51 am
Не лгут цифры, на которых построены графики.
Графики - лгут.
В чем смысл графиков, что они добавляют или отнимают от столбцов цифр? В том, что по графикам легче видеть закономерности и делать выводы.
Если графики сделаны так, что подталкивают к неверным выводам, они лгут.
(Ответить) (Parent) (Thread)
From: (Anonymous)
2017-05-06 10:52 pm
> Похоже на то, что в 2011-м году молодежь стала курить больше марихуаны, чем пить алкоголя?

Нет, не похоже.

> Белые американки в возрасте 50-54 лет теперь чаще умирают от сердечных болезней, чем негритянки?

Нет, не похоже.

> Пересечение кривых на этом графике ни для чего не важно и ни о чем не говорит.

А что, на самом графике утверждается, что говорит? График не только полностью корректен, но даже совершенно не misleading. Важность или неважность каких-то совпадений на нём — вопрос дискуссионный, но в любом случае его следует задавать тем, кто интерпретирует график, а не тем, кто его строит.

Простые же всё ситуации вроде.
(Ответить) (Thread)
[User Picture]From: alexanderr
2017-05-07 12:49 am
+100,500

дико, дико плюсую
(Ответить) (Parent) (Thread)
[User Picture]From: white_bars
2017-05-06 10:54 pm

Прочел первую статью: там все логично. А откуда взялась ваша интерпретация графика, мне непонятно. Извините.

(Ответить) (Thread)
From: (Anonymous)
2017-05-06 11:30 pm
Комментарии отличные. "Если мне все понятно, то и другие должны все автоматически понимать". Проф искажение и полное отсутствие представления о человеке без профильного образования.
(Ответить) (Thread)
[User Picture]From: occam_aga
2017-05-07 12:21 am
Я видел, людей, которым графики не понятны. Им всё равно не понятно, как ни рисуй.
(Ответить) (Parent) (Thread)
[User Picture]From: helvegr
2017-05-07 02:09 pm
> полное отсутствие представления о человеке без профильного образования

это только в первом случае валидная претензия
второй график взят из научной статьи, у них целевая аудитория несколько другая
(Ответить) (Parent) (Thread)
From: dmpogo
2017-05-07 02:19 pm
Для этого к графику должны быть написаны правильные и объясняющие 'figure captions'
(Ответить) (Parent) (Thread)
[User Picture]From: _milenka_
2017-05-07 07:31 am
Тут хорошая статья на эту тему: https://en.wikipedia.org/wiki/Misleading_graph

Что действительно часто встречается в прессе это Truncated bar graph.
(Ответить) (Thread)
[User Picture]From: helvegr
2017-05-07 02:01 pm
dual axes графики типа первого и второго вообще встречаются довольно часто
они не то чтобы intentionally misleading, просто многие их не умеют читать
они не для сравнения абсолютных значений, а для сравнения трендов

в статье по первой ссылке не говорится, что дуть стали больше, чем пить
говорится, что дудка растёт, а алкаха падает

второй график взят из приложения к научной статье
https://www.brookings.edu/wp-content/uploads/2017/03/6_casedeaton.pdf
в том месте в статье, где авторы на него ссылаются (стр. 14), говорится что obesity rates у чёрных росли, но также был rapid progress against heart disease
линия белых дана для сравнения, свою интерпретацию ОП высосал из пальца

то есть at most это пример плохого information design, а не ложь
(Ответить) (Thread)
[User Picture]From: alexanderr
2017-05-07 02:36 pm
design у первого и второго графика совершнно нормальный и стандартный. и выводы соответствуют цифрам. "ложь" тут видимо только для определенного сорта идиотов, которые не смогли прочитать простой график. я впрочем не уверен, существуют такие люди или нет. а если да, то зачем они смотрят на графики, которые им все равно не понять.
(Ответить) (Parent) (Thread)
From: (Anonymous)
2017-05-07 02:49 pm
ну этот тип графиков действительно часто критикуют
https://www.perceptualedge.com/articles/visual_business_intelligence/dual-scaled_axes.pdf например
в научной статье, я думаю, нормально; в газете уже не очень
(Ответить) (Parent) (Thread)
From: dmpogo
2017-05-07 02:36 pm
Второй график неудачный, первый и третий - нормальные
(Ответить) (Thread)
[User Picture]From: f137
2017-05-07 07:47 pm
Поскольку пост отнесен к науке, возражу, что научные графики предполагают некий минимум интеллекта у адресата. Первый и второй интерпретируются однозначно правильно, если на них смотреть хоть сколько-то внимательно.

Рискну предположить, что нарисованы ои в таком виде из экономии места, 1 чарт вместо 2. А при одном масштабе трендов бы не было видно.

В-общем, на ложь не тянет. Не следует приписывать злонамеренности...
(Ответить) (Thread)
From: (Anonymous)
2017-05-07 09:27 pm
Первый рисунок - серебро плохих графиков

Золото всё-таки отходит http://savepic.ru/13852598.jpg
(Ответить) (Thread)
[User Picture]From: Philip Arifulov
2017-05-08 11:35 am
Из технического требования на экономику коммунистического общества:

"Принципиальная возможность поддерживать «вертикальный экономический прогресс» — способность экономики к достаточно долговременному подъему с тангенсом угла наклона больше единицы (удвоение за год совокупного общественного продукта)".
(Ответить) (Thread)
[User Picture]From: Илья Цыгвинцев
2017-05-14 09:52 pm
"С тангенсом угла наклона" — валяюсь по полу.
(Ответить) (Parent) (Thread)