Читать онлайн Путеводитель по лжи. Критическое мышление в эпоху постправды бесплатно
Эту книгу хорошо дополняют:
Решение проблем по методикам спецслужб
Морган Джонс
Джордан Элленберг
Чарльз Уилан
Авинаш Диксит и Барри Нейлбафф
Чип Хиз и Дэн Хиз
Daniel J. Levitin
Weaponized Lies
How to Think Critically in the Post-Truth Era
Дэниел Левитин
Путеводитель по лжи
Критическое мышление в эпоху постправды
Москва
«Манн, Иванов и Фербер»
2018
Информация от издательства
Библиотека фонда «Эволюция»
Научный редактор Надежда Шихова
Издано с разрешения Insula Corporation c/o The Wylie Agency (UK) LTD
Все права защищены.
Никакая часть данной книги не может быть воспроизведена в какой бы то ни было форме без письменного разрешения владельцев авторских прав.
© A Field Guide to Lies, 2016, Daniel Levitin. All rights reserved
© Перевод на русский язык, издание на русском языке, оформление. ООО «Манн, Иванов и Фербер», 2018
О фонде «Эволюция»
Просветительский фонд «Эволюция» основан в 2015 году сообществом российских просветителей. Цель фонда — популяризация научного мировоззрения, продвижение здравомыслия и гуманистических ценностей, развитие науки и образования. Одно из направлений работы фонда — поддержка издания научно-популярных книг. Каждая книга, выпущенная при содействии фонда «Эволюция», тщательно отбирается серьезными учеными. Критерии отбора — научность содержания, увлекательность формы и значимость для общества. Фонд сопровождает весь процесс создания книги — от выбора до выхода из печати. Поэтому каждое издание библиотеки фонда — праздник для любителей научно-популярной литературы.
Больше о работе просветительского фонда «Эволюция» можно узнать по адресу www.evolutionfund.ru
Фонд «Эволюция» выражает огромную благодарность Евгению и Алине Дябиным за поддержку издания этой книги.
* * *
Посвящается моей сестре Шари, чей пытливый ум заставил меня мыслить лучше
ВВЕДЕНИЕ
Критическое мышление
Для начала я скажу две вещи, которые обязательно кого-нибудь да разозлят. Во-первых, язык, который мы используем, стал стирать грань между выдумкой и фактами. Во-вторых, это становится опасным побочным эффектом недостаточного образования, которое повлияло на целое поколение. В силу этих двух фактов ложь разрослась до неимоверных масштабов, и нам становится все сложнее принимать правильные решения, касающиеся нас самих, а также наших сограждан.
Так что же случилось с нашим языком? В 2016 году словом года в Оксфордском словаре стало понятие «постправда», которое определяют как «нечто, относящееся к обстоятельствам или обозначающее обстоятельства, в которых объективные факты влияют на формирование общественного мнения меньше, чем обращение к эмоциям и личным убеждениям». Это слово стало победителем, так как количество его использований в течение года взлетело до небес. Уверен, нам нужно снова вернуться к старому доброму слову «правда» — и поскорее. А также нужно отказаться от мысли о том, что правды больше не существует.
Нам всем свойственно более чем осторожно относиться к фальши. Возможно, пытаясь избежать личных разногласий и «просто поладить», мы стали использовать эвфемизмы, говоря о том, что иначе чем чистым безумием не назовешь. Ложная информация о том, что в пиццерии Comet Ping Pong в Вашингтоне велась сексуальная работорговля под руководством Хиллари Клинтон, привела к тому, что 28-летний житель Солсбери Эдгар Уэлч проехал 560 километров от своего дома до Вашингтона и в воскресенье 4 декабря (через несколько дней после того, как «постправда» стала словом года) открыл внутри пиццерии огонь из полуавтоматического оружия. Нью-йоркская газета Daily News назвала эту ложь «странной теорией». Теория, между прочим, не просто идея — это идея, выведенная путем тщательного анализа данных. И не просто данных, а только тех, что имеют отношение к рассматриваемой проблеме, отобранных строго и беспристрастно.
Другие эвфемизмы, используемые для лжи, — «контрзнания», «полуправда», «экстремистские взгляды», «альт-истина», «теория заговора» и недавнее название «выдуманные новости».
Словосочетание «выдуманные новости» звучит слишком игриво, это слишком похоже на ситуацию, когда школьник прикидывается больным, чтоб пропустить контрольную. Эти эвфемизмы скрывают тот факт, что история про сексуальное рабство — беспардонная ложь. Те, кто об этом писал, знали, что это неправда. Не может быть двух мнений, если одно из них — заведомая ложь. Журналисты, да и все мы, должны перестать уделять внимание суждениям, если они не подкреплены фактами. Две точки зрения возможны тогда, когда каждая из них опирается на объективные данные. Разумные люди могут спорить относительно того, как оценивать эти данные и какие выводы из них следуют. Каждый, конечно, имеет право на собственное мнение, но не имеет права на собственные факты. Ложь — это отсутствие фактов, а во многих случаях и прямое противоречие им.
Истина имеет значение. Эпоха постправды — это эпоха умышленной иррациональности, сводящая на нет все великие достижения человечества. Возможно, журналисты не называют «выдуманные новости» ложью, потому что не хотят оскорблять лжецов. А я говорю: не бойтесь их оскорбить! Вызовите их на ковер.
Возможно, лучше сформулировать вопрос иначе: «Что происходит с системой образования и институтами в преддверии наступления эпохи постправды?» Количество книг, которые читают студенты, в среднем уверенно снижается каждый год начиная со второго класса. Пятнадцать лет назад Департамент образования Соединенных Штатов обнаружил, что один из пяти взрослых американцев не может даже найти информацию в тексте, не говоря уже о том, чтобы мало-мальски проанализировать его и сделать выводы. По-видимому, мы не сумели обучить наших детей тому, что такое доказательство и как его оценивать. Наше возмущение оправданно. Эдгар Уэлч, стрелок из Comet Ping Pong, рассказал властям, что поверил в эту историю после того, как прочитал о ней в интернете. Наша информационная инфраструктура могущественна. Она может приносить пользу, но может и причинять вред. И каждый из нас должен знать, где одно, а где другое.
Возможно, Уэлч относился к ситуации исходя из этой амбивалентности, однако никаких доказательств, что какое-либо расследование вообще имело место, нет. Похоже, этот невежда даже не знает, что значит собирать и оценивать доказательства. В таком случае кто-нибудь мог намеренно поискать связь между Хиллари Клинтон и рестораном, увидеть в поведении Клинтон интерес к ведению секс-бизнеса и даже мотив, подтолкнувший ее извлечь из этого выгоду (конечно, она не могла быть финансовой, если вспомнить недавнюю суматоху, связанную с гонораром за ее выступления). Он мог заметить, выходили ли дети, занимавшиеся проституцией, и их клиенты из заведения. А за неимением необходимого склада ума и образования для проведения собственного расследования можно почитать профессионалов, занимающихся расследовательской журналистикой, и поинтересоваться, как они видят ситуацию. Ни один преданный профессии журналист не поверит в эту историю, что уже говорит о многом. При этом я прекрасно понимаю, что есть люди, которые считают журналистов коррумпированными и утверждают, будто те продались правительству.
Бюро трудовой статистики Соединенных Штатов сообщает, что в стране насчитывается 45 790 репортеров и корреспондентов. По оценкам Американского общества новостных редакторов, являющегося независимой торговой группой, 32 900 репортеров работают в 1400 газетных изданиях, выходящих ежедневно. Некоторые журналисты могут быть коррумпированы, но при таком количестве весьма маловероятно, что все.
Facebook прилагает все усилия, чтобы оправдать свои социальные обязанности как источник информации, «с помощью которого 1,8 миллиарда пользователей могут сообщать выдуманные новости». Иными словами, распространять ложь.
Возможно, когда-нибудь в будущем и другие социальные сети будут играть стратегически более важную роль. По крайней мере мы можем надеяться, что их роль в том, что ложь используют в качестве оружия, уменьшится.
Многие новостные организации изучали, откуда взялась история о растлении малолетних в той пиццерии. Компания NBC сообщила о процветающем сообществе, распространяющем «выдуманные новости», в Велесе, Македония, — оно вполне могло быть источником. До 1991 года этот регион относился к коммунистической Югославии. Новостная медиакомпания BuzzFeed совместно с газетой Guardian обнаружила более сотни появившихся там поддельных названий новостных доменов. Молодые люди из Велеса, не имеющие никакого отношения к политическим партиям Соединенных Штатов, сочиняют лживые истории, реклама которых хорошо оплачивается по принципу «пенни за клик» на таких платформах, как Facebook. Подростки могут зарабатывать тысячи долларов в городах с небольшими экономическими возможностями. Должны ли мы винить их за выстрелы в пиццерии? Или это вина социальных сетевых платформ? Или виновата образовательная система, воспитавшая граждан, не умеющих осмысливать заявления, с которыми мы сталкиваемся каждый день?
Вы можете возразить: «Но я не обязан критически оценивать статистику. Есть газеты, блогеры, правительство, Википедия, которые должны делать это за нас». Да, должны, но не всегда могут, им становится все труднее и труднее поспевать проверять информацию, так как ложь размножается быстрее, чем они могут с ней справиться. Это как компьютерная игра «Убей крота». Репортаж о пиццагейте собрал более миллиона просмотров, в то время как материалы по разоблачению этой истории, собранные сайтом Snopes, просмотрели менее 35 тысяч человек. Нам очень повезло, что в США свободная пресса, — исторически у большинства наций было намного хуже. Но мы не должны принимать свободу, честность и принципиальность СМИ как должное. Журналисты и те компании, которые им платят, будут и дальше помогать нам выявлять и разоблачать обман, но они не смогут делать это в одиночку — ложь победит, если доверчивое и неподготовленное общество окажется готово эту ложь принять.
Конечно, большинство из нас не поверили бы, что Хиллари Клинтон могла управлять подобным притоном в Вашингтоне. Данная книга не только о такого рода нелепостях. Действительно ли вам нужно это новое лекарство или же миллиардная маркетинговая кампания, стоящая за ним, раскручивает вас на покупку с помощью тщательно отобранных псевдоданных? Как нам узнать, действительно ли виновен человек, оказавшийся в суде? Как оценить ту или иную инвестицию или объем противоречивых данных, полученных в результате голосования? Что остается за пределом наших когнитивных способностей просто потому, что нам предоставили недостаточно информации?
Лучшая защита против хитрых и изворотливых людей — умение критически мыслить. Нам не удалось объяснить детям, как бороться со склонностью к доверчивости, подаренной нам эволюцией. Мы — социальный вид и склонны верить тому, что нам говорят. Наш мозг — такой механизм, который прекрасно придумывает и рассказывает истории: если нам дать оригинальную идею, мы можем легко придумать заковыристое объяснение, почему она хороша. Но в этом и заключается различие между образным и критическим мышлением, между ложью и истиной: истина подкрепляется фактами, объективными доказательствами. Некоторые утверждения могут быть истиной, но истинные утверждения истинны всегда.
В ходе изучения Стэнфордским университетом умения пользователей рассуждать относительно информации из интернета за полтора года (вплоть до июня 2016-го) было протестировало более 7800 учеников старших классов школы и студентов колледжа. Исследователи ссылаются на «потрясающую и вместе с тем тревожную тенденцию. В целом умение молодых людей рассуждать об информации из интернета можно обозначить одним словом: „никакое“». Они с трудом могли отличить новости высокого качества от лжи. Мы должны начать учить их этому незамедлительно. И пока часть из нас занята этим, другая часть может пойти на курсы повышения квалификации. К счастью, мышление, в основе которого лежит работа с фактами, доступно для большинства 12-летних.
Многие говорили, что история про пиццагейт была одним из примеров «выдуманных новостей», но давайте называть вещи своими именами — это была наглая ложь. В выдуманных новостях нет «новости» как таковой. Вера в ложь может быть безобидной, так же как и вера в Санта-Клауса или в то, что новые джинсы меня стройнят. Не СМИ и не Facebook делают ложь инструментом воздействия на умы. Опасность заключается в силе убеждения — в чрезмерной, безоговорочной уверенности в том, что это правда.
Критическое мышление учит нас смотреть на ситуацию немного со стороны, оценивать факты и делать выводы, основываясь только на них. То, что заставило Уэлча расчехлить огнестрельное оружие в вашингтонской пиццерии, стало следствием его полной неспособности понять, что его взгляд на проблему был в корне неправильным. Самый важный компонент критического мышления, которого так не хватает в нашем обществе, — смирение. Это простая, но очень глубокая мысль: если мы поймем, что знаем далеко не всё, то сможем узнать больше. Если мы будем думать, что знаем всё, научиться чему-нибудь будет невозможно. Так получилось, что наша система образования, равно как и наша зависимость от интернета, привели к появлению поколения, которое не знает, что оно не знает. Если мы смиримся с этим и примем как правду, то сможем воспитать американский ум, вернуть былую образованность и обезвредить огромное количество лжи, ставшей орудием воздействия на умы и угрожающей нашему миру. Это единственная возможность добиться процветания демократии.
Три вида стратегической защиты
Я начал писать эту книгу в 2001 году, пока читал в колледже курс по критическому мышлению. Я усердно работал над ней в период с 2014 по 2016 год, книга вышла под названием A Field Guide to Lies и имела несколько другое введение. С тех пор, однако, опасность, равно как и охват действия лжи, стали просто ошеломляющими. Теперь уже ложь — это не то, о чем можно говорить с сарказмом в голосе или над чем можно похихикать. Она стала оружием. И опасность эта, возможно, будет только усиливаться и приведет к проблемам, которых мы не знали на протяжении многих поколений. Может, однако, случиться и так, что она пройдет стороной и не будет иметь никаких серьезных последствий. В любом случае инструменты, предложенные на страницах этой книги, — такие же, как и в первом издании: они не зависят от политических, социальных и экономических веяний.
Часто проблема заключается в том, каким источником вы пользуетесь. В старину бумажные книги и новостные статьи вызывали доверие, в отличие от отсебятины, которую какой-нибудь псих мог напечатать в подвале на домашней пишущей машинке. Интернет, конечно же, все изменил. Фальшивый сайт может выглядеть так же подлинно, как и авторитетный, проверяющий факты, — я приведу позже несколько примеров. Дезинформация чертовски плотно переплетена с информацией настоящей, из-за чего становится трудно отличить одно от другого. А еще дезинформация не структурирована — она объединяет людей самых разных социальных слоев, имеющих самое разное образование, и появляется в местах, где вы и не ожидали ее увидеть. Ложные данные переходят от одного человека к другому, публикуются в Twitter, Facebook, Snapchat, Instagram, Tumblr и других социальных сетях, получая таким образом глобальное распространение. Дезинформация может завладеть миром — и получится так, что люди вдруг начнут верить в то, что на самом деле неправда.
Это книга о том, как разрешать с помощью тех фактов, которые вам встречаются, затруднения, которые могут привести вас к неправильным выводам. Иногда те, кто предлагает вам какие-то факты, так и ждут, что вы сделаете неверное заключение. Иногда они и сами не видят разницы. Сегодня информацию можно получить практически мгновенно, государственные лидеры появляются в ваших социальных сетях, сигналы об «экстренных сообщениях» привлекают ваше внимание ежедневно, даже ежечасно. Но где найти время, чтобы определить, не содержатся ли в новостях псевдофакты, искажения данных или откровенная ложь? Нам нужны эффективные стратегии, чтобы понимать, стоит ли доверять тому, что нам говорят.
За последние пять лет мы создали больше искусственной информации, чем за всю предшествующую историю человечества. К сожалению, наряду с истинным знанием есть много того, что знанием назвать нельзя: сайты, видео, книги и социальные сети. И это не просто новая проблема. Дезинформация известна человечеству на протяжении тысячелетий, о ней говорили в библейские времена, существовала она и в Классической Греции (V–IV вв. до н. э.)[1]. Уникальная проблема, с которой мы столкнулись сегодня, состоит в том, что дезинформация очень быстро распространяется, а ложь может стать мощным инструментом в формировании социальной и политической стратегии, ошибочных путей развития которых мы могли бы избежать.
В последующих главах я объединил эти стратегии в категории. Часть 1 этой книги посвящена числовой дезинформации. Она показывает, как неправильное обращение со статистикой и графиками искажает перспективу и заставляет нас делать ошибочные выводы (а также принимать необоснованные решения). В части 2 я исследую ошибочные аргументы, показывая, как легко быть убедительным, рассказывать истории, которые, пусть ненавязчиво, уводят от фактов. Кроме того, в книге описываются способы, помогающие критически оценивать новости, рекламу, отчеты. Последняя часть раскрывает, что лежит в основе нашей способности определять, что есть истина, а что ложь: научный метод. Это лучший из когда-либо созданных инструментов для разгадывания самых сложных тайн. Он отсылает нас к таким великим мыслителям в истории человечества, как Аристотель, Бэкон, Галилей, Декарт, Земмельвайс и Поппер. В этой части книги я говорю о границах наших знаний, о том, что мы можем и чего не можем знать, в том числе о том, что мы знаем на данный момент и чего пока еще не знаем. Я предлагаю ряд конкретных примеров применения логического мышления в совершенно разных условиях: во время дачи свидетельских показаний в зале суда, при принятии медицинских решений, в магии, в отношении современной физики и теорий заговора.
Мыслить критически не значит ставить под сомнение все подряд — это значит пытаться различать те утверждения, что имеют под собой доказательства, и те, что не обоснованы.
Фанаты статистики и графиков умеют обманывать с их помощью, потому что знают: большинство людей не станут вникать в то, как работают диаграммы. Возможно, этим людям даже кажется, что они недостаточно умны. Но любой человек может с этим разобраться, и как только вы поймете самые базовые принципы работы с графиками, диаграммы быстро раскроют вам свою изящность — или уродство.
Возьмем приведенный ранее пример о том, что количество книг, которые читают учащиеся, начиная со второго класса неуклонно снижается с каждым годом. Как следствие можно говорить о том, что наша система образования испортилась: у детей не вырабатывается полезная привычка к обучению, их не волнует саморазвитие, они не вовлечены в процесс интеллектуально. А теперь остановитесь и задайте себе вопрос: а можно ли считать количество прочитываемых книг адекватным мерилом? Можем ли мы с его помощью делать выводы на эту тему? Второклассники обычно читают очень короткие рассказы, и объем книг увеличивается с возрастом. К средней школе дети могут прочесть «Повелителя мух» (две сотни страниц), а к колледжу — «Войну и мир» (1225 страниц). Возможно, следует оценивать количество прочитанных страниц или то время, которые было проведено за чтением. К моменту окончания школы или уже работая в таких сферах, как юриспруденция, управление, промышленность, финансы и наука, люди могут читать меньше художественных книг, но больше сухих научных статей. Если чиновник не читал никаких книг, но тратил время на изучение Конституции, законов, читал журналы и газеты, можно ли сказать, что он не вовлечен в процесс интеллектуально? Тот факт, что в каком-то материале приводятся статистические данные, не означает, что они имеют отношение к теме статьи. Более того, это исследование, похоже, было проведено компанией, разрабатывающей и продающей программное обеспечение для улучшения читательских навыков, — ребята извлекли выгоду из сообщений о низком уровне чтения. Вот оно, критическое мышление в действии.
Обнаружение ошибочных аргументов, представляющих собой часть каких-то историй, поможет вам оценить, ведет ли цепь рассуждений к обоснованным выводам. Информационная грамотность включает знание о том, что существует иерархия источников, что псевдофакты могут легко маскироваться под истины, а предвзятое отношение — искажать информацию, из-за чего мы делаем неверные выводы и приходим не к тем результатам. Иногда доказательства опираются на числа, и тогда мы задаемся вопросом: «Откуда они взялись? Как они были собраны?» Бывает, цифры выглядят нелепо, но для того чтобы это увидеть, нужно хорошенько над ними поразмыслить. Иногда утверждения кажутся обоснованными, однако исходят из источника, который не заслуживает доверия, как в случае с человеком, заявляющим, что он свидетель преступления, хотя на самом деле его там не было. Благодаря этой книге вы научитесь распознавать неправду[2]. И остановите пройдох, ставших на путь обмана.
ЧАСТЬ 1. ОЦЕНКА ЦИФР
Проблемы вам создает не то, чего вы не знаете, а скорее то, в чем вы абсолютно уверены, тогда как на самом деле заблуждаетесь.
Марк Твен
Правдоподобие
Статистика — это цифры, а потому она кажется нам холодной и жесткой. Есть ощущение, что она отражает факты, которые нам дала сама природа, и наше дело всего лишь их найти. Но важно помнить, что собирают статистические данные люди, и никто иной. Люди выбирают, что считать, как считать, какими результатами делиться, какими словами их описывать и как интерпретировать числа[3]. Статистика — это не факты, это интерпретация. И ваша интерпретация может быть такой же хорошей (равно как и такой же плохой), как и та, что вам предлагает другой человек.
Числа не всегда верны, и для начала проще всего быстренько проверить их на правдоподобие. Даже если они прошли проверку, у вас могут возникнуть вопросы трех типов: как данные были собраны, как они были интерпретированы и как представлены графически. Ответы на них помогут вам сформулировать правильные выводы.
Вы можете проверить (в большинстве случаев это возможно), правдоподобен ли факт, в уме или на оборотной стороне конверта. Не принимайте все на веру, попытайтесь разобраться.
Когда мы проводим подобную проверку, точность цифр не очень важна, как бы парадоксально это ни звучало. Достаточно просто здравого смысла: если Берт говорит, что хрустальный бокал упал со стола на ковер и не разбился, это кажется правдоподобным. Если Эрни скажет, что бокал упал с высоты 40-этажного здания на тротуар, не разбившись, это уже будет неправдоподобно. Тут вам помогут знания о том, как устроен мир, а также элементарный жизненный опыт. Подобным же образом, если кто-то вам скажет, что ему 200 лет, или что он постоянно выигрывает в рулетку в Лас-Вегасе, или что он может пробежать 40 миль за час, — все это будет маловероятно и очень неправдоподобно.
Что вы скажете о следующем заявлении?
Все 35 лет после того, как в Калифорнии перестал действовать закон о марихуане, число курильщиков марихуаны удваивается с каждым годом.
Звучит правдоподобно? Давайте разберемся, но с чего же начать? Предположим, что 35 лет назад в Калифорнии был только один курильщик марихуаны — конечно, очень заниженная оценка (в 1982 году по всей стране было полмиллиона арестов за курение марихуаны). Если ежегодно удваивать это число на протяжении 35 лет, получим 17 миллиардов человек — это больше, чем население всего земного шара. (Попробуйте подсчитать сами, и вы увидите, что ежегодное удвоение в течение 21 года приведет вас к числу больше миллиона: 1; 2; 4; 8; 16; 32; 64; 128; 256; 512; 1024; 2048; 4096; 8192; 16 384; 32 768; 65 536; 131 072; 262 144; 524 288; 1 048 576.) Таким образом, это утверждение не то чтобы неправдоподобно — оно попросту невозможно. К сожалению, не у всех получается мыслить четко и ясно, когда речь заходит о числах: многие их просто боятся. Но, как видите, для подобных подсчетов хватит и школьного уровня арифметики плюс здорового скепсиса.
Вот еще один пример. Вас только что взяли в отдел продаж по телефону, и вам нужно обзванивать ничего не подозревающих (и, без сомнения, раздраженных) потенциальных клиентов. Ваш босс, пытаясь вас мотивировать, говорит:
Наш лучший специалист продавал тысячу товаров в день.
Правдоподобно ли это? Попробуйте сами набрать телефонный номер — самое меньшее вам понадобится пять секунд. Плюс еще пять секунд на то, чтобы дозвониться. Теперь давайте предположим, что каждый звонок действительно заканчивается продажей, — это, понятное дело, не очень реалистично, но давайте представим идеальный вариант, чтобы посмотреть, что получится. Добавьте десять секунд: вы проговорите предложение о продаже, а потенциальный клиент его примет. Затем еще 40 секунд, чтобы узнать у него адрес и записать номер кредитной карточки. Это дает один звонок в минуту (5 + 5 + 10 + 40 = 60 секунд), или 60 продаж в час, или 480 продаж за очень напряженный восьмичасовой рабочий день, без перерывов. Так что тысяча товаров, проданных за день, — это нереально, даже при самом оптимистичном раскладе.
Некоторые утверждения оценивать сложнее. Вот, например, заголовок из журнала Time за 2013 год:
Людей с мобильными телефонами больше, чем тех, у кого есть туалет[4].
И как быть с таким утверждением? На ум приходят, с одной стороны, жители развивающихся стран, не имеющие водопровода, а с другой стороны — те многочисленные жители процветающих стран, у кого больше одного мобильного телефона. Кажется, что заявление вполне правдоподобно, — это не означает, однако, что мы должны его принять. Скорее, мы не можем отвергать его просто потому, что оно нелепо. Нам потребуются другие техники для его оценки, но тест на правдоподобие оно прошло.
Иногда нельзя оценить, правдиво ли утверждение, не проведя собственного исследования. Да, конечно, газеты и сайты в интернете должны бы делать это за вас, но так бывает не всегда — вот тогда статистика идет вразнос. Несколько лет назад было очень распространено вот такое утверждение, основанное на статистических данных:
Каждый год в США от анорексии умирает 150 тысяч девушек и молодых женщин[5].
Хорошо, давайте проверим, насколько этот факт правдоподобен. Согласно данным американских Центров по контролю и профилактике заболеваний, ежегодное количество смертей девушек и молодых женщин в возрасте от 15 до 25 от всех видов заболеваний — 8500. Добавьте сюда женщин от 25 до 45 — показатель все равно достигнет только 55 тысяч[6]. Количество случаев смерти от анорексии за год не может превышать в три раза количество всех смертей[7].
В своей статье для журнала Science Луи Поллак и Ганс Вайс сообщили, что с момента образования Communication Satellite Corp.
…расходы на телефонные разговоры снизились на 12 тысяч процентов[8].
Если расходы уменьшаются на 100 %, они падают до нуля (и не важно, какими они были изначально). Если же расходы падают на 200 %, это значит, что кто-то платит вам ту же самую сумму, которую когда-то платили вы ему, чтобы получить его продукт. Снижение на 100 % случается крайне редко, а снижение на 12 тысяч процентов кажется и вовсе маловероятным[9]. В статье в профессиональном издании Journal of Management Development утверждалось, что количество клиентских жалоб сократилось на 200 % в результате перехода компании на новую политику поддержки клиентов[10].
Писатель Дэн Кеппел даже назвал свою книгу Get What You Pay For: Save 200 % on Stocks, Mutual Funds, Every Financial Need («Получите то, за что вы платите: экономьте 200 % на бирже, инвестиционных фондах открытого типа, на любой финансовой потребности»). У Кеппела есть степень MBA. Ему следует лучше разбираться в вопросе. Конечно, чтобы аккуратно сравнивать проценты, их нужно брать от одного и того же базового показателя. Нельзя вернуться к изначальному уровню зарплаты, сокращенной на 50 %, увеличив на 50 % вашу новую, более низкую зарплату[11].
Проценты кажутся простыми и логичными, но иногда они могут и запутать. Если процентная ставка увеличивается с 3 до 4 процентов, то она увеличивается на 1 процентный пункт, или на 33 % (так как увеличение на 1 процентный пункт отсчитывается от базового показателя 3; это увеличение на 1/3 = 0,33 от 3). Если же процентная ставка упадет с 4 до 3 процентов, то она уменьшится на 1 процентный пункт. При этом она уменьшится не на 33 %, как в предыдущем случае, а на 25 %, потому что уменьшение на 1 процентный пункт отсчитывается от базового показателя 4 (1 — это 1/4, или 25 %, от 4). Исследователи и журналисты не всегда щепетильны в этом вопросе и не видят порой разницы между процентными пунктами и процентами, но вы не должны их путать[12].
The New York Times сообщила о закрытии текстильной фабрики в Коннектикуте и ее переезде в Вирджинию[13]. Причиной такого решения стали возросшие расходы на сотрудников. По сведениям газеты, «фонд заработной платы, все виды компенсации сотрудникам, а также пособие по безработице в Коннектикуте в 20 раз выше, чем в Вирджинии». Правдоподобно ли это? Если бы это было так, вы бы, наверное, ожидали массового исхода в Вирджинию — все компании, а не только эта фабрика, захотели бы переехать, и вы бы уже знали об этом. На самом деле все это неправда, и Times пришлось опубликовать опровержение. Как же такое могло произойти? Дело в том, что журналистка просто неправильно прочла отчет компании. Один показатель — пособие по безработице — на самом деле обходился компании в 20 раз дороже в Коннектикуте, чем в Вирджинии, но с учетом остальных показателей в Коннектикуте все расходы на содержание штата были в целом выше в 1,3 раза, а не в 20 раз. У автора статьи не было образования в сфере бизнес-администрирования — и мы не вправе ожидать этого. Чтобы отследить такого рода ошибку, нужно просто спокойно все обдумать. Это под силу каждому (а журналистка и ее редакторы просто обязаны были это сделать).
В Нью-Джерси одобрили новую законодательную инициативу, согласно которой матери, находящиеся на социальном обеспечении, не получали никаких дополнительных льгот[14]. Некоторые члены законодательного органа посчитали, что женщины в Нью-Джерси специально рожали детей, чтобы увеличить ежемесячное пособие, получаемое от государства. Через два месяца законодатели заявили, что им удалось решить этот вопрос, так как уровень рождаемости снизился на 16 %. Вот что писала New York Times:
Всего два месяца спустя государство опубликовало данные о том, что количество новорожденных детей у женщин, уже находящихся на социальном обеспечении, уменьшилось на 16 %[15]. Власти поздравляют себя с потрясающими результатами, которых они добились в такие короткие сроки.
Обратите внимание, что учитывались не беременности, а количество родов. Что же здесь не сходится? Так как беременность длится девять месяцев, никакие изменения за последние два месяца нельзя связывать напрямую с законом. Скорее всего, тут свою роль играют обычные колебания рождаемости (ведь известно, что уровень рождаемости — дело сезонное).
Есть в этом вопросе и другие неточности, которые нельзя обнаружить простой проверкой на правдоподобие:
…с течением времени эти 16 % сократились до 10 %. Дело в том, что государству стало известно о родах, о которых не сообщалось ранее. Оказалось, что многие роженицы не считали нужным сообщить о своих новорожденных детях, так как их социальные дотации на период ухода за ребенком никак не увеличивались[16].
Вот вам пример того, с какими проблемами можно столкнуться, собирая статистические данные: оказывается, мы учитываем не всех людей, хотя думаем, что охвачены все. Одни ошибки в рассуждениях заметить проще, другие сложнее, но со временем мы лучше научимся их распознавать. Для начала давайте взглянем на простой инструмент, который часто используют неверно.
С помощью круговой диаграммы легко представить себе процентные соотношения — то, каким образом распределены разные части единого целого. Например, вы хотите узнать, какой процент школьного бюджета тратится на зарплаты учителям, на учебные материалы, на ремонт. Или же вам хочется выяснить, какая часть денег, ассигнованных на учебные материалы, идет на естественные науки, язык, физкультуру, музыку и т. д. Главное правило круговых диаграмм — сумма процентов во всех секторах должна быть равна 100. Представьте себе пирог: ведь круговая диаграмма — не что иное, как пирог, поделенный на кусочки. Если девять человек хотят разделить его поровну, мы не можем порезать его на восемь частей. И тут ничего нельзя поделать.
Fox News, однако, это не смутило, и они опубликовали вот такую диаграмму:
Главное правило круговых диаграмм: сумма процентов во всех секторах должна быть равна 100. (Fox News, 2010)
Можно легко объяснить, как такое могло произойти. У избирателей есть возможность отдать свой голос более чем за одного кандидата. Однако в таком случае нельзя представлять результаты в виде круговой диаграммы.
Чехарда со средними
Среднее значение может быть весьма полезно, да и разобраться с ним проще, чем с круговой диаграммой. Оно позволяет нам охарактеризовать огромное количество информации одним-единственным числом. Например, мы хотим узнать среднее благосостояние людей в комнате, чтобы понять, принесет ли встреча с ними какую-нибудь пользу нашим фандрайзерам{1} или менеджерам по продажам. Другой пример: мы хотим узнать среднюю цену на бензин, чтобы оценить, во сколько обойдется поездка на машине из Ванкувера в Банф. Однако средние могут быть обманчиво сложными.
Есть три вида средних, и они могут выражаться разными числами. Поэтому те, кто всерьез занимается статистикой, избегают слова «среднее», отдавая предпочтение другим, более точным терминам, как то: среднее арифметическое, медиана или мода. И только так. Иногда все эти величины совпадают, но чаще они различаются. Если вам встретилось слово «среднее», оно, как правило, означает «среднее арифметическое», но нельзя быть в этом абсолютно уверенным.
Чаще других из этих трех встречается среднее арифметическое; оно равно сумме всех данных, поделенной на их количество. Например, среднее благосостояние всех людей, находящихся в комнате, будет равно их общему благосостоянию, поделенному на количество человек. Если в комнате находится десять человек, состояние каждого из которых оценивается в 100 тысяч долларов, то общее богатство составит миллион. Отсюда легко вычислить среднее арифметическое (даже доставать калькулятор не нужно): 100 тысяч долларов. А если состояние каждого присутствующего будет варьироваться от 50 тысяч до 150 тысяч долларов, но общее количество будет по-прежнему миллион, то среднее арифметическое по-прежнему будет 100 тысяч долларов (потому что мы просто разделим миллион на десять, не принимая во внимание, сколько денег на счете у каждого).
Медиана — это число в середине упорядоченного набора чисел (статистики называют его выборкой): половина данных находится ниже этого значения, а половина выше. Как вы помните, смысл среднего значения в том, чтобы охарактеризовать весь объем данных одним-единственным числом. Медиана лучше с этим справляется, если некоторые из ваших данных уж очень отличаются от большинства, статистики называют такие значения выбросами.
Представим себе комнату, в которой находятся девять человек; состояние восьмерых из них равно примерно 100 тысяч долларов, а один находится на грани банкротства, его долг равен 500 тысячам долларов. Вот что у нас получится:
Человек 1: –500 тыс. долл.
Человек 2: 96 тыс. долл.
Человек 3: 97 тыс. долл.
Человек 4: 99 тыс. долл.
Человек 5: 100 тыс. долл.
Человек 6: 101 тыс. долл.
Человек 7: 101 тыс. долл.
Человек 8: 101 тыс. долл.
Человек 9: 104 тыс. долл.
Теперь складываем все показатели и получаем общую сумму в 299 тысяч долларов. Разделим это число на общее количество участников, девять, и получится, что среднее арифметическое равно 33 222 долларам. Создается, однако, впечатление, что среднее арифметическое — не лучший способ охарактеризовать данные о присутствующих. Смею предположить, что фандрайзер не захочет наносить им визит, если среди них найдется человек с показателем-выбросом, который тянет вниз всю группу. В этом и заключается вся трудность работы со средним арифметическим: оно слишком чувствительно к выбросам.
Медиана здесь равна 100 тысячам долларов: четверо зарабатывают меньше этой суммы, а четверо — больше. Мода равна 101 тысяче долларов — это та цифра, которая появляется намного чаще других. И медиана, и мода в этом конкретном примере оказываются гораздо показательнее.
Можно по-разному использовать средние, особенно если вы хотите, чтобы кто-то увидел в ваших данных то, что нужно вам.
Давайте представим, что вы с двумя друзьями запустили стартап — небольшую компанию, в которой работают пять человек. Сейчас конец года, вы собираетесь подвести финансовые итоги и рассказать сотрудникам, как у компании идут дела, чтобы они почувствовали удовлетворение от долгих часов, проведенных в офисе, и от холодной пиццы, съеденной за это время. А еще вы хотите привлечь инвесторов. Скажем, четверо сотрудников — все программисты — за год заработали по 70 тысяч долларов, а один — офис-менеджер — 50 тысяч. Это даст среднее арифметическое зарплат, равное 66 тысячам долларов в год: сумма (4 × 70 000) + (1 × 50 000), поделенная на 5. Вы и двое ваших друзей принесли домой по 100 тысяч долларов — это ваша зарплата. Следовательно, общая сумма выплаченных зарплат составит (4 × 70 000) + (1 × 50 000) + (3 × 100 000) = 630 тысяч долларов. Кроме того, пусть ваша компания принесла 210 тысяч долларов чистого дохода, который вы разделили поровну между собой и соучредителями в качестве бонусов, это дает каждому из вас по 100 тысяч + 70 тысяч. Как вы им об этом сообщите?
Вы могли бы сказать:
средняя зарплата сотрудников составляет 66 тысяч долларов;
средняя зарплата + прибыль владельцев составляет 170 тысяч долларов.
И хотя это правда, вряд ли новость понравится кому-нибудь, кроме вас и вашей мамы. Если ваши подчиненные прознают об этом, то решат, что им существенно недоплатили. А потенциальные инвесторы сочтут, что учредителям платят слишком много. Поэтому вы можете оформить отчет по-другому:
средняя зарплата сотрудников составляет 66 тысяч долларов;
средняя зарплата владельцев составляет 100 тысяч долларов;
прибыль: 210 тысяч долларов.
Для потенциальных инвесторов это выглядит убедительнее, тем более что им можно и не говорить о том, что вы поделили прибыль между совладельцами. А сотрудникам последнюю строку можно и вовсе не показывать. Каждый из четырех программистов будет думать, что он на хорошем счету и его ценят, так как зарабатывает он больше, чем большинство. Единственный, кто будет не очень доволен, — ваш офис-менеджер. Но ведь девушка и раньше понимала, что программисты зарабатывают больше нее. Теперь представим: вы чувствуете, что перегружены работой, и хотите уговорить ваших партнеров, которые не сильны в критическом мышлении, что вам нужно нанять еще сотрудников. Вы можете поступить так же, как в таком случае делают многие компании, и заявить о «прибыли на одного сотрудника», поделив прибыль компании, равную 210 тысячам долларов, на пятерых:
средняя зарплата сотрудника: 66 тысяч долларов;
средняя зарплата владельцев: 100 тысяч долларов;
годовая прибыль на одного сотрудника: 42 тысячи долларов.
Теперь вы можете заявить, что 64 % зарплаты, которую вы выплачиваете своим сотрудникам (42 000 / 66 000), возвращаются к вам в виде прибыли, и это означает, что в итоге, получив прибыль, вы должны будете выплатить только 36 % их зарплат. Конечно, эти данные не свидетельствуют о том, что, наняв еще сотрудников, вы увеличите прибыль. Но в глазах того, кто не очень силен в критическом мышлении, это выглядит как весомый довод для увеличения штата.
А что, если вы хотите выглядеть невероятно честным и справедливым работодателем и показать, что разница между вашей прибылью и зарплатой ваших сотрудников довольно разумна? Возьмите прибыль в 210 тысяч долларов и разделите часть этой суммы, 150 тысяч долларов, в качестве бонуса между собой и своими партнерами. Об оставшихся 60 тысячах вы скажете позже, что это и есть «прибыль». На этот раз подсчитайте среднюю зарплату, включив в эти подсчеты себя и своих партнеров вместе с бонусами:
средняя зарплата: 97 500;
средняя прибыль владельцев компании: 20 тысяч.
А теперь повеселимся по-настоящему:
общие выплаты зарплат плюс бонусы: 840 тысяч;
зарплаты: 780 тысяч;
прибыль: 60 тысяч.
Теперь все выглядит разумно, правда? Из всей суммы в 840 тысяч долларов, включающей зарплату и прибыль, только 60 тысяч, или 7 %, составили личную прибыль владельцев. Ваши сотрудники будут думать, что вы безупречны, — кто станет обвинять владельца компании в том, что он присвоил 7 %? По сути, это ведь не так уж много: 7 % делится между владельцами компании поровну, и каждый получает по 2,3 %. Да тут даже возразить нечего!
А можно придумать и кое-что получше. Представьте, что в первый год существования вашей компании у вас были только сотрудники, работавшие неполный день. Они зарабатывали по 40 тысяч в год. На второй год у вас были только сотрудники, работавшие полный день. И они получали 66 тысяч, о которых говорилось выше. В таком случае вы со всей уверенностью можете заявить, что в среднем заработок каждого сотрудника увеличился на 65 %. Вы — великий предприниматель! Правда, вы замалчиваете тот факт, что сравниваете две несопоставимые вещи: работу на неполный и полный рабочие дни. Могу сказать, что в этом вы не первый: американская корпорация по производству стали U. S. Steel додумалась до этого еще в 1940-х годах.
В уголовном судопроизводстве то, как представлена информация, т. е. фрейминг{2}, оказывает сильное воздействие на мнение присяжных относительно виновности подсудимого. Хотя математически эти два утверждения эквивалентны[17], фраза: «Вероятность того, что обнаруженная на месте преступления кровь совпадет с кровью подозреваемого, если только это действительно не его кровь, составляет всего 0,1 %» (один к тысяче) гораздо убедительнее, чем заявление: «Кровь одного человека из каждой тысячи жителей Хьюстона тоже соответствует найденной».
Средние часто используют для того, чтобы рассказать о результатах, например «один брак из X случаев заканчивается разводом». Но это не означает, что статистика применима к вашей улице, к вашему бридж-клубу или к вашему знакомому. Брак либо закончится разводом, либо нет, но нужно знать определенные факторы уязвимости, чтобы предсказать, кто действительно разведется, а кто нет.
Еще один пример: вы можете прочитать, что один из пяти новорожденных детей — китаец. Вы подмечаете, что у шведского семейства, живущего на вашей улице, уже есть четверо детей, а сейчас они ждут пополнения. Но это не означает, что в семье родится маленький китаец. Среднее значение вычислено по всем рождениям в мире, а не в конкретной семье, в конкретном доме, в конкретном районе или даже стране.
Будьте осторожны со средними, а также с тем, как их интерпретируют. Один из способов ввести в заблуждение, используя средние, — усреднять данные по выборкам из несопоставимых совокупностей. Этот способ может привести к абсурдным выводам, как то:
В среднем у каждого человека одно яичко[18].
Этот пример наглядно показывает разницу между средним арифметическим, медианой и модой. Так как женщин в мире несколько больше, чем мужчин, медиана и мода будут равны нулю, в то время как среднее арифметическое будет близко к единице (возможно, оно будет равно 0,98 или около того).
Кроме этого, нужно быть внимательным и помнить, что среднее ничего не говорит о размахе значений. Средняя годовая температура в Долине Смерти в Калифорнии равна 25 °C, что считается комфортным. Но размах может быть просто убийственным, с колебанием температуры от –9 до 57 °C, — факт, зафиксированный приборами[19].
Или… Я мог бы вам сказать, что в среднем благосостояние сотни людей, находящихся в комнате, составляет колоссальную сумму: 350 миллионов долларов. Вы, наверное, думаете: вот бы отправить туда моих лучших менеджеров по продажам. Но в комнате могут находиться Марк Цукерберг (его состояние оценивается в 25 миллиардов долларов{3}) и 99 бедняков. Таким образом, средний показатель может размыть разницу в важных показателях.
Если вы работаете со средними, остерегайтесь еще бимодального распределения. Вспомните, мода — это то значение, которое встречается чаще всего. Во многих наборах данных — биологических, физических, социальных — у распределения может быть два или больше пиков. А это значит, что два или больше показателей встречаются чаще других.
Например, подобный график может отображать сумму, потраченную на обеды в неделю (ось X), и количество людей, потративших такую сумму (ось Y)[20]. Представьте, что вы изучали две группы людей: детей (левый горб) — они покупают школьные обеды — и руководителей компаний (правый горб) — они ходят в дорогие рестораны. Среднее арифметическое и медиана в данном случае — это числа где-то между этими двумя горбами, и они ничего не скажут нам о том, что происходит на самом деле, — ведь во многих случаях среднее арифметическое и медиана отражают ту сумму, которую никто не тратит. Подобный график говорит лишь о том, что в вашем примере имеет место неоднородность — вы сравниваете яблоки с апельсинами. В таком случае лучше сразу сказать, что вы имеете дело с бимодальным распределением, и сообщить о двух модах. А еще лучше разделить группу на две подгруппы и собрать статистические данные для каждой.
Будьте осторожны, когда будете делать выводы об отдельных людях и о группах, основываясь на средних данных. Тут можно легко наткнуться на определенные подводные камни, которые даже получили собственные названия: «экологическая ошибка» и «ошибка исключения». Экологическая ошибка возникает, если мы делаем выводы об отдельном элементе, основываясь на совокупных данных (таких как средняя величина группы), а ошибка исключения — если делать все ровно наоборот.
Представьте себе, например, два маленьких городка, в каждом из которых живет всего по сотне человек. Девяносто девять жителей города А зарабатывают по 80 тысяч долларов в год, а на земле одной женщины было найдено месторождение нефти, и теперь она одна получает 5 миллионов долларов в год. В городе Б живут 50 человек, которые зарабатывают по 100 тысяч долларов в год, а также 50 человек, которые получают по 140 тысяч долларов. Средний арифметический доход в городе А составляет 129 тысяч долларов, а в городе Б — 120 тысяч долларов. И хотя средняя величина доходов города А больше, в 99 случаях из 100 доход любого жителя города Б, которого вы выберете наугад, будет выше дохода любого случайно выбранного жителя города А. Экологическую ошибку совершают те, кто считает, что если выбрать наугад человека из группы с более высоким средним доходом, то следует ожидать, что и у него доход будет выше. Самое замечательное в этом примере то, что в городе А выше среднее арифметическое, а мода выше в городе B (так бывает не всегда).
Вот еще один пример: считается, что состоятельные люди скорее проголосуют за республиканца, но, как показывает практика, более состоятельные штаты обычно голосуют за демократов. Дело в том, что общая картина благосостояния жителей процветающих штатов может быть немного перекошена из-за суперсостоятельных индивидуумов. Во время президентских выборов 2004 года за кандидата от Республиканской партии Джорджа Буша проголосовали 15 самых бедных штатов, а за кандидата от Демократической партии Джона Керри — девять из 11 самых состоятельных[21]. Если же изучить вопрос более детально, мы увидим, что за Буша отдали голоса 62 % тех, чей годовой доход составляет более 200 тысяч долларов, а за Керри — 36 % голосующих, зарабатывающих в год 15 тысяч долларов или меньше.
Чтобы понять, что такое ошибка исключения, давайте представим себе: вы прочли, что машины марки Volvo считаются самыми надежными, и решили купить такой автомобиль. По дороге в офис этой компании вы проходите мимо механика Volvo и парковки, заполненной машинами этой марки, которые ждут, пока их отремонтируют. Если вы измените свое решение о покупке машины этой марки, основываясь на том, что только что увидели, значит, вы по небольшому числу исключительных данных формируете выводы о целой группе. Никто ведь не говорил, что Volvo вообще не нуждается в ремонте, — скорее речь шла о следующем: вероятность того, что им может понадобиться техническая поддержка, гораздо меньше (отсюда и набившее оскомину предупреждение, которым заканчивается любой рекламный ролик, что «каждая машина индивидуальна»). Обратите внимание, что на вас оказывают огромное влияние и другим образом: единственное место, где должны стоять машины Volvo, требующие ремонта, — автосервис Volvo. Ваш «базовый показатель» сдвинулся, и вы не можете уже считать этот пример случайным.
Сейчас, когда вы уже эксперт по средним, вас не удивит заявление, что 100 лет назад наши предки жили меньше, чем мы сегодня. Возможно, вы читали, что продолжительность жизни в наше время сильно увеличилась. Продолжительность жизни тех, кто родился в 1850 году, была 38 лет для мужчин и 40 для женщин, а у тех, кто родился в 1990-м, она составляет 72 года и 79 лет соответственно[22]. Таким образом, возникает распространенное заблуждение, что в XIX веке было не так много людей в возрасте 50 и 60 лет, потому что они просто не доживали до этого возраста. На самом деле, конечно, доживали — просто детская смертность была такой высокой, что смещала средний показатель. Если человеку удавалось преодолеть возрастной рубеж в 20 лет, то жил он долго. В 1850 году 50-летняя белая женщина могла бы дожить до 73 с половиной лет, а женщина 60 лет — и до 77. По сравнению с 1850-ми годами сейчас продолжительность жизни 50- и 60-летних значительно увеличилась, лет на десять, и произошло это во многом благодаря более качественному здравоохранению.
Но так же, как и в примере с комнатой, полной людей с совершенно разными доходами, изменение средней продолжительности жизни за последние 175 лет отражает большие изменения в структуре населения. В то время уровень детской смертности был гораздо выше, что и снижало среднюю продолжительность жизни. Вот вам парадокс: средний ребенок никогда не рождается в средней семье[23]. Почему? Из-за того, что рассматриваются разные группы. (Я здесь использую понятие «среднее» вместо «среднее арифметическое» из уважения к прекрасной работе, написанной по этой теме Джеймсом Дженкинсом и Терреллом Тьютеном, которые использовали это понятие в заголовке.)
Теперь давайте представим, что вы прочли, будто среднее число детей в семье, живущей где-то в пригороде, равно трем. Скорее всего, вы сделаете вывод, что в среднем у ребенка должно быть двое братьев и сестер. Но это заключение будет неверным. Та же логическая ошибка возникает в случае, если мы спросим, посещает ли средний студент колледжа колледж среднего размера, получает ли средний сотрудник среднюю зарплату или растет ли среднее дерево в среднем лесу. В чем же дело?
Во всех этих случаях меняется точка отсчета — та группа, которую мы изучаем. Когда подсчитывают среднее количество детей в семье, выборка состоит из семей. Независимо от того, большие это семьи или маленькие, все равно это будут семьи. А когда подсчитывают среднее количество братьев и сестер у одного ребенка, выборка состоит из детей. Учитывается каждый ребенок в большой семье; таким образом, количество детей в каждой семье сильно влияет на средний показатель количества братьев и сестер. Иными словами, семья с десятью детьми считается один раз в средней семейной статистике, но десять раз в статистике, отражающей количество братьев и сестер у одного ребенка. Предположим, что в одном районе этой гипотетической общины живут 30 семей. У четырех из них нет детей, в шести — по одному ребенку, в девяти — по два, и в 11 семьях воспитывается по шестеро детей. В среднем в каждой семье по три ребенка, потому что нужно разделить 90 (общее количество детей) на 30 (общее количество семей).
Но давайте посмотрим на среднее число братьев и сестер у одного ребенка. Мы часто допускаем ошибку, думая, что если в среднем в семье по три ребенка, то у каждого из них должно быть двое братьев или сестер. Но в семьях с одним ребенком на каждого из шести детей приходится ноль братьев и сестер. В семьях с двумя детьми на каждого из 18 детей приходится по одному брату или сестре. В семьях с шестью детьми на каждого из 66 детей приходится пять братьев и сестер. У 90 детей, выходит, 348 братьев или сестер. Следовательно, хотя средний ребенок воспитывается в семье с тремя детьми, на 90 детей приходится 348 братьев и сестер, или в среднем приблизительно четыре брата или сестры на ребенка.
Семей | Детей в семье | Всего детей | Братьев и сестер | |
4 | 0 | 0 | 0 | |
6 | 1 | 6 | 0 | |
9 | 2 | 18 | 18 | |
II | 6 | 66 | 330 | |
Всего | 30 | 90 | 348 |
Среднее количество детей на семью: 3,0
Среднее количество братьев и сестер на ребенка: 3,9[24]
Четыре семьи, в которых нет детей
Шесть семей с одним ребенком — шесть детей, у которых ноль братьев и сестер
Девять семей, в которых два ребенка, — 18 детей, у которых один брат или сестра
11 семей с шестью детьми — 66 детей, у которых пять братьев и сестер
А теперь давайте рассмотрим пример с колледжами. В Соединенных Штатах множество крупных колледжей (например, колледж в штате Огайо или в штате Аризона), где учится более 50 тысяч студентов. Есть также и не такие большие колледжи, где учится менее 3 тысяч студентов (например, Кеньон-колледж или Уильямс-колледж). Если мы включим в наши подсчеты еще и школы, то получим, что в колледже среднего размера учится 10 тысяч студентов. Но если подсчитать количество студентов, то получится, что средний студент ходит в колледж, где учится более 30 тысяч студентов. Это происходит потому, что при подсчете студентов мы получим гораздо больше данных из крупных школ. Схожим образом можно сделать вывод, что средний человек не живет в среднем городе, а средний гольфист не делает среднее число ударов для прохождения площадки с 18 лунками.
Во всех этих примерах меняется изучаемая группа, а потому меняется знаменатель при вычислении среднего арифметического. Рассмотрим еще один пример асимметричного распределения вроде того, с которым мы встретились, обсуждая детскую смертность: средний инвестор не получает средний доход[25].
В одном исследовании средний доход от инвестиции 100 долларов на срок 30 лет составил 760 долларов, или 7 % в год. Но 9 % инвесторов потеряли деньги, а огромному числу инвесторов, 69 %, не удалось достигнуть показателя среднего дохода. Так случилось потому, что среднее арифметическое было смещено из-за нескольких человек, заработавших больше среднего. На графике, предложенном ниже, среднее арифметическое смещено вправо благодаря тем счастливчикам, которым удалось заработать состояние.
Доходность инвестиции в 100 долларов через 30 лет. Обратите внимание: большинство людей получили доход меньше среднего арифметического, а немногие счастливчики — в пять раз больше среднего.
Махинации с осями координат
Человеческий мозг не развит настолько, чтобы обрабатывать большие объемы информации в виде текста, зато наши глаза автоматически ищут шаблоны и схемы в данных, представленных визуально. Самый точный, хотя и не самый простой для трактовки способ представить числовую информацию — составить таблицу, включив в нее все имеющиеся данные. Но для большинства людей сложно — если не сказать невозможно — обнаружить в этом массиве информации какие-то закономерности или тенденции, поэтому мы полагаемся на схемы и графики. Последние бывают двух видов: они либо показывают каждую точку данных (как в графике рассеяния), либо каким-то образом преобразуют данные, обобщают их, фокусируясь при этом, например, только на средних или медианах.
Есть много способов использовать графики для манипуляции и искажения данных. Но человек, которому свойственна осторожность, постарается не попасть впросак.
Необозначенные оси координат
Основной способ манипуляции с помощью статистических графиков — не обозначать оси координат. Если оси никак не названы, вы можете выдумать что угодно. Вот пример, взятый с плаката, который один студент-исследователь показывал на конференции[26]. Выглядел этот график таким образом (я его просто перерисовал):
Что все это значит? Из текста, приведенного на самом постере (а вовсе не на этом графике), нам известно, что специалисты исследуют активацию головного мозга пациентов, страдающих шизофренией (Ш). А что же такое КЗЗ? Нам не говорят, но из контекста — КЗЗ постоянно сравнивают с Ш — мы можем предположить, что это означает «контроль за здоровьем». Кажется, между КЗЗ и Ш должна быть разница, но… эм-м-м… на оси Y отмечены числа, и… единицы измерения могут быть какими угодно! Что мы видим? Результаты теста, уровни активации мозга, количество активированных зон мозга? Количество стаканчиков пудинга Jell-O, которые съели испытуемые, или количество фильмов с Джонни Деппом, которые они посмотрели за последние шесть недель? (Справедливости ради, исследователь позже опубликовал свои заключения в экспертном журнале и исправил все недочеты, на которые ему указали.)
В следующем примере график отображает брутто-продажи одного издательства, за исключением данных с платформы Kickstarter[27].
Как и в предыдущем примере (хотя в данном случае мы говорим об оси X), отмечены числа, но нам не сообщают, что они обозначают. Хотя в данном случае это и так очевидно: мы предполагаем, что 2010, 2011 и т. д. относятся к календарному или финансовому{4} году, а тот факт, что линия между годами не гладкая, говорит о том, что данные отслеживаются ежемесячно (но, не имея нормальных подписей, мы это можем только предполагать). Оси Y нет совсем, поэтому мы не знаем, что конкретно тут замеряется (это проданное количество экземпляров или доллары?), а также не знаем, что означает каждая из горизонтальных линий. График может отражать рост продаж как с пяти центов до пяти долларов за год, так и с 50 миллионов до 500 миллионов долларов за год. Но не нужно беспокоиться — график сопровождало очень полезное примечание: «Это был еще один великолепный год». Думаю, нам просто нужно поверить им на слово.
Усеченная вертикальная ось
Продуманный график четко показывает наиболее значительные крайние точки всего множества. Это особенно важно, если вы документируете текущие или проектируемые количественные изменения и хотите, чтобы читатели сделали правильные выводы. Если вы отражаете в графике уровень преступности, смертности, рождаемости, дохода — или любое иное количественное множество, которое может принимать нулевое значение, — тогда ноль должен быть минимальной точкой отсчета. Но если ваша цель — посеять панику или ужас, начните свой график поближе к нижней границе значений, это подчеркнет разницу, которую вы пытаетесь выделить, потому что наш глаз привлекает разница, показанная на графике, а настоящий ее размер остается незамеченным.
В 2012 году Fox News показали приведенный ниже график, чтобы показать, что могло бы случиться, если бы снижение налогов, задуманное Бушем, не состоялось[28].
Этот график создает визуальное впечатление, что размер налогов возрос бы, и намного: столбик справа в шесть раз выше столбика слева. Но кто захочет платить в шесть раз больше? Если на график посмотрит человек, который панически боится цифр (или просто взглянет на него мельком), он может и не рассмотреть оси и не заметить, что речь идет о разнице между налоговой ставкой в 35 % и 39,6 %. А это значит, что если налоги не снижать, то они вырастут всего на 13 %, а не на 600 %, как показано на картинке (увеличение процентных пунктов на 4,6 составляет 13 % от 35 %).
Если бы ось Y начиналась с нуля, мы бы обязательно заметили эти 13 %:
Разрыв вертикальной и горизонтальной осей[29]
Представьте себе город, в котором за последние десять лет уровень преступности неуклонно растет на 5 % в год.
Вроде бы ничего необычного. А теперь представьте, что вы занимаетесь продажами домашних сигнализаций и хотите немного напугать потенциальных клиентов, чтобы продать им свой товар. Используя все те же данные, просто прервите график по оси X. Это исказит действительность и волшебным образом обманет покупателей:
При взгляде на этот график создается впечатление, что уровень преступности сильно увеличился. Но вам-то лучше знать. Разрыв оси X вмещает цифры за пять лет в такой же промежуток, на который раньше приходилось два года. Неудивительно, что мы видим существенное увеличение. Это большой недочет в построении графика, но большинство читателей не утруждают себя разглядыванием осей, для них сойдет и так.
И вам совсем не нужно ограничивать свою креативность и довольствоваться разрывом оси X — вы можете добиться того же эффекта, разорвав и ось Y тоже, а потом скрыть содеянное, не прерывая линии. Вот посмотрите, как мы сделаем разрыв оси Y:
Конечно, это нечестно. Большинство читателей смотрят только на кривую и не замечают, что по вертикальной оси сначала отметки сделаны с интервалом в 40 сообщений о преступлении, а после числа 200 между соседними помещается только по восемь сообщений. Нам все еще весело?
По-хорошему, мы должны взять первый график с нормальными осями. Желая критически оценить данные, вы, возможно, захотите спросить, какие факторы повлияли на отбор и изображение данных.
Одно из объяснений может быть таким: рост преступности наблюдается в каком-то конкретном районе, известном своей неспокойной обстановкой, — а по всему городу уровень преступности уменьшается. Возможно, полиция и местная общественность просто решили, что в этом конкретном районе очень сложно навести порядок, и потому прекратили обеспечивать там соблюдение законов. Город же в целом достаточно безопасное место — может, даже безопаснее, чем когда бы то ни было, а преступность растет из-за одного злачного района.
Другой вариант: сводя воедино самые разные жалобы на преступников к одному показателю, мы упускаем одно серьезное соображение. Возможно, количество серьезных преступлений снизилось практически до нуля и, располагая большим количеством времени, полиция с особым рвением принялась выписывать штрафы за переход улицы в неположенном месте.
Может, желая понять, что же такое на самом деле статистика, будет логично спросить: «А как изменилось в этот промежуток времени население в этом городе?» Если оно увеличивалось больше, чем на 5 % за год, уровень преступности, измеряемый числом преступлений на одного жителя, на самом деле должен был снизиться, из расчета коэффициента преступности на человека. Мы можем проиллюстрировать свою мысль, отметив количество преступлений, приходящихся на 10 тысяч жителей этого города:
Как выбрать правильный масштаб и ось[30]
Вас нанял на работу местный риелтор, который хочет, чтобы вы составили график изменений цены на дома в вашем районе за последние десять лет. Цены устойчиво растут на 15 % в год.
Если вы хотите встревожить людей по-настоящему, почему бы тогда не изменить ось X, чтобы включить годы, по которым у вас нет данных? Добавив дополнительные показатели на оси X, как показано на рисунке, вы увеличите наклон кривой, изменив масштаб по оси X следующим образом:
А теперь обратите внимание, как легко такой график обманывает ваш глаз (на самом деле, конечно, мозг). И вот вы уже делаете два неверных вывода: первый — что когда-то, около 1990 года, цена на дом, должно быть, была очень низкой, а второй — что к 2030 году она будет такой высокой, что лишь немногие смогут позволить себе покупку. А значит, лучше бы купить дом уже сейчас!
Оба графика искажают реальную ситуацию: кажется, что темп роста увеличивается, в то время как он (темп) остается постоянным. На первом графике рост в 15 % кажется в два раза больше на оси Y в 2014 году, нежели в 2006-м. Многое меняется с постоянной скоростью: зарплаты, цены, уровень инфляции, численность популяции, число заболевших[31]. Если же вы наблюдаете постоянный рост (или снижение) чего-либо, наиболее точно данные отобразить можно на логарифмической шкале. Она устроена так, что постоянное изменение на одно и то же число процентов изображается равными промежутками по оси Y. А постоянная годовая скорость изменений потом выглядит как прямая линия, посмотрите:
Двойная ось Y, внушающая страх
Тот, кто строит график, может легко скрыть любую ложь, предвидя, что большинство тех, кто его увидит, не будут всматриваться очень уж пристально. Благодаря этому можно легко заставить огромное количество людей поверить в самые невероятные вещи. Возьмем, например, нижеприведенный график, на котором отражена ожидаемая продолжительность жизни курильщиков и тех, кто не курит, в возрасте 25 лет[32].
График проясняет две вещи: опасность, которой подвергается курильщик, увеличивается со временем, и потому есть большая вероятность, что он умрет раньше того, кто не курит.
Разница невелика для возраста 40 лет, но риск не дожить до 80 лет для курильщика увеличивается более чем вдвое — с менее чем 30 % до более 60 %. Это честный и точный способ представить данные графически. Но представьте, что вы 14-летний курильщик, который хочет уговорить родителей разрешить ему курить. В таком случае этот график вам не поможет. Придется покопаться в своем мешке с реквизитом фокусника и выудить оттуда двойную ось Y. Справа появится еще одна ось, числа на ней совсем не такие, как слева, и относятся лишь к тем, кто не курит. Как только вы это сделаете, график будет выглядеть вот так:
Теперь все выглядит так, словно вероятность умереть от курения у вас такая же, как и по любой другой причине. Не курение будет источником ваших бед — а ваш возраст! Самая большая сложность с такими графиками, в которых используются двойные оси Y, заключается в том, что вы всегда можете разметить вторую ось любым удобным для себя способом.
В журнале Forbes, весьма авторитетном издании, внушающем доверие, приводится очень похожий график, отражающий связь расходов на учащихся средней школы и их баллов по тесту SAT[33] {5}. Это очень распространенный в США стандартизированный тест для приема в высшие учебные заведения.
На графике все выглядит так, словно увеличение расходов на ученика (черная кривая) никоим образом не влияет на увеличение баллов по SAT (серая кривая). Некоторые оппозиционно настроенные политиканы могут утверждать, что это деньги налогоплательщиков, выброшенные на ветер. Теперь вы понимаете, что выбор разметки для второй оси Y (по правой стороне) ничем не обоснован. Если бы вы были школьным администратором, то, возможно, просто взяли бы те же самые данные, изменили разметку на оси справа — и готово! Налицо увеличение расходов, которое обеспечивает более качественное образование (как следует из увеличения баллов за тест!).
Этот график, однако, отображает принципиально другую историю. Какой из них не лжет? Чтобы это понять, нужно измерить, насколько меняется одна переменная при изменении другой. Для этого есть показатель, известный как корреляция. Корреляции варьируются от –1 до 1. Корреляция 0 означает{6}, что одна переменная совсем не связана с другой. Корреляция –1 означает, что, когда одна переменная идет вверх, другая абсолютно синхронно идет вниз. Корреляция 1 означает, что, когда одна переменная идет вверх, вторая делает то же самое, тоже абсолютно синхронно. Кажется, первый график иллюстрирует корреляцию 0, второй — ту, что очень близка к 1. Фактическая корреляция для этого набора данных равна 0,91 — и это очень сильная корреляция. Повышенные расходы на студентов, по крайней мере в этом наборе данных, ассоциируются с лучшими показателями при выполнении тестов SAT.
С помощью корреляции можно{7} также оценить, в какой степени результат объясняется с помощью представленных переменных[34]. Корреляция 0,91 говорит о том, что мы можем объяснить 91 % студенческих баллов за тест SAT, посмотрев на количество школьных расходов на каждого студента. А значит, можем понять, насколько расходы объясняют разнообразие баллов SAT.
Осенью 2015 года в США во время заседания комитета Конгресса развернулась полемика, касающаяся графиков с двойной осью Y. Джейсон Чаффец представил график, отображающий две услуги, предоставляемые организацией Planned Parenthood, — аборты, а также скрининг и профилактику рака[35]:
Конгрессмен пытался донести мысль, что за семилетний период организация Planned Parenthood увеличила количество абортов (против чего он выступал) и снизила количество скринингов рака и профилактических процедур. Planned Parenthood этого не отрицала, но из-за искаженного графика кажется, что количество абортов превышает количество процедур, связанных с лечением рака. Возможно, тот, кто составлял график, чувствовал за собой вину и поэтому привел не только линии, но и актуальные числовые данные. Давайте посмотрим внимательнее. Количество абортов, сделанных за 2013 год (и на этом график заканчивается), равно 327 тысячам. А медицинских услуг, связанных с диагностированием и лечением рака, было оказано почти в три раза больше, 935 573. (Кстати, подозрительно, почему данные по абортам выражаются округленными числами, а те, что касаются рака, так точны.) Тут у нас особенно коварный случай: подразумевается, что на графике две оси Y, но обе они не изображены!
Если построить график как следует, получится вот так:
Мы видим, что количество абортов увеличилось очень незначительно, если сравнивать с сокращением услуг по диагностированию и лечению рака.
Есть еще кое-что, что вызывает подозрения в оригинальном графике: редко когда можно встретить столь ровные линии. Такое ощущение, что составитель графика просто взял данные за два определенных года, 2006-й и 2013-й, и сравнил их, соединив прямой линией. Возможно, два этих года были выбраны специально, чтобы усилить разницу. А может, в промежутке между 2007-м и 2012-м существовали большие колебания — нам это неизвестно. Ровные линии создают впечатление идеальной линейной (прямая линия) функции, что маловероятно.
Подобные графики не всегда отображают правдивые истории. Есть ли что-нибудь, что могло бы объяснить приведенные данные, помимо рассказа о том, что Planned Parenthood хочет провести как можно больше абортов (и в то же время позволяет людям умирать от рака)? Посмотрите на второй график. В 2006 году организация Planned Parenthood провела 2 007 271 исследование раковых опухолей и сделала 289 750 абортов, что примерно в семь раз меньше. К 2013 году эта разница сократилась, но количество раковых исследований все равно было примерно в три раза больше.
У Сесиль Ричардс, президента Planned Parenthood, имеется на этот счет объяснение: изменение медицинских норм при оказании некоторых услуг по предотвращению и лечению рака, например пап-мазка, сократило количество людей, которым был рекомендован скрининг. Другие изменения, например само отношение к абортам, изменение возрастной структуры населения, а также возросшее количество людей, имеющих доступ к альтернативным методам лечения, — повлияли на эти цифры, поэтому представленные данные не доказывают, что Planned Parenthood поддерживает аборты, хотя и не исключено, что так оно и есть.
Возможные уловки при сообщении данных
Вы раздумываете, стоит ли покупать акции компании, производящей безалкогольные напитки, и вдруг натыкаетесь на график, представляющий годовой отчет компании по продажам:
Выглядит многообещающе — продажи Peachy Cola постоянно растут. Пока что все идет хорошо. Но давайте припомним, как устроен наш мир, — и постараемся извлечь из этих знаний какую-нибудь пользу. Итак, мы знаем, что конкуренция на рынке безалкогольных напитков огромна. Продажи компании растут, но, возможно, не так быстро, как у конкурентов. Как потенциальному инвестору вам важно сравнить продажи Peachy Cola с продажами других компаний — ее продажи могут расти незначительно, в то время как рынок развивается особенно стремительно, а конкуренты зарабатывают больше, чем Peachy Cola. И как видно на этом графике с двойной осью Y, это, возможно, не сулит производителям ничего хорошего.
И хотя те, кто составляет недобросовестные графики, могут в корыстных целях как угодно менять шкалу на оси справа, сам по себе график с двойной осью Y нельзя считать предосудительным, потому что обе оси Y представляют разные вещи, которые не могут быть отображены на одной оси. В случае с организацией Planned Parenthood ситуация была иной: на том графике мы видели один показатель — количество проведенных процедур — на двух разных осях. И хотя они там отражали одно и то же, график был искажен, потому что шкалы на осях были разными. Сделано это было в целях манипуляции нашим восприятием.
Было бы также полезно посмотреть на прибыль от продаж Peachy Cola: вполне может оказаться, что благодаря производству и распространению компания зарабатывает больше на более низком объеме продаж. Тот факт, что кто-то предъявляет вам статистику или показывает график, еще не означает, что все это относится к делу. Наша всеобщая задача заключается в том, чтобы получить релевантную информацию и игнорировать те сведения, которые никакого значения не имеют.
Предположим, вы работаете в отделе по связям с общественностью в компании, производящей какого-то рода устройства — назовем их фрабезоиды. На протяжении последних нескольких лет эту продукцию охотно покупали, и продажи сильно выросли. Компания расширилась, построила новые объекты, увеличила штат сотрудников, и всем повысили зарплату. Однажды босс заходит в ваш кабинет с угрюмым выражением лица и говорит, что получил последние результаты продаж: количество проданных фрабезоидов упало на 12 % по сравнению с предыдущим кварталом. Президент компании планирует провести большую пресс-конференцию и поговорить о будущем: как это всегда бывает, он намерен продемонстрировать большой график, отображающий положение дел. Если станет известно о снижении продаж, покупатели могут подумать, что фрабезоиды не так уж желанны, — и это приведет к дальнейшему снижению продаж.
Что вы делаете? Если вы честно отобразите данные по продажам за последние четыре года, ваш график будет выглядеть следующим образом:
Кривая, идущая вниз, — это проблема. Если бы только был способ сделать так, чтобы она снова пошла вверх!
И такой способ есть — график кумулятивных продаж. Вместо графика квартальных продаж составьте график кумулятивных продаж — он отражает общее число продаж на текущий момент.
Как только продается хоть один фрабезоид, кривая идет вверх, как мы видим на этом графике:
Если присмотреться, можно увидеть, что в последний квартал дела шли не так гладко: хотя в этот период кривая по-прежнему идет вверх, происходит это не так резко. Это-то и поможет вам понять, что продажи упали. Но нашему мозгу сложно уловить подобные нюансы (то, что в математике называется первой производной, — вычурное словечко для наклона линии). Итак, при взгляде на график кажется, что дела компании идут в гору, а вы меж тем заставили огромное количество потребителей поверить в то, что фрабезоиды — по-прежнему самая желанная покупка.
Так же поступил и Тим Кук, CEO компании Apple, во время своей последней презентации по продажам iPhone[36].
© 2013 Die Verge, Vox Media Inc. (live.theverge.com/apple-iphone-5s-liveblog/)
Отображение на графике несущественных данных
В мире столько всего происходит, что всегда находится место совпадениям. Количество зеленых грузовиков на дороге может увеличиваться одновременно с вашей зарплатой; когда вы были ребенком, количество телешоу могло увеличиваться так же, как и ваш рост. Но это не означает, что одно есть причина другого. Статистики называют это корреляцией.
Известно, что корреляция не подразумевает причинность, однако об этом правиле часто забывают в рассуждениях. Для ошибок такого рода в формальной логике есть две формулировки.
1.-Post hoc, ergo propter hoc{8}. Данное логическое заблуждение возникает из уверенности в том, что если один факт (Y) произошел после второго (X), значит, X стал причиной Y. Обычно люди чистят зубы до того, как пойти утром на работу. Но чистка зубов не есть причина, по которой они идут на работу. В данном случае все может быть наоборот.
2.-Cum hoc, ergo propter hoc{9}. Это логическое заблуждение состоит в том, что из совпадения по времени двух фактов заключают, что один должен быть причиной второго. Тайлер Виджен, студент юридического факультета Гарвардского университета, написал книгу и создал сайт, где собрал примеры странных совпадений — корреляций, например таких[37]:
Эти данные можно интерпретировать четырьмя разными способами: 1) смерть в бассейне вызывает выход нового фильма с Николасом Кейджем; 2) выход фильмов с Николасом Кейджем становится причиной смерти в бассейне; 3) некий третий фактор (который еще не установлен) влияет на оба показателя; 4) показатели никак не связаны между собой, и корреляция — чистой воды совпадение. Если мы не отделим корреляцию от причинности, то сможем со всей уверенностью заявить, что график Виджена «доказывает» посильную помощь Ника Кейджа в предотвращении всех этих смертей в бассейне. И нам остается только поддерживать образовавшуюся тенденцию, чтобы актер и дальше развивал свою удивительную способность, которую он с блеском продемонстрировал в 2003 и 2008 годах.
В некоторых случаях между показателями, кажущимися взаимосвязанными, нет никакой настоящей связи: факт их корреляции — просто совпадение. В других же случаях можно найти между ними случайную связь, а то и состряпать более-менее разумную историю, которая подстегнула бы к поиску новых данных.
Мы можем исключить первое объяснение, так как на создание и выпуск фильма требуется время, поэтому пик смертности от утопления не мог вызвать пик популярности Ника Кейджа в том же году. Как насчет второго пункта? Возможно, люди настолько проникаются сюжетом остродраматических фильмов Кейджа, что не помнят себя и, как следствие, тонут. Возможно, по той же причине увеличивается и количество автомобильных аварий, а также травм, полученных в результате работы с тяжелым оборудованием. Мы не найдем ответов на эти вопросы, пока не проанализируем больше данных.
Что же насчет третьего фактора, который влияет на оба показателя? Можно предположить, что влияние оказывает экономика государства: чем более она развита, тем больше инвестиций идет в досуг — выпускается больше фильмов, люди чаще ездят в отпуск, ходят плавать. Если это так, то ни одна из ситуаций, частоту которых описывает график, — выход фильма Ника Кейджа и утопление — не бывает причиной другой. Свою роль тут сыграл третий фактор — экономика, — он и приводит к изменениям в обоих случаях. Статистики называют это третьим фактором x. И подобных случаев множество.
Вероятнее всего, эти две ситуации совсем никак не взаимосвязаны. А если присмотреться и хорошенько подумать, то мы обязательно обнаружим, что здесь одновременно изменяются два не связанных друг с другом показателя.
Продажи мороженого увеличиваются одновременно с ростом числа людей в шортах. Нельзя сказать, что один из фактов — причина второго. Третий фактор x, который на самом деле влияет на оба факта, — это повышение температуры летом. Количество телешоу, выпущенных в эфир в то время, когда вы были ребенком, возможно, коррелировало с вашим ростом, но несомненно, что причиной одинакового изменения обоих показателей стал общий период времени, когда: а) телевидение расширяло свой рынок и б) вы росли.
Как же тогда понять, в каких случаях корреляция указывает на причинность? Во-первых, можно провести контролируемый эксперимент. Во-вторых, включить логику. Но будьте внимательны — тут легко утонуть в трясине пустословия: это дождь вчера вынудил людей надеть дождевики? Или причиной стало желание не намокнуть, появляющееся, когда идет дождь?
Эту идею хорошо представил Рэнделл Манро{10} в своем веб-комиксе xkcd: разговаривают две фигурки, очевидно, студенты колледжа[38]. Один говорит, будто раньше думал, что корреляция подразумевает причинность. Потом, правда, походил на занятия по статистике и теперь уже так не думает. На что второй студент отвечает: «Кажется, занятия сделали свое дело». А первый ему на это: «Да, может быть».
Обманчивые иллюстрации
Инфографика в большом почете у разных ловкачей и пройдох, которым нужно сформировать мнение аудитории, и полагаются они на то, что большинство людей не станут вникать в то, что выглядит убедительно. Вот, например, посмотрите на этот рисунок. Возможно, с его помощью кто-то хотел напугать вас и заставить думать, что быстро растущая инфляция съедает все ваши с таким трудом зарабатываемые деньги:
Выглядит страшновато, правда? Но присмотритесь. Ножницы отрезают не 4,2 % от банкноты, а около 42 %. Когда ваша визуальная система сталкивается с логической, первая всегда выходит победителем, если только вы не приложите усилий, чтобы переломить это предубеждение[39]. Точная инфографика выглядела бы похоже, но производила бы менее сильный эмоциональный эффект:
Интерпретация и фрейминг
Иногда статистические данные собраны и описаны как следует, а вот переданы неверно, потому что тот, кто передавал, — не важно, будь то журналист или адвокат, — не специалист в этом вопросе. И ошибки он допускает либо потому, что сам не понял, либо потому, что не осознавал, что малейшее изменение в формулировке может привести к изменению в смысле.
Часто у тех, кому хочется использовать статистику, в штате нет статистиков, и в поиске ответов на свои вопросы они попадают к тем, у кого нет соответствующей компетенции. Корпорации, правительственные учреждения, некоммерческие организации, семейные бакалейные лавочки — все они пользуются статистическими данными о продажах, клиентах, тенденциях, сетях снабжения. Некомпетентность может проявиться на любой стадии: во время проведения эксперимента, сбора данных, анализа или интерпретации.
Иногда бывает так, что публикуемые статистические данные нерелевантны. Если вы пытаетесь убедить своих акционеров, что дела вашей компании идут в гору, то, возможно, стоит предложить статистические данные по годовым продажам и показать уверенно растущие цифры. Но если рынок, на котором представлен ваш продукт, растет и развивается, от вас будут ждать увеличивающихся продаж. Инвесторов и аналитиков волнует, изменилась ли ваша доля на рынке. Но как сделать отчет более привлекательным, если эта доля уменьшается, потому что налетели конкуренты и теперь уводят ваших клиентов? Ответ прост: не предоставлять релевантную статистику по доле на рынке — вместо этого покажите статистику продаж. Продажи-то растут! Значит, все хорошо!
Финансовые показатели из заявлений на ипотеку 25-летней давности, вероятно, не сильно помогут в построении модели риска сегодня. Любая модель поведения потребителей на сайте устаревает очень быстро[40]. Статистические данные о прочности бетона, использованного для эстакад, возможно, уже не релевантны для мостов (отличия могут быть вызваны влажностью и иными факторами, даже в случае, если в обоих инженерных проектах использовался один и тот же бетон).
Все вы наверняка слышали фразы типа «Четверо стоматологов из пяти рекомендуют зубную пасту Colgate». И это правда. Рекламное агентство, стоящее за этим существующим на протяжении многих лет слоганом, хочет донести до вас мысль, что стоматологи предпочитают Colgate всем другим брендам. Но это не так. Комитет рекламных стандартов Великобритании изучил утверждение слогана и счел его нечестным. Выяснилось, что в ходе опроса стоматологи могли рекомендовать более одной зубной пасты. И, как оказалось, самого крупного конкурента Colgate рекомендовали почти так же часто, как и Colgate (деталь, которую вы никогда не найдете в рекламе этой пасты)[41].
Мы говорили о фрейминге, обсуждая средние, еще раз мы его коснулись, говоря о графиках. Манипуляция фреймами предоставляет бесконечное количество способов заставить кого-нибудь верить в то, чего на самом деле нет. А нужно всего лишь остановиться и подумать о том, что вам говорят. Представители C-SPAN{11} уверяют, что их сеть «доступна» в 100 миллионах домов[42]. Но это не означает, что 100 миллионов людей смотрят C-SPAN. Это даже не означает, что его смотрит хотя бы один человек[43].
Манипуляции с фреймами могут оказывать влияние на общественный порядок. Изучение результатов переработки мусора на самых разных улицах Лос-Анджелеса показывает, что одна конкретная улица перерабатывает в 2,2 раза больше, чем любая другая. Но прежде чем городской совет даст жителям этой улицы награду за их старания в области сохранения города зеленым, давайте зададимся вопросом: что может так сильно влиять на это количество? Как вариант, на этой улице проживает в два раза больше человек, чем на других, — возможно, потому что она длиннее, возможно, потому что на ней больше многоквартирных домов. Измерение объемов переработки мусора на уровне улицы нельзя считать релевантным показателем, если только все улицы не идентичны. Наиболее точные статистические данные можно получить либо по квартирам (замерить объемы переработки для каждой семьи), либо по каждому жителю — что даже лучше, потому что большие семьи потребляют больше, чем те, где народу меньше. Поэтому, проводя эксперимент, нужно учитывать не только объем собранного материала для переработки, но и количество людей, живущих на улице. И именно это и будет настоящим фреймом для статистика.
В 2014 году Los Angeles Times сообщила об объемах воды, которая используется в городе Ранчо-Санта-Фе, расположенном в засушливой Калифорнии[44]. «Ежедневное потребление воды домашними хозяйствами в этом районе вышло в среднем почти в пять раз больше, чем в прибрежных районах Южной Калифорнии в сентябре. Из-за этого Санта-Фе теперь называют самым большим насосом в штате». «Домашнее хозяйство» в данном случае — нерелевантный фрейм для этого статистического результата. Фрейм «на душу населения» подошел бы гораздо лучше. Возможно, у жителей Ранчо-Санта-Фе большие семьи, что автоматически означает большую потребность в воде для душа, туалета, мытья посуды. Другой подходящий фрейм — использование воды из расчета на акр. Дома, расположенные в Ранчо-Санта-Фе, как правило, обладают большими придомовыми территориями. Может, в целях пожарной безопасности, может, по каким-то иным причинам гораздо целесообразнее держать землю засаженной зеленой растительностью, а на земельных участках в Ранчо-Санта-Фе на один акр потребляют не больше воды, чем в любом другом месте штата.
На самом деле в материалах New York Times можно найти кое-какую информацию по этому вопросу: «Чиновники, отвечающие за государственные водные ресурсы, запретили сравнивать потребление воды на душу населения в разных районах. По их словам, они ожидают, что в более состоятельных районах с большими земельными участками потребление будет выше».
Проблема со статьей заключается в том, что в ней фреймят данные, чтобы те выглядели так, словно жители Ранчо-Санта-Фе используют воды больше, чем им положено. Но данные, которые приводит газета, — как и в случае с переработкой мусора в Лос-Анджелесе, описанном выше, — не говорят об этом ни слова.
Указание пропорций, а не фактических цифр часто помогает построить верный фрейм. Представим, что вы работаете в компании, занимающейся продажами потоковых конденсаторов, и отвечаете за реализацию товара в Северо-Западном регионе. Ваши продажи сильно увеличились, но все равно еще недотягивают до результатов вашего соперника Джека, отвечающего за Юго-Западный регион. Вряд ли это справедливо — его территория не только больше географически, на ней живет и больше народу. Бонусы в вашей компании зависят от того, покажете ли вы начальству, что успешны в продажах.
Представьте начальству свой отчет о продажах в зависимости от площади или населения региона, в котором работаете. Иными словами, вместо того чтобы рисовать график продаж потоковых конденсаторов, покажите количество, приходящееся на душу населения в этом регионе или на квадратную милю. В обоих случаях, возможно, вы обойдете своего соперника.
Судя по сообщениям в новостях, 2014 год принес наибольшее количество смертей в результате авиакатастроф: 22 падения самолета и 992 человеческие жертвы. Но сегодня путешествия на самолете стали безопаснее, чем когда-либо[45]. А так как и летают теперь намного чаще, это число, 992 погибших, говорит о значительном уменьшении числа смертей на миллион пассажиров (или миллион миль). На рейсе крупной авиакомпании вероятность погибнуть составляет один на пять миллионов. Гораздо выше риск погибнуть при других обстоятельствах: переходя дорогу или жуя бутерброд (смерть от того, что человек поперхнулся или отравился, вероятнее в тысячу раз). Здесь очень важны базовые показатели сравнения. Эти статистические данные растянуты во времени на целый год — год авиаперелетов, год перекусов бутербродами (в результате чего можно либо поперхнуться, либо отравиться). Поменяв базовый показатель, можно рассматривать каждый отдельный вид деятельности (перелет, жевание) на часовом промежутке времени — и это изменит статистику.
Разница, которая не играет роли
К статистике часто прибегают, когда хотят понять, есть ли разница между двумя вещами: двумя разными удобрениями, лекарствами, манерами преподавания, суммами зарплат (например, сравниваются мужчины и женщины, выполняющие один и тот же вид работ). Сравниваемые показатели могут отличаться друг от друга по-разному. Между ними может быть фактическая разница. На вашу выборку могут влиять мешающие факторы, не имеющие ничего общего с исследуемым вопросом. В ваших измерениях могут быть ошибки. А может и быть случайное отклонение — оно возникает то в одной, то в другой части уравнения, в зависимости от того, когда вы с ним работаете. Задача исследователя — найти стабильные, воспроизводимые разницы, и мы пытаемся отделить их от экспериментальных ошибок.
Будьте, однако, осторожны с тем, каким образом новостные СМИ используют слово «значимый», потому что для статистиков это не означает «заслуживающий внимания». В статистике это слово связано с тем, что данные были получены в результате статистических процедур, например проверки по критерию Стьюдента{12} и критерию хи-квадрат{13}, регрессионного анализа{14} и метода главных компонент{15} (их сотни). Статистический уровень значимости представляет в количественной форме, насколько легко результаты объясняются чистой случайностью. При большом количестве наблюдений даже самые незначительные отклонения бывает сложно объяснить в рамках используемой статистической модели. Не критерии определяют, что заслуживает внимания, а что нет, — тут нужны человек и его оценка.
Чем больше у вас наблюдений в двух группах, тем вероятнее вы найдете между ними разницу. Допустим, мы изучаем ежегодные эксплуатационные расходы на два разных автомобиля, Ford и Toyota, располагая данными о содержание десяти машин каждой марки. Давайте предположим, что средние расходы на Ford на восемь центов в год больше. Возможно, статистически это будет незначительно, и, понятное дело, разница в восемь центов в год не станет учитываться при выборе машины — она слишком мала, чтобы из-за этого еще переживать. Но если посмотреть на содержание 500 тысяч автомобилей, эта разница уже станет статистически значимой. При этом она не будет иметь никакого значения в реальной жизни. Еще один пример: новое средство от головной боли может быть статистически лучше, поскольку быстрее решает проблему, но если всего на 2,5 секунды, то кому какая разница?
Интерполяция и экстраполяция
Вы входите в свой сад и видите 10-сантиметровый одуванчик. Сегодня вторник. Через пару дней, в четверг, вы снова смотрите на него — его высота 15 сантиметров. Какой была его высота в среду? Наверняка мы не знаем, потому что не замеряли в этот день (в среду вы застряли в пробке, возвращаясь домой из питомника, где купили средство от сорняков). Но вы можете предположить: возможно, в среду высота одуванчика была 12,5 сантиметра. Это чистой воды интерполяция: вы берете два крайних значения и оцениваете величину между ними.
Какого размера будет этот одуванчик через шесть месяцев? Если он вырастает на 2,5 сантиметра в день, то можно сказать, что через полгода (примерно 180 дней) его высота составит 450 сантиметров, или четыре с половиной метра. В данном случае вы прибегли к экстраполяции. Но скажите, видели ли вы когда-нибудь такой большой одуванчик? Вероятно, нет: они ломаются под собственным весом, погибают от других естественных причин, их вытаптывают или обрабатывают средством от сорняков. Интерполяция — не идеальная техника, но если сравнить два этих способа, то она даст более точную оценку. Экстраполяция предполагает больше риска, потому что вы оцениваете величину, выходящую за диапазон наблюденных значений.
Время, необходимое, чтобы кофе в чашке остыл до комнатной температуры, определяется по законам физики (на него влияют многие факторы, например атмосферное давление, форма чашки)[46]. Если изначально температура чашки была 63 °C, со временем она опустится следующим образом:
Время, прошедшее с начала эксперимента, мин. | Температура, °C |
0 | 63 |
1 | 60 |
2 | 57 |
3 | 54 |
Каждую минуту ваш кофе теряет три градуса. Если бы вы включили промежуточные члены в ряд известных вам величин — скажем, захотели узнать температуру кофе ровно посредине между двумя замерами, — интерполяция оказалась бы довольно точной. Но если вы будете экстраполировать, есть вероятность получить абсурдный ответ, например что ваш кофе через полчаса замерзнет.
При экстраполяции не берут в расчет ограничения, накладываемые физикой: температура кофе не может упасть ниже температуры комнаты. Также не учитывается тот факт, что скорость, с которой кофе остывает, уменьшается тем быстрее, чем ближе температура кофе к комнатной. В дальнейшем график охлаждения выглядит следующим образом:
Обратите внимание, что крутизна кривой, соответствующая первым десяти минутам, не сохраняется — кривая становится все более пологой. Для экстраполяции особенно важны две вещи: наличие большого количества наблюдений, охватывающих большой промежуток, и понимание самой сути процесса.
Точные и верные цифры
Когда мы сталкиваемся с точными цифрами, то обычно полагаем, что они к тому же еще и верны, но это не одно и то же. Если я скажу: «Сегодня многие люди покупают электромобили», — вы подумаете, что я строю догадки. Если я скажу: «16,39 % продаж новых автомобилей составляют электрокары», — вы решите, что я точно знаю, о чем говорю. И в этот момент вы спутаете два таких понятия, как «точные» и «верные» цифры. Возможно, я все выдумал. Может, я опросил только небольшую группу людей возле дилерского центра электрокаров.
Вспомните упомянутый мною ранее заголовок Time, в котором говорилось, что на свете гораздо больше людей, у которых есть телефоны, нежели тех, у кого есть туалеты. Нельзя сказать, что это неправдоподобно, но это явное искажение того, что было обнаружено в результате исследования ООН. На самом деле в докладе ООН говорилось, что людей, у которых имелся доступ к мобильным телефонам, больше, нежели тех, у кого был доступ к туалетам, что существенно меняет картину. Одним мобильным телефоном могут пользоваться десятки людей. Отсутствие санитарных условий, конечно, огорчительно, но заголовок построен таким образом, что вы начинаете думать, будто в мире больше мобильных телефонов, нежели туалетов. А ведь эта информация не подтверждается данными.
Доступ — одно из тех слов, которые вас должны насторожить, когда вы встречаете их в статистике. Люди, имеющие доступ к медицинскому обслуживанию, возможно, просто живут рядом с медцентром, но это не означает, что им дадут там консультацию или что они имеют достаточно денег, чтобы заплатить за лечение. Как вы уже знаете, телевизионный канал C-SPAN доступен в 100 миллионах домов, но это не означает, что во всех 100 миллионах его смотрят[47]. Я бы мог заявить, что 90 % людей в мире имеют «доступ» к «Путеводителю по лжи», потому что 90 % населения земного шара живут на расстоянии не больше 40 километров от интернета, железных или автомобильных дорог, взлетно-посадочных полос, портов или маршрутов собачьих упряжек[48].
Мухи отдельно, котлеты отдельно
Отличный способ жульничать с помощью статистики — сравнивать отличающиеся друг от друга вещи (данные, совокупности, типы продуктов) и при этом делать вид, что разницы между ними нет. Но, как гласит известное выражение, «мухи отдельно, котлеты отдельно».
Если использовать этот сомнительный метод, то можно прийти к такому заявлению: «Находиться на военной службе во время открытого конфликта (например, во время войны в Афганистане) гораздо безопаснее, нежели в тылу». Ход рассуждения будет таким: в 2010 году погибло 3482 американских военнослужащих[49]. Исходя из общего числа военнослужащих — а их 1 431 000 человек, — получим 2,4 смертельных случая на тысячу человек[50]. На территории Соединенных Штатов количество смертей в 2010 году составило 8,2 на тысячу человек[51]. Иными словами, находиться на службе в военной зоне в три с лишним раза безопаснее, чем жить в Соединенных Штатах.
Давайте разберемся. Выборки очень разные, поэтому их нельзя сравнивать «в лоб». В действующей армии служат молодые здоровые солдаты, в их распоряжении питательные обеды и хорошее медицинское обслуживание. Население Соединенных Штатов весьма разнообразно: здесь проживают и старики, и больные, и гангстеры, и наркоманы, и любители погонять на мотоциклах, и любители игры в «ножички», а также огромное количество тех, у кого нет ни питательных обедов, ни медицинского обслуживания[52]. Смертность среди этих людей высока, где бы они ни находились. А действующие военнослужащие не все находятся в зоне военных действий — некоторые проходят службу на безопасных базах, сидят в офисах Пентагона или же на призывных пунктах в торговых центрах районного масштаба.
Новостной журнал U.S. News & World Report как-то опубликовал статью, в которой приводилось соотношение демократов и республиканцев начиная с 1930-х годов. Проблема в том, что за это время принципиально поменялась сама процедура формирования выборки. В 1930-х и 1940-х респондентов отбирали в личном разговоре, а также с помощью адресных списков, созданных на основе телефонных справочников. К 1970-м опросы стали делать исключительно по телефону. В начале XX века при формировании выборки скорее учитывали тех, у кого был стационарный телефон, то есть людей с достатком, а они — во всяком случае, в то время — имели обыкновение голосовать за республиканцев. К 2000-м перешли на мобильные телефоны, из-за чего произошел явный перекос в сторону молодежи, отдававшей свои голоса, как правило, за демократов. Мы на самом деле не знаем, изменилась ли пропорция демократов и республиканцев с 1930-х годов, так как выборки не поддаются никакому сравнению. Нам кажется, мы изучаем одно, а на самом деле — другое.
Похожая проблема возникает, когда говорят о снижении уровня смертности в результате мотоциклетных аварий по сравнению с тем, что было три десятилетия назад. Сейчас в сводках упоминается больше трехколесных мотоциклов, а в прошлом столетии доминировали двухколесные модели; можно вспомнить тот факт, что когда-то шлемы были не обязательны, сейчас же их наличие в большинстве штатов оговаривается законом.
Остерегайтесь меняющихся выборок, когда делаете выводы! Журнал U.S. News & World Report (да, снова он) сообщил, что за прошедший 20-летний период увеличилось число врачей, при этом средняя зарплата значительно снизилась[53]. Что же из этого следует? Вы можете сделать вывод, что сейчас не лучшее время, чтобы обучаться профессии врача, потому что их теперь пруд пруди (а избыточное предложение на рынке стало причиной снижения зарплаты). Возможно, это и так, но в защиту этого утверждения нет ни одного доказательства.
Вполне правдоподобно звучит заявление, что благодаря сужению специализации и росту технологий, наблюдаемым на протяжении последних 20 лет, у врачей появилось больше профессиональных возможностей — как следствие, на рынке стало больше доступных вакансий, особенно на фоне увеличения общего числа врачей. Так что же насчет снижения зарплаты? Возможно, дело в увольнении пожилых специалистов, которых заменили более молодые, согласные — в силу отсутствия опыта — на более низкую зарплату. Но и таких доказательств тоже нет. Важная составляющая статистической грамотности — понимать, что некоторые данные, подобно тем, что мы рассмотрели в этом примере, просто нельзя интерпретировать.
Иногда вот такая путаница с котлетами и мухами происходит от сравнения противоречивых подвыборок — потому что вы проигнорировали какую-то деталь, сочтя ее неважной. Например, отбирая пробы кукурузы на поле, обработанном новым удобрением, вы можете не обратить внимания на то, что некоторые початки получали больше солнца, а некоторые — больше воды. Или при исследовании влияния потока машин на частоту проведения ремонтных работ от вашего внимания может ускользнуть тот факт, что на определенных улицах больше водостоков, чем на других, и потому там чаще возникает необходимость ремонтировать асфальтовое покрытие.
Говорят, что происходит объединение выборок, когда данные о разнородных объектах соединяют в одну категорию, как в случае с яблоками и грушами. Если вас интересует количество шестеренок, выпущенных с дефектом, можно объединить данные по разным их видам и получить необходимые вам цифры в зависимости от того, какую цель вы преследуете.
Допустим, вам интересно сравнить сексуальное поведение детей в возрасте 10–12 лет и подростков постарше. То, каким образом вы объедините данные, может существенно повлиять на то, как люди их потом воспримут. Если перед вами стоит задача найти деньги на создание образовательных и консультационных центров, можно заявить нечто вроде: «70 % школьников в возрасте от 10 до 18 лет ведут половую жизнь». Нас не удивляет, что в этой категории 17- или 18-летние школьники, — но десятилетки! Такие заявления могут повергнуть в шок их бабушек и дедушек, которых придется отпаивать валерьянкой. Но ведь понятно же, что в общей категории, к которой отнесли и десятилетних детей, и 18-летних подростков, оказались и те, кто ведет половую жизнь, и те, кто нет. Гораздо правильнее было разбить всех участников исследовании на группы, объединив по возрасту и имеющемуся у них жизненному опыту: например, 10–11 лет, 12–13, 14–15, 16–18.
Но и это не единственная проблема. Что вообще имеется в виду под словосочетанием «вести половую жизнь»? Какой конкретно вопрос задавали школьникам?
И вообще, действительно ли опрашивали школьников? Может статься, на все эти вопросы отвечали родители. На полученные данные могли повлиять разные факторы. Слова «вести половую жизнь» можно понимать по-разному. И ответы могут разниться в зависимости от того, как понимать вопрос. Ну и, конечно, респонденты не обязательно говорили правду.
Или вот еще пример: допустим, вы захотели поговорить о безработице как об общей проблеме, но тут возникает риск объединения в одной выборке людей с самым разным жизненным опытом. Некоторые безработные физически недееспособны; другие были уволены по объективной причине, например потому что были пойманы с поличным во время кражи или потому что пришли на работу в нетрезвом виде. Кто-то хотел бы работать, но ему не хватает квалификации; кто-то отбывает срок; кто-то больше не хочет работать, потому что снова начал учиться, ушел в монастырь или находится на иждивении. Когда статистику используют, чтобы повлиять на государственную политику, собрать деньги на какое-то дело или чтобы выпустить газету с заголовком поярче, нюансы часто опускают. А ведь именно они порой кардинально меняют дело.
Эти нюансы часто говорят сами за себя[54]. Люди теряют работу по разным причинам. Вероятность того, что алкоголик или вор станет безработным, может быть в четыре раза выше, чем в случае с любым другим человеком. И подобные детали часто теряются при объединении выборок. Учитывая эти факторы в своем анализе данных, вы четко увидите, кто безработный и почему, а это, в свою очередь, может привести к разработке более качественных обучающих программ или к открытию дополнительных центров анонимных алкоголиков в том городе, где эти организации необходимы.
Если в разных центрах, изучающих поведение людей, используют для вещей разные определения, а для их измерения разные методы, то статистические данные будут очень разнородными, несравнимыми. Например, вы хотите определить количество пар, живущих вместе, но не зарегистрировавших свои отношения, — тогда в вашем распоряжении данные, уже собранные разными государственными агентствами. Но варьирующиеся определения могут привести к проблеме с категоризацией: что означает «жить вместе»? Определяется ли это количеством проведенных вместе ночей в неделю? Или тем, где находятся личные вещи живущих вместе людей? А может, тем, где они получают почту? Некоторые органы государственной власти юридически признают однополые пары, другие — нет. Если вы соберете данные в разных местах и разными методами, ваша статистика окажется почти бессмысленной. Если методология записи, сбора и замера данных сильно варьируется в отношении ключевых моментов, то в итоге статистические данные будут отражать не то, что видится в них вам.
Последние исследования показали, что уровень безработицы среди молодежи в Испании составил 23 %, — и это поразительно. В отчете в одну группу были объединены люди, которые при других обстоятельствах оказались бы в разных: тут были и студенты, не заинтересованные в поиске работы, и те, кого только что уволили, и те, кто находился в поисках работы.
Для отслеживания безработицы в Соединенных Штатах существует шесть разных индексов (обозначенных U1–U6), которые отражают разные интерпретации понятия «безработный»[55]. Сюда относятся те, кто ищет работу, и те, кто еще учится и не ищет, и те, кому интересна работа на полный рабочий день, при том что они работают только неполный, и т. д.
В газете USA Today за июль 2015 года сообщалось, что уровень безработицы упал до 5,3 % и что это был «самый низкий уровень начиная с апреля 2008 года»[56]. Более компетентные источники, включающие агентство Associated Press, журнал Forbes и газету New York Times, называли свою причину очевидного снижения: многие безработные просто бросили попытки найти работу и потому чисто технически уже не могли считаться рабочей силой[57].
Объединение выборок, однако, не всегда приводит к неверным выводам. Вы можете объединить результаты учеников школы обоих полов, особенно если нет никаких доказательств того, что эти результаты на самом деле разные. Таким образом вы можете увеличить размер выборки (и получить более устойчивую оценку того, что изучаете). Интерпретацию затрудняют только слишком широкое определение категории (как в случае с сексуальной активностью школьников, о которой мы говорили ранее) или противоречивые определения (как с парами, живущими вместе). Если объединить выборки правильно, это поможет сделать правильный анализ данных.
Предположим, вы работаете в штате Юта. Один крупный производитель детской одежды подумывает о том, чтобы переехать в ваш штат. И вам в голову приходит мысль указать ему на высокий уровень рождаемости в Юте. Таким образом вы рассчитываете привлечь его внимание. Для этого вы заходите на сайт Census.gov и размещаете сведения о рождаемости:
Юта выглядит лучше, чем Аляска, Вашингтон, Монтана, Вайоминг, Северная и Южная Дакота и небольшие штаты Северо-Востока. Но вряд ли можно сказать, что количество рождений там зашкаливает, особенно по сравнению с Калифорнией, Техасом, Флоридой и Нью-Йорком. Но погодите-ка, та карта, которую вы составили, показывает общее число рождений, а оно обязательно тем больше, чем больше население штата. Вместо этого вы могли бы составить карту с количеством новорожденных на тысячу жителей:
Это не помогает. Юта выглядит так же, как и остальные штаты. Что же делать? Поменяйте цвет! Вы можете поиграть с количеством величин в каждой категории — я имею в виду те полоски в самом низу, от серого до совсем черного. Удостоверившись, что уровень рождаемости Юты отображен отдельной категорией, вы заставите эти данные выделяться на фоне остальных.
Конечно, это стало возможно только потому, что у штата Юта действительно самый высокий уровень рождаемости — ненамного, но все же. Выбрав для него «корзину» отдельного цвета, вы заставили его выделяться.
Если бы вы захотели сделать то же самое с остальными штатами, вам пришлось бы прибегнуть к трюкам иного рода, например показать, сколько детей рождается на квадратную милю или на магазин сети Walmart, — и таким образом получить функцию от чистого дохода. Дайте волю фантазии, прикиньте разные варианты — и вы cможете привести аргументы в пользу любого из 50 штатов.
А как же правильно изобразить такие данные? Это вопрос спорный, но, пожалуй, одним из нейтральных способов будет объединение данных так, чтобы по 20 % штатов попали в одну из пяти категорий, каждая из которых отмечена своим цветом:
Другой вариант — сделать «корзины» одинакового размера:
Такой вид статистического обмана — использование категорий разных размеров на всех картограммах, кроме последней, — часто появляется в гистограммах. На приведенной ниже диаграмме показан средний процент числа подач{16} 50 лучших игроков Главной лиги бейсбола в сезоне 2015 года[58]:
Итак, предположим, что вы игрок, средний коэффициент результативности отбивания которого равен 0,330, — и этот факт определяет вас во вторую по высоте категорию. Настало время раздачи бонусов, и вы не хотите, чтобы у вашего руководства нашлись хоть какие-нибудь причины отказать вам в премии в этом году, — вы уже купили Tesla. Поэтому просто измените ширину «корзин», объединив свои результаты с результатами двух игроков, чей коэффициент результативности равен 0,337, — и вот вы уже среди лучших игроков. Сомкните строй столбцов (в «корзине» 0,327 больше нет бэттеров), сделав разрыв оси X, который могут заметить лишь немногие.
Обманчивое разделение на группы
В противоположность объединению выборок можно использовать разделение на группы, чтобы заставить кого-то поверить в то, чего на самом деле нет. Чтобы, например, заявить, что X — это главная причина Y, мне нужно просто разделить все остальные причины на более мелкие подгруппы.
Предположим, вы производите очистители воздуха и проводите кампанию, чтобы доказать, что респираторные заболевания — основная причина смерти в Соединенных Штатах, значительно превосходящая по частоте, например, заболевания сердечно-сосудистой системы или рак. Если говорить честно, то на сегодняшний день основная причина смерти в США — болезни сердца. По данным Центров по контролю и профилактике заболеваний в стране в 2013 году смерть в основном наступала по следующим причинам[59]:
болезни сердца: 611 105;
рак: 584 881;
хронические заболевания нижних дыхательных путей: 149 205.
Даже если отбросить тот неприятный факт, что домашние очистители воздуха не сильно защищают от хронических респираторных заболеваний, эти данные не станут убедительным доводом для вашей компании. Вам бы, конечно, хотелось спасать более 100 тысяч жизней в год, но тот факт, что вы сумели справиться с третьей по важности причиной смерти, не сильно поможет вашей рекламной кампании. Хотя постойте! Ведь болезнь сердца — это не одно заболевание, их несколько:
острая ревматическая лихорадка и хроническое ревматическое заболевание сердца: 3260
гипертоническая болезнь сердца: 37 144
острый инфаркт миокарда: 116 793
сердечная недостаточность: 65 120
И так далее. Подобным же образом разбейте на подгруппы виды рака — и дело в шляпе! Заболевания нижних дыхательных путей становятся причиной смерти номер один. И вот вы уже заработали свой бонус. Некоторые производители продуктов питания использовали эту стратегию, чтобы скрыть количество жиров и сахаров, содержащихся в их продуктах.
Как собирают данные
Помните, во вступлении к этой части книги было написано, что именно люди собирают статистические данные. Это они решают, что считать и как потом быть с результатами. В процессе сбора данных может возникнуть множество ошибок и перекосов, а это, в свою очередь, может привести миллионы людей к неправильным выводам. И хотя большинство из нас никогда не будут собирать данные, научиться критически думать об этом довольно легко и доступно каждому.
Данные получают самыми разными способами: изучая записи (например, касающиеся рождаемости и смерти, предоставленные государственным ведомством, больницей или церковью), проводя исследования и опросы, делая наблюдения (например, считая электрические автомобили, проносящиеся мимо на пересечении Основной улицы с Третьей) или путем умозаключений (если продажи подгузников ползут вверх, значит, вероятно, растет уровень рождаемости). Перекосы, неточности и откровенные ошибки могут появиться на любом этапе. Важно время от времени задаваться вопросами: «А мы и правда можем узнать об этом?» или «Откуда им это известно?»
Формирование выборки
Астрогеологи собирают образцы камней с лунной поверхности — они не исследуют Луну полностью. Исследователям не нужно разговаривать с каждым конкретным избирателем, чтобы понять, кто из кандидатов выбился в лидеры гонки, или вести подсчет всех, кто заходит в приемный покой, чтобы понять, как долго пациенту приходится ждать приема. Это было бы непрактично и слишком дорого. Специалисты используют выборки и на их основании строят оценки. Если выборки сделаны правильно, то оценка может быть в высшей степени точной. В случае с подсчетом голосов, например, узнать, каковы настроения в стране (а это примерно 234 миллиона человек в возрасте старше 21 года), можно, опросив 1067 человек. Биопсии 1/1000 органа достаточно для диагностирования рака.
Однако надо помнить, что выборка должна быть репрезентативной. А это бывает в случае, когда каждый человек или предмет в изучаемой группе имеет равные шансы быть выбранным. Если это не так, то ваша выборка окажется нерепрезентативной (перекошенной). Если рак обнаружен только в одной части органа, а вы делаете пробы на другой, то он не будет диагностирован. Если же он затронул лишь малую часть органа, а вы взяли 15 проб в этом месте, то вы можете сделать вывод, что весь орган покрыт раковыми клетками, хотя это совсем не так.
Мы не всегда знаем наперед — даже со всеми возможностями биопсии или опросами общественного мнения, — в каком интервале меняется изучаемый показатель. Если бы все элементы в совокупности были одинаковыми, то для выборки было бы достаточно одного из них. Будь у нас множество генетически идентичных людей с одинаковым внутренним миром и жизненным опытом, мы могли бы узнать все что угодно обо всех, просто изучив одного из них. Но каждая группа неоднородна, ее члены отличаются друг от друга, поэтому формировать выборку нужно очень аккуратно, чтобы точно знать, что мы охватили все возможные различия, которые имеют значение (потому что не каждое из них имеет значение). Например, мы знаем: если лишить человека кислорода, он умрет. В этом отношении люди друг от друга не сильно отличаются (хотя и отличаются по времени, которое они могут протянуть без кислорода). Но если я хочу узнать, сколько килограммов человек может поднять в технике жима лежа, начинаются различия — придется измерить показатель у большой группы самых разных людей, чтобы определить диапазон его изменения и стабильное среднее арифметическое. Я бы хотел опросить высоких и низких, полных и худых, мужчин и женщин, детей, бодибилдеров, домоседов, людей, принимающих анаболики, и трезвенников. Есть, наверное, и другие факторы, которые имеют значение, например сколько часов человек спал накануне тестирования, сколько времени прошло с момента последнего приема пищи, в гневе он или спокоен и т. д. Кроме того, есть вещи, которые мы вообще не считаем важными: кто был в тот день авиадиспетчером в аэропорту Сен-Юбер в Квебеке; обслужили ли случайно взятого посетителя в ресторане Абердина в тот день вовремя или нет. Это влияет на другие показатели, которые мы исследуем (латентный сексизм в индустрии авиаперевозок; удовлетворение посетителей в ресторанах Северо-Западного региона), но не на жим лежа.
В задачу статистика входит составление списка того, что имеет значение для получения репрезентативной выборки. Следует избегать наметившейся тенденции, когда переменные выбираются такие, чтобы было легко их идентифицировать или собирать по ним данные, — ведь бывает так, что значимые показатели не очевидны или их сложно измерять. Как говорил Галилео Галилей, следует измерять то, что измеримо, и делать измеримым то, что таковым не является. Некоторые наиболее творческие прорывы в науке оказались возможны потому, что были предложены способы измерить важные показатели, которые раньше измерять не умели.
Однако даже измерение и попытки контролировать переменные, о которых вы знаете, могут стать проблемой. Предположим, вы хотите изучить существующие на данный момент мнения об изменении климата в Соединенных Штатах. Вам выделили небольшую сумму денег, чтобы вы наняли помощников и купили статистическую программу для вашего компьютера. Так случилось, что вы живете в Сан-Франциско и поэтому решаете провести исследование здесь. У вас уже сложности: Сан-Франциско — нерепрезентативный город для всей остальной части Калифорнии, не говоря уже о Соединенных Штатах в целом. Понимая это, вы принимаете решение провести свой опрос в августе, поскольку, по результатам исследований, это самый пик туристического сезона и люди со всей страны едут в Сан-Франциско, так что (думаете вы) вы сможете изучить все многообразие мнений.
Но подождите: можно ли считать тех, кто приедет в Сан-Франциско, репрезентативной выборкой? Ведь вы будете учитывать только людей, которые могут себе позволить поездку, и тех, кто хочет провести свои каникулы в городе, вместо того чтобы, скажем, ехать в национальный парк (может даже случиться так, что вы невольно отдадите предпочтение либералам, так как Сан-Франциско известен своим либерализмом).
И тогда вы решаете, что не можете позволить себе исследовать мнение всех американцев и правильнее будет сконцентрироваться на жителях Сан-Франциско. Вы отправляете своих помощников на Юнион-сквер, где они будут останавливать прохожих и задавать им интересующие вас вопросы. Вы проводите инструктаж: вам нужны люди разных возрастов, этнической принадлежности, по-разному одетых, с татуировками и без них — короче говоря, вас интересует срез общества, самые его разные представители. Но у вас по-прежнему проблема: ведь вы вряд ли встретите на улице людей, прикованных к постели, молодых мам с маленькими детьми, тех, кто работает по сменам и отсыпается днем, а также сотни тысяч жителей Сан-Франциско, которые по каким-то причинам не придут в тот день на Юнион-сквер — в ту часть города, которая славится дорогими магазинами и ресторанами. Если вы отправите своих помощников в район Мишн-дистрикт, это поможет решить проблему социально-экономического статуса опрашиваемых, но не решит остальных ваших проблем. Выборка должна пройти такой тест: все ли представители группы имеют равные шансы попасть в нее? Очевидный ответ: нет.
В таком случае вы делаете стратифицированную случайную выборку. Это значит, что вы делите всю группу на страты или подгруппы, представляющие интерес, и набираете людей из них, соблюдая пропорцию по отношению к совокупности. Если вы проведете исследование, касающееся изменения климата, и обнаружите, что мнения не имеют ничего общего с расовыми категориями, вам не нужно будет создавать группы, основанные на расе[60]. К тому же делать какие-то предположения насчет расы может быть затруднительно или оскорбительно — а что вы будете делать с людьми смешанной расы? Поместите их в одну категорию или другую, а может, создадите для них отдельную? И что же потом? Появится категория для американцев, рожденных в браках, где один родитель — афроамериканец, а второй — представитель европейского типа или латиноамериканец, в браках, где смешана восточноазиатская и иранская кровь, и т. д.? В таком случае категории могут стать слишком узкими, и это только затруднит ваше исследование. Другая сложность: вам хочется, чтобы опрашиваемые были разного возраста, но ведь бывает, что люди стесняются говорить, сколько им лет[61]. Вы можете выбирать тех, кому явно за 40 или явно меньше, но при этом пропустите тех, кому около 38 или кто едва разменял пятый десяток.
Чтобы решить проблему с теми, кто отсутствует в течение дня, вы просто можете ходить по домам и разговаривать с каждым, кто откроет дверь. Но, опять же, если вы будете так ходить в дневное время, то упустите тех, кто на работе. Если вы будете ходить так по вечерам, то не учтете любителей клубной жизни, тех, кто работает посменно, тех, кто ходит в церковь на ночные службы, киноманов и тех, кто часто ходит в рестораны. А как, создав страты, вы получите случайную выборку в рамках ваших подгрупп? Все вышеописанные проблемы актуальны и по сей день — выделение подгрупп не решает той проблемы, что даже в рамках подгруппы вам нужно будет получить репрезентативное разнообразие других факторов, которые могут повлиять на ваши данные. Видимо, нам придется собрать все имеющиеся на Луне камни, чтобы провести качественный анализ пород.
Но не спешите сдаваться. Стратифицированная случайная выборка лучше нестратифицированной. Если вы наугад отберете несколько студентов для изучения полученного ими академического опыта, то, возможно, получите выборку студентов, которые учатся в крупных государственных вузах, — в случайную выборку, скорее всего, попадут именно они, потому что таких большинство. Вам известно, что студенческая жизнь в маленьких частных гуманитарных вузах складывается совершенно по-другому, поэтому вам нужно удостовериться, что в вашей выборке есть и такие студенты, — и в вашу стратифицированную выборку попадут студенты из учебных заведений самых разных размеров.
«Опросив каждую птичку, встретившуюся на тротуаре за пределами этого здания, мы пришли к заключению, что птицы предпочитают бейглы!»
Следует отличать случайную выборку от удобной — когда вы просто опрашиваете своих знакомых или людей на улице, которые кажутся вам подходящими. Без случайности выборки ваш опрос может оказаться предвзятым.
Именно из-за формирования выборок сбор данных может превратиться в бесконечную битву за отсутствие предвзятости. И исследователи побеждают не всегда. Всякий раз, читая в газете, что 71 % британцев отдают чему-то предпочтение, мы должны спрашивать себя: «Да, но 71 % каких именно британцев?»[62]
Прибавьте к этому тот факт, что вопросы, которые мы задаем людям, — лишь выборка всех возможных вопросов, которые мы могли бы задать. Так же как их ответы, в свою очередь, могут быть всего лишь выборкой тех неоднозначных мнений и жизненного опыта, которыми они обладают. Что еще хуже, они могут понимать или не понимать, что мы спрашиваем, а пока они отвечают, их может что-то отвлекать. И гораздо чаще, чем хотелось бы тем, кто проводит опросы общественного мнения, люди намеренно дают неправильный ответ. Ведь люди — существа социальные; многие стараются избегать столкновений или хотят угодить и потому отвечают так, чтобы соответствовать ожиданиям. С другой стороны, есть ведь и такие члены общества, которые лишены избирательных прав или придерживаются нонконформистских взглядов и потому будут отвечать неискренне, примеряя маску этакого бунтаря, просто чтобы узнать, каково это — шокировать и бросать вызов[63].
Получить непредвзятую выборку не так-то просто. Когда вы держите в руках статистические данные, спросите себя: «А какой перекос мог получиться в этой выборке? Не смещена ли она?»
Выборка дает нам оценки чего-либо, и почти всегда они отличаются от истинного значения, сильно или не очень. Это называется погрешностью. Воспринимайте ее как цену, которую вы платите, чтобы не выслушивать каждого человека в группе или чтобы не изучать каждый отдельный камень на Луне[64]. Конечно, ошибки могут возникнуть, даже если вы действительно поговорили с каждым, — так случается из-за дефектов измерительного аппарата. Погрешность не имеет ничего общего с неточностями в самом исследовании — скорее она отражает степень ошибки в самом процессе отбора данных для анализа. Но давайте на мгновение забудем об этом, поскольку есть еще один вид измерений, который сопровождает любую строго собранную выборку: доверительный интервал.
Погрешность показывает, насколько близки полученные результаты к истинным значениям, а доверительный интервал — это степень уверенности в том, что оценка не выходит за пределы этой погрешности. Например, в стандартном опросе, предполагающем выбор из двух возможностей, случайная выборка из 1067 взрослых американцев даст погрешность в 3 % в любую сторону (напишем ±3 %). Значит, если опрос покажет, что 45 % американцев поддерживают кандидата А, а 47 % — кандидата Б, истинное значение будет приблизительно между 42 и 48 % для А и между 44 и 50 % для Б. Обратите внимание, что получившиеся промежутки пересекаются[65]. Это означает, что разница в 2 % между кандидатом А и кандидатом Б находится в рамках погрешности: мы не можем сказать, что один из них на самом деле опережает другого, и потому сложно пока предсказать исход гонки.
Насколько мы уверены в том, что погрешность равна 3 %, а не больше? Мы находим доверительный интервал. В приведенном мной примере рассматривался интервал с уровнем доверия 95 %. Это означает, что если бы мы проводили голосование сто раз при использовании тех же самых выборочных методов, в 95 случаях из этих 100 полученный интервал содержал бы истинное значение. В 5 случаях из 100 истинное значение выходило бы за полученные рамки[66]. При этом доверительный интервал не говорит нам, насколько сильно оно за них выходит: разница могла бы быть как большой, так и маленькой; для ответа на этот вопрос придется прибегать к другим статистическим методам.
Уровень доверия можно установить такой, какой хочется, но обычно это 95 %. Чтобы сузить доверительный интервал, можно сделать одно из двух: либо при заданном уровне доверия увеличить размер выборки, либо для заданного размера выборки уменьшить уровень доверия. В случае с фиксированным размером выборки изменение уровня доверия с 95 до 99 увеличит размер интервала. В большинстве случаев дополнительные расходы или неудобства того просто не стоят, тем более что уже на следующий день или на следующей неделе под влиянием внешних факторов респонденты могут поменять свое мнение.
Обратите внимание, что для очень больших совокупностей — как, например, население США — нам нужно сделать очень маленькую выборку, меньше 0,0005 %. Но для совокупностей поменьше — например, в случае с корпорацией или школой — доля попавших в выборку должна быть больше. В компании, штат которой составляет 10 000 сотрудников, нам бы пришлось отобрать 964 (почти 10 %), чтобы получить 3 %-ную погрешность с уровнем доверия в 95 %, а в компании, где работает 1000 сотрудников, из них нужно отобрать 600 (60 %).
Допустимая погрешность и доверительный интервал применимы к выборкам любого рода, не только к людям: можно отслеживать количество электромобилей в городе, злокачественных клеток в поджелудочной железе или ртути в рыбе, которую продают в супермаркете. Допустимая погрешность и размер выборки, представленные на графике ниже, указаны для доверительного интервала в 95 %.
В конце книги вы найдете формулу, по которой можно подсчитать погрешность, а кроме того, существует множество онлайн-калькуляторов[67]. Если вы видите, что статистический результат приведен, а погрешность не указана, можете подсчитать ее самостоятельно, просто выяснив количество людей, участвовавших в опросе. Вы увидите: такое случается на каждом шагу, а докладчик или организация, проводившая опрос, не предоставляет эту информацию. Это похоже на график без осей — можно легко обманывать с помощью статистики, просто не сообщая погрешность или доверительный интервал. Вот так, например: мой пес по кличке Шедоу занимает лидирующую позицию на выборах губернатора от штата Миссисипи, у него 76 % голосов. (С не указанной в докладе погрешностью в ±76 %[68]. Голосуйте за Шедоу!!!)
Смещение выборки из-за правила отбора
Пытаясь получить случайную выборку, исследователи иногда допускают ошибки в оценке, имеет ли каждый человек или предмет равные шансы попасть в выборку.
В 1936 году во время выборов президента США была допущена вопиющая ошибка. Журнал The Literary Digest проводил опрос, из которого заключил, что на выборах республиканец Альф Лэндон победит тогдашнего президента, члена Демократической партии Рузвельта. The Literary Digest не построил случайную выборку, а опросил тех, кто читал журналы, имел автомобиль или пользовался телефоном. Общепринятое объяснение, процитированное позже во многих научных и популярных статьях, звучало так: в 1936 году такой принцип отбора увеличил долю состоятельных респондентов, а они чаще голосовали за кандидата-республиканца. На самом деле, согласно опросу, проведенному Джорджем Гэллапом в 1937 году, это общепринятое объяснение было неверно — владельцы автомобилей и телефонов гораздо охотнее поддержали бы Рузвельта[69]. Дело в том, что у сторонников Рузвельта просто было меньше шансов принять участие в опросе. Гэллап обнаружил нерепрезентативность выборки, он провел свой собственный опрос, построив случайную выборку, и потому смог верно предсказать результат выборов. Так родилось понятие «опрос Гэллапа». И оно стало золотым стандартом проведения опросов политического мнения до 2012 года, когда произошла ошибка с определением будущего победителя президентских выборов в США. Как было выявлено в ходе расследования, во время формирования выборки были допущены грубые ошибки, по иронии судьбы связанные с опросом пользователей телефонной связи[70].
Так же, как телефонные опросы в 1930-е и 1940-е смещали выборку в сторону состоятельных людей, в этот раз выборка сместилась в сторону более пожилых респондентов. Опрос по телефону основан на том, что те, у кого есть телефоны, хорошо отображают мнение всего населения в целом. Однако это не обязательно: многие сотрудники Кремниевой долины используют для общения интернет-приложения, поэтому телефонная выборка может попросту не учитывать тех, кто пользуется высокими технологиями.
Если вы хотите схитрить с помощью статистики и замести следы, находите средний рост, опрашивая людей рядом с баскетбольным полем, узнавайте средний доход, проводя опросы возле центра занятости, оценивайте заболеваемость раком в стране, делая выборку рядом с плавильным заводом. Если вы сами не расскажете, как именно отбирали данные для анализа, никто и не узнает.
Смещение выборки из-за отказа участников
Те, кто хочет поучаствовать в исследовании, и те, кто не выражает особого желания, различаются по многим другим аспектам, например по политическим взглядам, характеру, достатку. Схожим образом те, кто откликается на объявление о наборе добровольцев для участия в эксперименте, могут иметь предвзятое мнение относительно того предмета, который вас интересует. Если вы стараетесь привлечь для исследования «среднего» человека, то можете сместить выборку, сообщив заранее тему опроса. Скажем, исследование сексуальной ориентации будет иметь смещение скорее в сторону тех, кто готов рассказать об этом открыто, нежели тех, кто скромен и придерживается пуританских взглядов. При изучении мнений, касающихся политики, выборка будет смещена в сторону респондентов, расположенных поговорить на эту тему. Поэтому многие опросники, анкеты и исследования никогда не объявляют заранее тему опроса либо просто камуфлируют истинную цель исследования несколькими незначительными вопросами, в ответе на которые исследователь совсем не заинтересован.
Те, кто отвечают на все вопросы до конца, сильно отличаются от тех, кто останавливается раньше времени. Некоторые респонденты попросту не хотят ничего отвечать. Это может создать необъективную картину, когда типы тех людей, которые отвечают, и тех, кто не желает, отличаются. В результате возникает особый тип смещения выборки, который называется ошибкой пропущенных данных.
Допустим, вы работаете в Гарвардском университете и хотите показать, что выпускники вашего учебного заведения, как правило, получают большие зарплаты уже через два года после окончания вуза. Вы рассылаете анкету выпускникам. И уже на этой стадии возникают сложности: те, кто переехал куда-то, не известив об этом университет, те, кто сейчас в тюрьме, или те, кто стал бездомным, попросту не получат ваши вопросы. А среди тех, кто на них ответит, большую часть, скорее всего, составят успешные люди, благодарные университету за то, что он для них сделал, а не те, кто в итоге потерял работу и теперь обижен на жизнь. Те, чьего мнения вы не учитываете, вносят свою лепту в ошибку пропущенных данных. Иногда данные при этом искажаются систематически.
Если ваша цель — показать, что образование, полученное в стенах Гарварда, напрямую обуславливает последующую высокую зарплату, то такое исследование поможет вам убедить большинство. Но критическое мышление, присущее отдельным людям, подскажет им, что тех, кто учится в Гарварде, ни в коем случае нельзя назвать средними представителями: это, как правило, выходцы из семей с высоким доходом, а данный показатель коррелирует с зарплатой выпускника. Студенты Гарварда отличаются предприимчивостью и энергией. Они могли бы заработать столько же и в том случае, если бы посещали колледж с репутацией похуже или вовсе бы не получили образования (Марк Цукерберг, Мэтт Деймон и Билл Гейтс — финансово успешные люди, которые когда-то вылетели из Гарварда).
Если вы просто не можете охватить какой-то сегмент совокупности, например военных, расквартированных за рубежом, бездомных или тех, кто находится в больнице или ином лечебном учреждении, смещение выборки будет называться ошибкой неполного охвата, потому что некоторые члены совокупности из которой вы намеревались сделать выборку, находятся вне зоны досягаемости, и поэтому их нельзя выбрать. Если вы пытаетесь подсчитать, сколько в банке мармеладных конфет красного, оранжевого или желтого цветов, то, возможно, не сумеете добраться до дна[71]. Биопсия некоторых органов часто ограничена тем местом, где хирург может сделать забор материала, а оно, возможно, не репрезентативно относительно всей совокупности клеток. В психологических исследованиях подопытными часто становятся студенты последнего курса, хотя, строго говоря, они не могут быть репрезентативны относительно общей совокупности. В США наблюдается огромное разнообразие представителей разных систем ценностей, мнений и политических взглядов, люди различаются жизненным опытом и образом жизни. И хотя было бы ошибкой заявить, что все студенты одинаковы, такой же ошибкой было бы сказать, что они точно соответствуют остальной части совокупности.
Смещение выборки из-за ответов
Иногда во время опроса люди могут откровенно лгать. Выпускница Гарварда может преувеличить сведения о своих доходах, просто чтобы выглядеть более успешной или сообщить о том, сколько она должна была заработать, если бы не обстоятельства. Точно так же она может и преуменьшить цифры, и тогда Ассоциация выпускников Гарварда не будет ждать от нее больших пожертвований. Подобные хитрости могут смещать выборку, а могут и никак на нее не влиять. Среднее арифметическое, которое мы получаем в итоге в нашем исследовании относительно зарплат выпускников Гарварда, — это всего лишь среднее значение, выведенное из тех сведений, которые они предоставили, а не из их реальной зарплаты. У богачей вообще может не быть четкого представления о своем ежегодном доходе, потому что он не ограничивается зарплатой — тут еще много других источников дохода, которые разнятся от года к году, например доход от вложений, дивиденды, бонусы, роялти и пр.
Представьте, что вы спрашиваете у своих респондентов, списывали ли они на экзамене или пытались ли когда-нибудь уйти от налогов. Они могут не поверить, что ваше исследование абсолютно конфиденциально, и не захотят говорить откровенно. (Подобная проблема существует в США и с иммигрантами: невозможно оценить, сколько из них нуждаются в медицинском обслуживании или стали жертвами преступлений. Многие из них боятся обращаться в больницу или в полицию, так как опасаются, что за ними придут иммиграционные службы.)
Вот еще пример: вы хотите узнать, какого рода журналы читают люди[72]. Можно просто спросить их об этом. Но ведь может быть и так, что они захотят произвести на вас хорошее впечатление. Или станут приписывать себе более тонкий вкус, которым в действительности не обладают. Вы можете обнаружить, что людей, заявляющих, будто они читают New Yorker или The Atlantic, намного больше, нежели вы предполагали исходя из продаж. А тех, кто читает Us Weekly и The National Enquirer, намного меньше. Респонденты не всегда честны во время опросов. И вы, выходит, изучаете не то, что люди читают, а их снобизм.
И тогда у вас рождается план: вы думаете отправиться прямиком к ним домой и посмотреть, что за журналы лежат у них в гостиной. Но искажения есть и здесь: вы не узнаете, что люди читают, — то, что вы увидите в гостиной, скорее расскажет вам о том, какие издания люди не выбрасывают после прочтения или что выкладывают на виду, желая произвести впечатление. Узнать, какие журналы они читают, сложнее, чем подсчитать те журналы, которые они покупают (или выкладывают). Но это очень важное разграничение, особенно для тех, кто занимается рекламой.
Как определить, отождествляет ли себя человек с несколькими расами? Если бы он вырос в общине, где живут люди определенной расы, то вряд ли был бы склонен думать о себе как о представителе нескольких рас. А если бы столкнулся с дискриминацией, у него было бы больше склонности к такому отождествлению. Мы могли бы точно определить смешение рас, но не факт, что люди расскажут об этом так, как нам бы того хотелось.
Отсутствие единого стандарта
Все измерения должны быть стандартны. Должны существовать прозрачные, воспроизводимые, точные способы сбора данных, чтобы все, кто проводит исследования, формировали выборки одинаково. Возьмем шкалу Глисона{17} — она весьма условна, а значит, вы можете получить разные заключения от разных патологов и, следовательно, диагностировать разные степени рака (образец ткани предстательной железы изучается под микроскопом и оценивается по шкале Глисона от двух до десяти — на основе этих данных можно высчитать вероятность развития рака)[73]. Психиатры расходятся во мнении относительно одного пациента: есть ли у него шизофрения или нет. Статистики не согласны с тем, что составляет суть психического феномена. Патология, психиатрия, парапсихология и другие сферы стараются создать определенные процедуры, проведение которых приводило бы к определенным результатам. Но почти все тесты дают неоднозначные ответы, из-за чего возникает несогласованность в диагнозах специалистов. Если вас попросят взвеситься, вы будете это делать в одежде или без нее, оставив кошелек в кармане или вытащив его? Если вам нужно будет проверить температуру стейка на гриле, вы остановитесь на одном результате или померяете температуру несколько раз и вычислите среднее значение?
Ошибки в измерениях
Участники опроса могут неправильно понять вопрос интервьюера; поставить не там галочку в анкете; дать не тот ответ, который собирались. Ошибки в измерениях могут возникнуть в любой научной дисциплине. По сообщениям физиков Conseil Européen pour la Recherche Nucléaire (Европейский совет по ядерным исследованиям, ЦЕРН), им удалось измерить скорость нейтрино, которая оказалась больше скорости света, — факт, который мог занять достойное место среди величайших открытий последнего столетия. Позже, однако, ученые признали, что в их измерениях был обнаружен недочет[74].
Ошибки измерения возникают, когда мы пытаемся выразить что-либо количественно. Президентские выборы, проходившие в 2000 году в Америке, свелись к ошибке измерения (и неверному фиксированию намерений избирателей): у разных комиссий, занимавшихся подсчетом голосов, получились разные результаты. Отчасти так вышло из-за отсутствия согласованности в способе подсчета бюллетеней — но даже когда ясность была внесена, результаты все равно были неоднозначными.
Или вот еще пример. Всем известно, что когда мы подсчитываем монетки в банке с мелочью, то всякий раз получаем разные результаты. Если встать на весы в ванной три раза подряд, мы получим разные результаты. Измеряя длину комнаты, мы можем каждый раз получать новые цифры. И это объяснимо: пружины в ваших весах — несовершенное в плане механики устройство. Пользуясь сантиметром, вы всякий раз держите его по-разному, он каждый раз располагается немного по-разному или просто недостаточно длинный, чтобы можно было измерить всю комнату, — и вам приходится помечать место на полу и делать измерения в два или три приема, что только увеличивает вероятность ошибки. Даже сам инструмент, с помощью которого вы проводите измерение, может быть неточным (конечно, у измерительных приборов есть класс точности, и чем дороже прибор, тем этот класс выше). Напольные весы в ванной могут иметь погрешность в несколько десятков граммов, а у почтовых весов она составляет унцию (почти 30 граммов).
Во время переписи населения США в 1960 году было зафиксировано 62 молодых женщины в возрасте от 15 до 19, у которых было по 12 детей и больше, а также огромное количество 14-летних вдов[75]. Здравый смысл уверяет нас, что не может такого быть, уж очень это все необычно. Видно, кто-то тут ошибся. Наверное, кто-то из респондентов случайно или специально отметил не ту графу, чтобы поскорее закончить с трудоемким опросом. А может, проказливые участники опроса навыдумывали диковинных историй, а исследователи и не заметили.
В 2015 году профессиональный клуб по американскому футболу New England Patriots был обвинен в обмане, так как якобы приспустил свои мячи, чтобы их было легче ловить. Защищаясь, представители клуба заявили, что была допущена ошибка измерения[76]. Давление в мячах обеих команд, Patriots и Indianapolis Colts, в тот день проверяли в перерыве после первой половины матча. Первыми проверяли мячи команды Patriots. Мячи Colts пролежали дольше в теплой раздевалке, из-за чего нагрелись, и потому давление в них было выше. Суд федерального округа принял эту информацию, равно как и другие показания, к сведению и заявил, что не видит в поступках команды злонамеренности.
Ошибки в измерениях возникают и тогда, когда ваш измерительный инструмент — весы, рулетка, анкета или тест — не предназначен для того, что вы собирались измерить, например когда вы рулеткой меряете толщину человеческого волоса или предлагаете респонденту анкету с вопросами о депрессии, когда на самом деле изучаете вопрос мотивации. Подсчитать кандидатов, получивших финансовую поддержку от избирателей, совсем не то же самое, что знать, как последние проголосуют, — ведь многие поддерживают сразу нескольких кандидатов.
Огромное количество чернил уже было потрачено на исследования, предполагавшие показать одно, но показавшие в результате другое. Тест на IQ — как раз из тех, что чаще всего получает неверную трактовку. Его используют, чтобы оценить умственные способности человека, как будто это какое-то одно качество. На самом деле, конечно, это не так — способности проявляются в самых разных формах: ориентировании в пространстве, знании искусства, математики и т. д. Как известно, в тестах на IQ есть некий перекос в сторону белых людей среднего класса. По результатам такого теста мы хотим понять, насколько человек подходит для усвоения определенной школьной программы или выполнения работы. Тесты на IQ могут предсказывать успешность испытуемых в таких ситуациях, но, вероятно, не потому, что человек с высоким IQ гораздо умнее, а потому, что у него много других преимуществ (экономических, социальных), которые и выявил тест.
Если в основе статистических данных, которые вы держите в руках, лежит исследование, постарайтесь выяснить, какие вопросы задавались, и посмотрите, достаточно ли они разумны и непредвзяты. Постарайтесь также понять, как проводили измерение исследуемого предмета и был ли тот, кто собирал данные, достаточно квалифицирован.
Определения
То, как понятия определяются и распределяются по категориям, влияет на статистические данные, которые вы получите в результате. С этой проблемой часто сталкиваются в естественных науках, например когда диагностируют стадию рака или описывают количество осадков. А в общественных науках такое случается, когда у респондентов спрашивают об их мнении или опыте.
Был ли сегодня дождь в Большом Сент-Луисе? Все зависит от того, что вы называете дождем. Если упала одна-единственная капля на территории в 8846 квадратных миль, входящих в состав Большого Сент-Луиса (согласно Административно-бюджетному управлению США), можно ли сказать, что шел дождь? Сколько капель должно упасть, над какой по размеру территорией и за какой период, чтобы мы считали, что в этот день выпали осадки?
В зависимости от выбранного рабочего определения у Бюро статистики труда США есть два разных способа замерить уровень инфляции: личные потребительские расходы (ЛПР) и индекс потребительских цен (ИПЦ) могут давать разные результаты. Если вы сравниваете два года или два региона страны, вам, конечно, нужно убедиться, что вы в обоих случаях используете один и тот же индекс. Если же вы просто хотите продемонстрировать, как сильно изменилась инфляция в последнее время, то, будь вы недобросовестным пользователем статистики, вы выбрали бы из двух тот, что производит большее впечатление, а не тот, что кажется более подходящим, — вы бы руководствовались пониманием их различий.
Или вот еще пример: что значит «бездомный»? Это тот, кто спит на тротуаре или в машине? Ведь у человека, может, и есть дом, но он не хочет туда идти. А как быть с женщиной, которая временно живет у подруги, потому что потеряла свою квартиру? Или с семьей, которая продала свой дом и теперь живет несколько недель в отеле, ожидая, пока в новом доме закончится ремонт? Или со сквоттером, который счастливо живет на заброшенном складе? При сравнении такого явления, как бездомность, в разных городах и штатах мы будем иметь дело с разными — с юридической точки зрения — определениями[77]. И даже если они будут стандартизированы, то могут отличаться от того, что вы вкладываете в это понятие. Отсюда и невозможность решить проблему в больших городах — мы просто не понимаем, кто подходит под этот критерий.
Всякий раз, сталкиваясь с новостным репортажем, в котором упоминаются новые исследования, нужно быть внимательным с определениями, которые получили те или иные элементы исследования, и решать для себя, приемлемы ли они и разумны ли. Это особенно важно, когда речь идет о таких острых темах, как аборты, брак, война, изменения климата, минимальная заработная плата, жилищная политика.
Нет ничего более политизированного, чем политика. Любое определение можно перекрутить и переиначить согласно тем целям, которые вы преследуете. Представьте, что кандидат на какой-то политический пост нанял вас, чтобы собрать информацию о своем оппоненте, Алисии Флоррик[78]. Если только ей не удалось покорить сердца абсолютно всех избирателей, они так и будут чем-нибудь недовольны. Вам нужно задать вопрос: «Есть ли что-нибудь, с чем вы не согласны или чего вы не одобряете в ее словах и поступках, даже при условии, что вы ее поддерживаете?» Теперь почти у всех найдутся хоть какие-нибудь претензии, и вы сможете ответить своему работодателю: «81 % опрошенных не одобряют действия Флоррик». Вы собрали данные по одной детали (пусть это было всего лишь небольшое недовольство) и создали некий массив однотипных жалоб, назвав его на новый лад — «неодобрение». А что, звучит почти справедливо.
Непостижимые и непроверяемые вещи
Термин GIGO («Garbage in — garbage out») был придуман первыми компьютерщиками и означает «Мусор на входе — мусор на выходе». Было время, когда пользователи слепо верили всему, что выдавал компьютер, потому что это выглядело чем-то точным и несомненным. Если статистика складывается из неаккуратно собранных данных, измерений, предположений, недопониманий, упрощений и неверных оценок, то и результат будет соответствующим.
Многое из того, что мы читаем, должно вызывать подозрения. Задайте себе вопрос: возможно ли вообще, чтобы кто-нибудь знал об этом? В газетах пишут о количестве суицидов, совершенных подростками нетрадиционной ориентации: геями и лесбиянками[79]. Да ни одна из подобных статистических выкладок не имеет никакого веса, особенно если принять во внимание тот факт, что довольно сложно определить, наступила ли смерть в результате самоубийства и был ли человек геем. Точно так же, с некоторым подозрением, стоит относиться и к сообщениям о количестве смертей, наступивших в результате голода в отдаленных районах, или о количестве жертв геноцида во время гражданской войны, а также к информации об убитых и раненых во время военных операций США в Ираке и Афганистане.
Один издатель хвастается, что у его журнала 2 миллиона читателей. Но откуда он это знает? А он и не знает. Он предполагает, что некоторую часть купленных номеров потом дают почитать кому-то еще, — он называет эту часть долей вторичных читателей. Он предполагает, что каждый номер журнала, который закупила библиотека, читается определенным числом людей. То же касается книг, а также их электронных версий. Конечно, тут нельзя обобщать, все зависит от книги. Многие купили книгу Стивена Хокинга A Brief History of Time{18}. Говорят, что это самая покупаемая книга за последние 30 лет. Но также говорят, что очень немногие дочитывают ее до конца. Вероятно, немногие дают ее почитать, потому что кажется престижным просто иметь ее в своей гостиной. Но сколько же на самом деле читателей у журнала? Сколько людей действительно слушают подкаст? Нам это неизвестно. Мы знаем, сколько экземпляров было продано или загружено, и на этом все (хотя новые технологии в области электронных книг могут изменить этот давно устоявшийся статус-кво).
В следующий раз, прочитав о том, что в среднем житель Новой Зеландии использует зубную нить 4,36 раза в неделю (цифра, которую я только что выдумал, но она вполне может оказаться правдивой, как и любая другая оценка), спросите себя: «А как автор статьи об этом узнал? На какие данные он ссылается?» Если бы в ванных комнатах стояли скрытые камеры, это было бы одно. Но ведь, скорее всего, об этом рассказывали сами люди, отвечая на вопросы анкеты, и сообщали они только то, что помнят, — или то, что считают правдой, потому что уж так мы устроены.
Вероятности
Вы мне поверили, когда я сказал, что, вероятно, лишь немногие отдали почитать свой экземпляр книги A Brief History of Time? Я очень вольно использовал термин, как делают многие, но тема математической вероятности апеллирует к пределам наших сведений о мире и простирается от поведения субатомных частиц, например кварков и бозонов, до правдоподобности сообщений о скором конце света; от людей, участвующих в государственной лотерее, до тех, кто пытается предсказывать погоду (две вещи, которые могут иметь схожие шансы на успех).
Вероятности позволяют нам представить будущие события в цифрах и помогают принимать практические решения. Без них мы можем поддаться обаянию пустых анекдотов и забавных историй. Может, вы слышали, что кто-нибудь говорил: «Я не буду пристегиваться в машине, потому что слышал историю, когда парень погиб из-за того, что был пристегнут[80]. Он оказался в собственной машине, как в ловушке, и не смог из нее выбраться. Если бы он не был пристегнут, то остался бы жив».
Да, конечно, но мы не можем делать выводы из одной или двух историй. Каковы относительные риски? Хотя есть несколько таких случаев, когда ремень безопасности стоил человеку жизни, все же без него вероятность смертельного исхода гораздо выше. Вероятность помогает нам взглянуть на ситуацию с помощью цифр.
Мы используем слово «вероятность» по-разному, чтобы обозначить разные вещи. Очень легко запутаться, считая, что человек имеет в виду одно, тогда как на самом деле он думает совсем другое. Подобное заблуждение может привести к тому, что сделанные нами выводы окажутся неверными.
В основе одного из видов вероятности — классической — лежит идея симметрии и равной вероятности: у игрового кубика шесть граней, у монеты — две стороны, у колеса рулетки — 38 слотов (это в США — в Европе 37)[81]. Если исключить производственный брак или жульничество, в результате которого можно фальсифицировать желаемый результат, то все исходы равновозможны. То есть вероятность выкинуть на кубике конкретное число равна одной шестой; вероятность выпадения решки при подбрасывании монеты равна одной второй; в случае с игрой в рулетку вероятность любого слота — 1/38 или 1/37.
Классическая вероятность ограничена подобного рода структурами, в которых уже все четко определено и задано. В классическом случае мы знаем точно параметры системы и поэтому можем подсчитать вероятность для каждого возможного случая. Второй вид вероятности возникает потому, что в повседневной жизни мы часто хотим знать вероятности событий, которые не включены в такую симметричную схему. Нам интересно, какова вероятность того, что лекарство поможет пациенту или что клиенты предпочтут один сорт пива другому. В этом случае нам нужно сначала оценить параметры системы, потому что изначально они не заданы.
Чтобы определить, что же собой представляет второй тип вероятности, мы делаем наблюдения или проводим эксперименты, а также считаем, сколько раз получился желаемый результат. Это так называемая частотная, или статистическая, вероятность. Мы назначаем лекарство группе пациентов и смотрим, скольким из них станет лучше, — это эксперимент, и вероятность того, что лекарство сработает, определяется как доля людей, которым оно помогло (мы основываемся на частоте случаев с желаемым результатом). Если провести такой эксперимент на большом количестве людей, результат будет очень близок к истинной вероятности, так же, как при опросах общественного мнения[82].
И классическая, и частотная вероятность имеют дело с повторяющимися, воспроизводимыми событиями, а также с долей случаев, которые приводят к определенному исходу в практически неизменных условиях (некоторые бескомпромиссные теоретики настаивают на том, что условия должны быть абсолютно идентичными, но я думаю, что они заходят слишком уж далеко, потому что в пределе Вселенная никогда не бывает абсолютно одинаковой, всегда есть случайные вариации)[83]. Когда вы проводите опрос общественного мнения среди случайных людей, то делаете это в идентичных условиях, даже если одних людей вы опрашиваете сегодня, а других завтра (конечно, при условии, что в этом промежутке не произойдет ничего такого, что могло бы изменить их точку зрения). Когда свидетельница в суде дает показания и говорит, что ДНК подозреваемого совпадает с ДНК крови, найденной на пистолете, она использует частотную вероятность, потому что скорее принимает в расчет те фрагменты ДНК, которые совпадают, нежели те, которые различаются[84]. Когда вы вытягиваете карту из колоды, отсортировываете дефектную деталь на конвейере или спрашиваете участников опроса, любят ли они определенную марку кофе, — все это примеры классической или частотной вероятности повторяющегося, воспроизводимого события (в примере с картой — классическая вероятность, в примере с деталью на конвейере или кофе — частотная).
Третий вид вероятности отличается от описанных выше тем, что ее не получают экспериментально и определяют не для повторяющихся событий, — скорее она выражает мнение или степень уверенности в том, что какое-то событие произойдет. Она называется субъективной вероятностью (один из ее видов — байесовская вероятность, получившая свое название по имени статистика XVIII века Томаса Байеса). Когда подруга говорит, что на 50 % уверена, что пойдет в эти выходные на вечеринку к Майклу и Джулии, она использует байесовскую вероятность, выражая некую степень уверенности в том, что так оно и будет. Каким будет уровень безработицы к следующему году? Мы не можем тут использовать частотную вероятность, потому что нельзя рассматривать безработицу следующего года как набор наблюдений, выполненных при идентичных или даже схожих обстоятельствах.
Давайте разберемся на примере. Когда ведущая прогноза погоды сообщает, что вероятность дождя завтра 30 %, мы знаем, что она не проводила экспериментов в течение нескольких идентичных в плане погодных условий дней (даже если бы такое было возможно). Цифра в 30 % выражает степень ее уверенности{19} (по шкале от одного до 100) в том, что будет дождь, и своей целью она ставит доведение до вашего сведения некоей информации, которая может заставить вас призадуматься, нужны ли вам будут завтра галоши и зонтик.
Если ведущая прогноза погоды — хорошо проверенный источник, то дождь будет идти в 30 % случаев, про которые она говорила, что вероятность дождя 30 %. Если дождь будет идти в 60 % случаев, то она ошиблась, и намного. Вопрос о том, насколько проверен источник, важен только в случае с субъективной вероятностью.
Кстати, давайте вернемся к вашей подруге, сказавшей, что ее шансы пойти на вечеринку равны 50 %. Многие из тех, кто не привык мыслить критически, часто допускают подобную ошибку: они полагают, что если есть два варианта, то они должны быть равновероятны. Когнитивные психологи Амос Тверски{20} и Дэниел Канеман{21} описали вечеринки и иные возможные сценарии людям, участвовавшим в эксперименте. На конкретной вечеринке, например, гостям могут сказать, что в зале присутствуют 70 % писателей и 30 % инженеров. Если вы столкнетесь с кем-то, у кого будет татуировка с портретом Шекспира, то справедливо решите, что перед вами один из пишущей братии, но если вы наткнетесь на кого-то с уравнением Максвелла{22} на футболке, то справедливо решите, что перед вами инженер. А что, если вы столкнетесь с человеком без опознавательных признаков — ни татуировки, ни математических формул на футболке, — какова вероятность того, что перед вами инженер? В опросах, проведенных Тверски и Канеманом, люди обычно говорили о вероятности «50 на 50», совершенно не видя разницы между двумя возможными исходами и двумя одинаково вероятными исходами[85].
Субъективная вероятность — единственная из всех возможных, находящихся в нашем распоряжении в тех ситуациях, где нет места эксперименту и симметрии условий. Когда судья дает присяжным указание вынести вердикт, указывает ли «перевес улик» на вину ответчика, то налицо субъективная вероятность — каждый из присяжных должен самостоятельно решить, есть ли перевес, взвешивая все улики на весах собственных внутренних (возможно, не объективных) принципов и убеждений.
Когда букмекер оценивает шансы на скачках, он пользуется субъективной вероятностью — хотя послужной список лошади, здоровье и история наездника тоже могут предоставить некую информацию, тут нет естественной симметрии (это не случай классической вероятности) и тут нет никакого эксперимента (что исключает возможность частотной вероятности). Тот же принцип действует и в бейсболе или любом ином виде спорта. Букмекер может сказать, что шансы «Роялс» выиграть следующий матч равны 80 %, но это не вероятность в математическом смысле; просто таким образом он — и мы вместе с ним — использует язык, чтобы придать своим словам весомость, числовую точность. Букмекер не может повернуть стрелки часов вспять и просмотреть несколько раз один и тот же матч «Роялс», чтобы подсчитать, сколько раз они его выиграют. Он может, правда, подсчитать все математически или использовать компьютер, чтобы построить базу для оценки, но, в конце концов, его числа — всего лишь догадка, степень его уверенности в собственном предсказании. Субъективность оценок подтверждается тем, что у разных экспертов получаются разные числа[86].
Субъективные вероятности окружают нас, при том что мы в большинстве своем их не замечаем — мы встречаемся с ними в газетах, в залах заседания совета директоров, в спортзалах. Вероятность того, что какая-нибудь страна, не отличающаяся политической чистоплотностью, в ближайшие 12 месяцев взорвет атомную бомбу, что процентная ставка возрастет в следующем году, что Италия выиграет мировой кубок или что солдаты займут определенную высоту, — всегда субъективна, это не частотная вероятность.
Это все разовые, невоспроизводимые события. И репутация экспертов и предсказателей зависит от того, насколько правильны их прогнозы.
Комбинации вероятностей
Одно из самых важных правил теории вероятностей — правило умножения. Если два события независимы друг от друга — то есть одно из них никак не влияет на исход другого, — вы получите вероятность того, что они оба произойдут, перемножив вероятности каждого. Вероятность того, что при подбрасывании монеты выпадет орел, равна одной второй (потому что существует всего два возможных варианта: орел или решка). Вероятность того, что из колоды вы вытянете червовую карту, равна одной четвертой (потому что есть четыре возможных варианта: черви, пики, трефы и бубны). Если вы подкидываете монету и вытягиваете карту, то вероятность того, что у вас получатся и орел, и черви, высчитывается с помощью умножения двух отдельных вероятностей:
Орел | Черви | Решка | Черви |
Орел | Бубны | Решка | Бубны |
Орел | Трефы | Решка | Трефы |
Орел | Пики | Решка | Пики |
Я тут не говорю о тех редких случаях, когда вы кидаете монетку и она приземляется на ребро, или когда ее уносит чайка, пролетавшая мимо, или когда у вас в фальшивой колоде сплошь трефы.
Схожим образом мы можем действовать в случае с вероятностью наступления сразу трех событий: получить орла при подбрасывании монетки, вытянуть карту червей из колоды или встретить случайного человека, у которого день рождения в один день с вами (вероятность последнего равна примерно 1/365,24 — хотя дни рождения не вполне равномерно распределены и некоторые даты рождения встречаются чаще, чем другие, это разумная цифра).
Вы, возможно, знаете такие сайты, где задают вопросы, на которые предполагается несколько ответов, например: «На какой из этих пяти улиц вы когда-то жили?» или «Кредитная карта какого из пяти представленных типов есть у вас?» Такие сайты пытаются установить вашу личность, чтобы убедиться, что вы тот, за кого они вас принимают. В таком случае применяется правило умножения. Вероятность того, что вы случайно ответите правильно на один вопрос, равна 0,2, а вероятность того, что вы угадаете ответ на шесть вопросов подряд, равна 0,2 × 0,2 × 0,2 × 0,2 × 0,2 × 0,2, или 0,000 064. А это шесть шансов из 100 тысяч. Не так же точно, как результаты экспертизы ДНК в суде, но тоже неплохо. (А знаете, почему они не дают вопросы с выбором ответа из предложенных, а не предлагают вписывать краткий ответ? Потому что существует слишком много вариантов правильных ответов{23}).
Когда вероятность одних событий определяется другими событиями
Правило умножения можно применять только к независимым событиям. А какие события не являются независимыми? Например, погода. Морозная погода сегодня вечером и морозная погода завтра не являются независимыми — такие явления часто сохраняются в течение нескольких дней. Конечно, морозы могут ударить совершенно внезапно, но все же, желая сделать прогноз на завтра, просто посмотрите на погоду сегодня.
Вы могли бы подсчитать количество вечеров в году, когда температура опускается сильно ниже нуля, — скажем, в вашем регионе 36 — и потом сказать, что вероятность заморозков сегодня вечером будет 36/365, приблизительно 10 %, или 0,1, но при этом вы не учитываете зависимости. Если вы скажете, что вероятность того, что в течение зимы будет два морозных вечера подряд, равна 0,1 × 0,1 = 0,01 (согласно правилу умножения), то недооцените вероятность, потому что события двух вечеров подряд не независимы. На завтрашнюю погоду сильно влияет сегодняшняя.
Вероятность того, что какое-то событие произойдет, также может оказаться под влиянием конкретного факта, который вы сейчас изучаете. На вероятность того, что вечером будет морозно, очевидно влияет регион, о котором вы говорите. И эта вероятность выше на 44-й параллели, нежели на десятой. Шанс найти кого-то выше двух метров возрастает, если искать такого человека среди баскетболистов, а не в таверне, куда часто забегают жокеи. Таким образом, подгруппа людей или вещей, которую вы изучаете в данный момент, сильно влияет на вашу оценку вероятности.
Условные вероятности
Часто статистические данные вводят нас в заблуждение, потому что мы смотрим на показатели целой группы случайных людей, вместо того чтобы смотреть на подгруппу. Какова вероятность того, что у вас пневмония? Не очень высокая. Но если нам будет известно больше о вас и конкретно о вашем случае, вероятность может быть выше или ниже. Это называется «условные вероятности».
Рассмотрим два разных типа вопросов:
1. Какова вероятность того, что у случайно выбранного для опроса человека будет пневмония?
2. Какова вероятность того, что она будет у человека, не выбранного случайным образом для опроса, но проявляющего три симптома (температура, боль в мышцах, заложенность в груди)?
Второй вопрос предполагает условную вероятность. Она носит такое название, потому что мы рассматриваем не всю популяцию, а только тех людей, для которых выполняется определенное условие. Не прибегая к цифрам, мы можем угадать, что вероятность пневмонии выше во втором случае. Конечно, мы можем поставить вопрос таким образом, чтобы вероятность пневмонии была ниже у человека, которого выбрали не случайно:
Какова вероятность того, что мы найдем пневмонию у случайно выбранного человека, чьи анализы три раза подряд не подтвердили заболевание, у которого особенно крепкая иммунная система и который минуту назад финишировал первым в Нью-Йоркском марафоне?
Тот же принцип будет и в следующем случае: вероятность того, что вы заработаете рак легких, не может не быть связана с историей вашей семьи. Вероятность того, что официант принесет вам кетчуп, не может не быть связана с вашим заказом. Можно подсчитать вероятность того, что любой случайно выбранный человек в ближайшие десять лет заболеет раком легких или что официант принесет кетчуп клиентам за определенным столиком, приняв в расчет остальные заказы. Но нам повезло, и мы знаем о том, как эти события связаны с другими. Это позволяет нам сузить рассматриваемую совокупность и получить более точную оценку. Например, если у обоих ваших родителей был рак легких, вы, возможно, захотите подсчитать вероятность заболеть тем же; тогда просто посмотрите на других людей в избранной группе — тех, у чьих родителей был рак. Если у ваших родителей его не было, вы захотите посмотреть на релевантную группу людей, у которых в анамнезе нет таких историй (и у вас, вероятно, получатся совсем иные результаты). Если вы хотите узнать вероятность, принесет ли официант вам кетчуп, вы можете посмотреть на столики, за которыми люди заказали гамбургеры и картошку фри, а не на те, за которыми люди едят тартар из тунца или яблочный пирог.
Нежелание видеть взаимосвязь событий (когда принимают предположение о независимости) может привести к серьезным юридическим последствиям. Рассмотрим дело Салли Кларк, британки из Эссекса, которая была привлечена к ответственности за убийство своего младшего ребенка[87]. Ее первый ребенок умер еще в младенчестве, и его смерть связывали с СВДС (синдромом внезапной детской смерти, или «смертью в колыбели»). Обвинители уверяли, что вероятность смерти от СВДС обоих детей в одной семье очень мала, поэтому, скорее всего, имело место убийство. Свидетель со стороны обвинения, врач-педиатр, привел в качестве доказательства результаты исследования, в котором говорилось, что детская смертность в результате СВДС возникала в одном случае из 8543. (Компетентность доктора Мидоу в области педиатрии не делает его специалистом по статистике или эпидемиологии — такого рода путаница часто приводит к неверным суждениям. Об этом мы поговорим в части 3 этой книги. Эксперт в одной области не обязательно специалист в другой, даже если кажется, что эти области смежные.)
Углубившись в вопрос, мы можем усомниться и в числе 8543 — количестве смертей от СВДС. Откуда оно взялось? Диагноз СВДС ставится методом исключения — это значит, что ни один тест, проведенный медицинским персоналом, не может подтвердить, что смерть наступила в результате этого синдрома. Скорее бывает так что, если врачи затрудняются с диагнозом и уже исключили все другие возможные варианты, они диагностируют СВДС. Невозможность найти причину заболевания не может считаться доказательством того, что ее нет, поэтому весьма вероятно, что какие-то случаи со смертельным исходом, приписываемые СВДС, на самом деле были вызваны другими, менее мистическими причинами, например отравлением, удушением, пороком сердца и т. д.
Справедливости ради давайте предположим, что СВДС — действительно причина одной из 8543 смертей в младенчестве, как свидетельствовал доктор Мидоу, бывший экспертом в этом вопросе. Позже врач-педиатр заявил, что вероятность того, что в одной семье могут произойти два одинаковых случая — гибель ребенка в результате СВДС, — была , или 1 из 73 миллионов. («Совпадение? Думаю, нет!» — мог воскликнуть обвинитель во время своей заключительной речи.) Глядя на эти подсчеты — использование правила умножения, — можно предположить, что случаи смертельного исхода независимы друг от друга, но это не обязательно так. Какие бы обстоятельства ни вызвали внезапную смерть первого ребенка миссис Кларк, нельзя забывать, что дети воспитывались в одной семье. Есть два сопутствующих фактора, связанных с СВДС: пассивное курение и сон на животе. Предположим также, что первый ребенок страдал от какого-нибудь врожденного порока. Это сильно повышает вероятность того, что нечто подобное проявится в геноме второго малыша (у детей, рожденных от одних и тех же родителей, 50 % ДНК одинаковы). Рассуждая подобным образом, можно предположить, что вероятность смерти второго ребенка по какой-нибудь подобной причине равна 50 %, — и вот миссис Кларк уже гораздо меньше похожа на убийцу.
В конце концов ее муж нашел в архивах больницы доказательства того, что причина смерти второго малыша носила микробиологический характер. Миссис Кларк была оправдана, но к тому моменту она уже провела в тюрьме три года, отбывая наказание за преступление, которого не совершала.
Для условных вероятностей есть специальное обозначение. Вероятность того, что официант принесет вам кетчуп, при условии, что вы только что заказали гамбургер, выглядит так:
P (кетчуп | гамбургер),
где вертикальная прямая | читается как «при условии».
Обратите внимание: благодаря подобной записи исчезает необходимость в большом количестве слов, и математическая формула получается короткой.
Вероятность того, что официант принесет вам кетчуп, при условии, что вы только что заказали гамбургер и просили принести кетчуп, записывается так:
P (кетчуп | гамбургер ∧ попросил)
где ∧ читается как и.
Визуализация условных вероятностей
Относительная заболеваемость пневмонией на территории Соединенных Штатов в год составляет около 2 % — 6 миллионов человек из 324 миллионов населения страны получают этот диагноз каждый год (безусловно, сюда не входят многочисленные случаи, когда диагноз поставить не удается, а также такие ситуации, когда человек в течение года болеет пневмонией не один раз, но мы пока не об этом)[88]. Получается, что вероятность того, что случайно выбранный для опроса человек болен пневмонией, равна приблизительно 2 %. Но мы получим более точную оценку, если будем знать хоть что-то об этом конкретном человеке. Если вы пойдете к доктору и скажете, что у вас температура, кашель и заложена грудь, то уже не будете отобраны для опроса случайно — ведь вы пришли к доктору за помощью и жалуетесь на эти симптомы. Вы можете постепенно уточнить свою уверенность в чем-либо (например, что у вас пневмония), получая все новые и новые свидетельства. Мы используем правило Байеса для вычисления условной вероятности: какова вероятность того, что у меня пневмония, при условии наличия у меня симптома x?[89] И чем большим количеством информации вы будете обладать, тем вернее будут уточнения такого рода. Какова вероятность того, что у меня пневмония, при условии, что: 1) у меня все эти симптомы; 2) в семейном анамнезе это не первый случай; 3) я только что провел три дня рядом с человеком, больным пневмонией? Вероятность увеличивается и увеличивается.
Вы можете подсчитать вероятности, используя формулу Байеса (см. приложение), но гораздо проще и нагляднее это сделать с помощью таблички, состоящей из четырех частей и описывающей все возможные сценарии: вы заказали или не заказали гамбургер и вы получили или не получили кетчуп:
На основании экспериментов и наблюдений вы вписываете различные значения — частоту каждого события. Из 16 посетителей ресторана, обедавших в тот момент, был только один, который заказал гамбургер, и ему принесли кетчуп, а также было два случая, когда кетчуп не принесли. Эти данные идут в левый столбец:
Аналогичным образом поступаем в ситуации, когда пятеро не заказывали гамбургер, но получили кетчуп, а восемь человек, которые не заказывали гамбургер, не получили кетчуп. Эти данные записываем в правый столбец:
А дальше вы просто складываете числа в строках и столбцах:
Теперь подсчет вероятностей стал делом простым. Если вы хотите узнать вероятность того, получите ли вы кетчуп при условии, что заказывали гамбургер, тогда начинайте с условия. Ему соответствует левый столбец.
Трое посетителей заказали гамбургеры — это сумма, указанная в самом низу. Теперь попытаемся подсчитать вероятность того, что вы получите кетчуп при условии, что заказывали гамбургер. Теперь мы смотрим на клеточку «Да, получили кетчуп» в столбце «Да, заказали гамбургер», там стоит число 1. Условная вероятность P (кетчуп | гамбургер) тогда равна одной трети. И вы можете понимать это так: трое посетителей заказали гамбургер, один получил кетчуп, а двое нет. В данном виде подсчетов мы никак не задействуем правый столбец.
Мы можем использовать этот метод, когда нужно подсчитать любую условную вероятность, даже вероятность того, получите ли вы кетчуп при условии, что не заказывали гамбургер: 13 посетителей ресторана не заказывали гамбургер, пять из них при этом получили кетчуп — это значит, что вероятность равна 5/13, или около 38 %. В этом конкретном ресторане вероятность того, что вы получите кетчуп, даже не заказывая гамбургер, гораздо выше, чем если бы вы его заказывали. (А теперь давайте включим критическое мышление. Как такое могло случиться? Может, данные взяты в ситуации, когда посетители заказывали картофель фри? Или, может, все гамбургеры изначально подавались с кетчупом?)
Принятие решений в медицине
Этот способ визуализации условных вероятностей очень полезен для принятия решений в медицине. Если вы сдаете медицинский анализ и его результат указывает на заболевание, какова вероятность того, что у вас оно и правда есть? Это не 100 %, потому что сами способы проведения анализов неидеальны — они дают ложные положительные результаты (сообщают, что у вас выявлено заболевание, когда его нет) и ложные отрицательные (сообщают, что у вас нет заболевания, когда на самом деле оно есть).
Вероятность того, что у женщины есть рак молочной железы, равна 0,8 %[90]. Если рак молочной железы есть, то вероятность того, что маммография его покажет, равна только 90 %, так как сам аппарат неидеален и, бывает, идентифицирует не все случаи заболевания. Если же у женщины нет рака молочной железы, вероятность положительного результата равна 7 %. А теперь предположим, что у женщины, выбранной для опроса случайно, тест показал положительный результат, — какова вероятность того, что у нее и правда рак молочной железы?
Для начала нарисуем нашу табличку, состоящую из четырех частей, и впишем все данные: женщина, у которой на самом деле есть рак молочной железы, и женщина, у которой его нет. И результаты анализа: что рак есть или что его нет. Чтобы нам было легче считать, давайте возьмем круглое число: предположим, речь идет о 10 тысячах женщин[91].
Это размер генеральной совокупности, поэтому записываем это число внизу справа, вне нашей таблицы.
В отличие от примера с гамбургером и кетчупом, сначала мы записываем данные на полях, потому что именно этой информацией располагаем. Вероятность того, что у женщины рак, равна 0,8 %, иными словами, он у 80 женщин из 10 тысяч. Записываем эти данные на полях справа вверху (мы еще не знаем, как заполнять ячейки таблицы, но скоро узнаем). А так как нам известно, что общая сумма равна 10 тысячам, получается такая сумма по второй строке:
10 000 — 80 = 9920.
Нам сказали, что вероятность положительного результата анализа, если рак все-таки есть, равна 90 %. А так как всего процентов 100, вероятность того, что анализы не покажут положительный результат при наличии рака, высчитывается так: 100 % — 90 % и, выходит, равна 10 %.
Что касается 80 женщин, у которых действительно есть рак молочной железы (запись на полях справа вверху), мы можем сказать, что теперь нам известно, что у 90 % из их общего числа результаты будут положительными (90 % от 80 равно 72), а у 10 % результат будет отрицательным (10 % от 80 равно 8). Это все, что нам нужно знать, чтобы заполнить клеточки таблицы в верхней строке.
Мы пока еще не готовы сделать все необходимые вычисления для ответа на вопрос «Какова вероятность того, что у пациентки рак молочной железы при условии, что анализ дал положительный результат?», потому что нам еще нужно узнать, у какого количества людей результаты анализов положительны. А недостающая часть этого пазла кроется в изначальном описании ситуации: у 7 % женщин, у которых нет рака молочной железы, анализы все равно покажут положительный результат. Число на полях возле нижней строки говорит о том, что у 9920 женщин рака нет; 7 % от этого числа составляет 694,4 (округлим до 694). А это значит, что в нижнюю правую ячейку таблицы нужно занести число 9920 — 694 = 9226.
И, наконец, подсчитываем суммы по столбцам.
Если вы относитесь к тем миллионам людей, которые полагают, что наличие положительного результата анализов означает, что они точно больны, то вы ошибаетесь. Условная вероятность того, что у человека рак молочной железы, при условии, что результаты анализов были положительны, подсчитывается так: делим показатель левой верхней ячейки на итог под левым столбцом, это 72/766. Хорошая новость в том, что даже с положительной маммографией вероятность того, что у вас на самом деле есть рак молочной железы, равна 9,4 %. Все объясняется тем, что заболевание достаточно редкое (оно встречается менее чем в одном случае из тысячи), а аппараты, с помощью которых проводят диагностирование, неидеальны.
Условные вероятности не работают в обратном направлении
Мы со школы привыкли к тому, что в математике существует определенная симметрия: если x = y, то y = x. 5 + 7 = 7 + 5. Но так бывает не всегда, как мы убедились ранее на примере дискуссии о значениях вероятности (если вероятность ложной тревоги равна 10 %, это не значит, что вероятность того, что беда все же произойдет, равна 90 %). Посмотрите на статистику:
В супермаркетах продают яблок в десять раз больше, чем на придорожных развалах.
Если немного подумать, то станет очевидно, что вы не обязательно найдете яблоко в супермаркете в тот день, когда вам его захотелось: в магазине может быть в десять раз больше посетителей, чем на придорожном развале, и он может не справляться с возросшим спросом на данный товар. Если вы заметите случайно проходящего по улице человека с яблоком и у вас нет никакой информации о том, где он его взял, то вероятность того, что яблоко было куплено в супермаркете, нежели на развале, выше.
Может возникнуть вопрос: какова вероятность того, что человек купил это яблоко именно в супермаркете, при условии, что у него вообще есть яблоко?
P (был в супермаркете | нашел яблоко, которое хочет купить).
Это не то же самое, как в случае, если бы вам страшно хотелось яблоко сорта медуница:
P (нашел яблоко, которое хочет купить | был в супермаркете).
Такого рода асимметрия неожиданно возникает в ситуациях, когда имеет место обман с помощью статистических данных. Если вы прочтете где-то, что гораздо больше автомобильных аварий происходит в 19:00, нежели в 7:00, то какой вывод вы сделаете?[92] Тут даже сама формулировка утверждения весьма неоднозначна. То ли речь идет о вероятности того, что во время аварии было 19 часов, то ли о вероятности того, что в 19 часов произошла авария. Во втором случае вы смотрите на количество автомобилей на дороге в 19:00 и подсчитываете, сколько из них попадают в аварии.
Возможно, в 19:00 на дороге гораздо больше машин, чем в любое другое время суток, а также случается гораздо меньше аварий на тысячу автомобилей. Это приведет к большему количеству аварий в 19:00, чем в любое другое время суток, просто потому, что на дороге в это время находится больше транспортных средств. Сведения об уровне аварийности на дороге помогут вам определить самое безопасное время для поездки.
Есть и другой пример. Вы все, должно быть, слышали, что большинство несчастных случаев на дороге происходит на расстоянии примерно 5 километров от дома. Причина не в том, что это расстояние опасно само по себе, а в том, что в большинстве случаев люди отъезжают не очень далеко от дома, чаще всего ездят куда-то по делам в округе. Как правило, эти две интерпретации одного и того же утверждения не равносильны:
P (19:00 | авария) ≠ P (авария | 19:00).
Путаница в интерпретациях подобного рода имеет не только теоретическое значение: множество судебных дел стали результатом неправильного использования условных вероятностей, которое внесло путаницу в ранее установленные факты. Судебный эксперт может правильно подсчитать, что вероятность случайного совпадения крови с места преступления с кровью подсудимого составляет 1 %. И это совсем не то же самое, что сказать, что вероятность невиновности подсудимого равна 1 %. Видите? Интуиция снова нас подвела. Судебный эксперт говорит о вероятности совпадения группы крови при условии, что подсудимый невиновен.
P (совпадение крови | невиновность).
Говоря простым языком, о «вероятности того, что мы бы нашли совпадение, если бы подсудимый был на самом деле невиновен». Но это не та же самая цифра, которую вы хотите узнать, — какова вероятность того, что подсудимый невиновен при условии, что кровь совпала:
P (совпадение крови | невиновность) ≠ P (невиновность | совпадение крови).
Многие невиновные люди были в свое время отправлены в тюрьму по ошибке. Равно как и многие пациенты приняли неверное решение, касающееся медицинского обслуживания, исходя из ошибочного предположения:
P (положительный результат анализов | рак) = P (рак | положительный результат анализов).
И дело не только в пациентах — врачи постоянно допускают ошибки (одно исследование показало, что 90 % врачей одинаково интерпретировали две разные вероятности)[93]. И результаты, соответственно, могут быть просто пугающими.
Один хирург, например, уговорил 90 женщин на операцию по удалению груди, так как они оказались в группе повышенного риска[94]. Он как-то заметил, что в 93 % случаев рак молочной железы возникал у женщин, находившихся в группе повышенного риска. При условии, что у женщины диагностирован рак молочной железы, вероятность того, что она будет в этой группе, равна 93 %: P (группа повышенного риска | рак молочной железы) = 0,93. Используя четырехчастную таблицу для тысячи типичных женщин и добавляя дополнительную информацию о том, что 57 % женщин попадают в эту группу высокого риска, а также учитывая, что вероятность того, что у женщины будет рак, равна 0,8 % (как говорилось ранее), можно подсчитать условную вероятность P (рак молочной железы | группа повышенного риска). Это тот вид статистики, с которым женщине хорошо бы ознакомиться, прежде чем ложиться под нож хирурга (все цифры округлены).
Вероятность того, что у женщины рак, при условии, что она находится в группе повышенного риска, равна не 93 %, как ошибочно полагал хирург, а только , или 1 %. Хирург переоценил риск возникновения рака примерно в 100 раз. А последствия оказались необратимыми.
Составление четырехчастных таблиц может показаться странным занятием. Но составляя их, вы обращаетесь к научному, критическому мышлению и классифицируете данные визуально, чтобы облегчить себе подсчеты. А результаты последних помогают вам выразить проблему в цифрах и принять более рациональное решение, основанное на фактах.
Такие таблицы очень эффективны, и мне удивительно, что нас всех не учат составлять их в школе.
Как говорить о статистике и графиках
Большинству из нас сложно подсчитать вероятности и статистические показатели в уме, равно как и распознать тонкие закономерности, глядя на сложные таблицы, полные цифр. Мы предпочитаем живые картинки, четкие изображения и истории. Однако, принимая решение, мы придаем подобным материалам слишком большое значение по сравнению со статистическими данными. А также часто недопонимаем или неверно интерпретируем графики.
Многие боятся цифр — а значит, принимают на веру те данные, которые получают от кого-то. Подобное поведение может привести к неверным выводам и решениям. У нас есть тенденция мыслить критически только в отношении тех вещей, с которыми мы не согласны. В нашу эпоху информации псевдофакты часто маскируются под факты, дезинформация прячется под личиной информации, а цифры лежат в основе любого важного утверждения или решения. Статистические искажения встречаются повсеместно. Как говорит социолог Джоэл Бест, обман в статистике возникает не просто потому, что все вокруг — пронырливые лгуны[95]. За плохой статистикой стоят живые люди — часто искренние, не имеющие в виду ничего дурного, — просто порой они не думают критически о том, что говорят.
Тот же страх цифр, мешающий многим анализировать статистику, не дает порой возможности внимательно изучить цифры в графиках, названия осей и ту историю, которая за ними кроется. В мире полным-полно совпадений и могут происходить самые странные вещи — но тот факт, что с двумя вещами происходят изменения в одно и то же время, не означает, что одна из них вызвала другую или что они как-то взаимосвязаны скрытым третьим фактором х. Те, кто думает подобным образом и верит в такие ассоциации и совпадения, часто имеют в корне неверное представление о том, что такое вероятность, причина и результат, а также какую роль играет случай в том, как разворачиваются события. Вы можете, конечно, выдумать историю о том, что уменьшение количества пиратов за последние 300 лет и совпавшее с этим глобальное потепление непременно говорят о том, что пираты были просто необходимы для поддержания температурного баланса в мире. Но это результат недисциплинированного мышления и неверного истолкования фактов. Иногда бывает так, что распространители подобного рода ложных умозаключений знают больше вас и скрывают факты, надеясь, что вы ничего не заметите. Иногда они и сами попадают в ловушку собственных умозаключений. Но теперь-то вы знаете, что к чему.
ЧАСТЬ 2. ОЦЕНКА СЛОВ
Ложь, которая наполовину правда, — самая грязная ложь.
Лорд Альфред Теннисон
Откуда мы знаем?
Человек — существо социальное, мы любим рассказывать истории, и мнение другого человека легко может сбить нас с толку. У нас есть три способа получить информацию: мы можем ее найти сами, можем воспринять неосознанно или нам ее сообщат явно. Многое из того, что нам известно о мире, подпадает под последнюю категорию — кто-то когда-то нам рассказал о каком-то факте, и вот теперь мы знаем о нем из вторых уст. Мы часто полагаемся на экспертов в том или ином вопросе.
Я никогда не видел атом кислорода или молекулу воды, но есть огромное количество литературы, подробно описывающей проводимые эксперименты, — и это приводит меня к мысли, что все это существует. Или вот еще пример. Я не проверял самостоятельно, что американцы высадились на Луне, или что скорость света равна 300 тысячам километров в секунду, или что пастеризация действительно уничтожает бактерии, или что у здорового человека 23 пары хромосом. Я не проверял самостоятельно, что лифт в моем доме сконструирован по всем правилам и поддерживается в рабочем состоянии или что мой доктор на самом деле учился медицине, — мы просто доверяем специалистам, сертификатам, лицензиям, энциклопедиям и учебникам.
Однако нельзя забывать и о собственном мнении, банальной логике и силе рассуждения. Ловкачи и пройдохи, желающие содрать побольше денег или заставить нас голосовать себе во вред, попытаются завалить нас псевдофактами, сбить с толку необоснованными цифрами или отвлечь нас от сути информацией, которая при ближайшем рассмотрении окажется нерелевантной. Они будут маскировать факты.
Как мы можем противостоять этому? Анализировать то, что нам сообщают, — так же, как мы анализируем статистику и графики. Необходимые для этого навыки есть у любого 14-летнего подростка. Им обучают будущих юристов и журналистов, иногда о них говорят в бизнес-школах или на курсах повышения квалификации, но редко им обучают остальные категории граждан — тех, кому эти знания нужны больше всего.
Если вы любите смотреть детективные фильмы или читать статьи, написанные в жанре расследовательской журналистики, многие из необходимых навыков вам уже знакомы — ведь все эти истории напоминают слушания в суде. Судьи и присяжные оценивают конкурирующие заявления и стараются найти, где же в них правда. Существуют кодифицированные нормы права, касающиеся того, что считать настоящим доказательством. В Соединенных Штатах ни документы с неустановленной подлинностью, ни свидетельские показания, основанные на слухах и домыслах, таковыми не являются, хотя из любого правила есть исключения.
Представим, что кто-то посоветовал вам сайт, где написано, что вы станете умнее, если будете слушать Моцарта по 20 минут в день. На другом сайте утверждают, что это не так. И тут мы сталкиваемся с большой проблемой: человеческий мозг часто принимает решения, основываясь на эмоциях и пытаясь их затем оправдать. И ему это удается. Конечно, было бы здорово поверить, что если слушать красивую музыку по 20 минут в день, вы вдруг обнаружите себя в списке людей с самым высоким уровнем IQ. Поэтому для оценки подобного рода утверждений требуется время, может, даже больше, чем нужно, чтобы прослушать «Маленькую ночную серенаду», но необходимо избегать неверных выводов. Даже самых умных из нас можно обвести вокруг пальца. Стив Джобс отложил лечение своего рака поджелудочной железы, потому что следовал совету (взятому из книг и из интернета), что изменение диеты вылечит его[96]. К тому моменту, как он понял, что диета не работает, его болезнь уже не подлежала лечению.
Не всегда, однако, возможно определить правдивость и точность источника информации. Вспомните эпиграф, открывавший часть 1:
Проблемы вам создает не то, чего вы не знаете, а скорее то, в чем вы абсолютно уверены, тогда как на самом деле заблуждаетесь.
Я слышал эту фразу в начале художественного фильма The Big Short{24}, в котором ее приписали Марку Твену. У меня тогда возникло ощущение, будто я до этого где-то с ней встречался. Эл Гор тоже ее использовал в своем фильме An Inconvenient Truth{25} девятью годами ранее и тоже приписывал ее Марку Твену. Но готовя к публикации свою книгу и проверяя факты, я не смог найти ни одного упоминания Марка Твена в связи с этой фразой. Установление авторства и сама цитата — главные примеры того, против чего она нас предостерегает. Режиссеры, сценаристы и продюсеры обоих фильмов не удосужились сделать свое домашнее задание — то, в чем они были так уверены, оказалось неправдой.
Поискав информацию на эту тему, я обнаружил статью в Forbes, где говорилось, что авторство установлено неверно[97]. Автор статьи, Найджел Рис, ссылался на Respectfully Quoted — словарь цитат, составленный Библиотекой Конгресса США. В этой книге собраны самые различные формулировки фразы, упомянутой в книге Джоша Биллингса{26} Everybody’s Friend, or Josh Billing’s Encyclopedia and Proverbial Philosophy of Wit and Humor, написанной в 1874 году[98], [99]. «Вот так-то, — пишет Рис. — Марк Твен гораздо более популярный юморист, нежели Джош Биллингс, а значит, слова эти скорее принадлежат ему». Рис продолжает:
Давайте рассмотрим еще один случай. В президентских дебатах 1984 года Уолтер Мондейл{27} заявил, что помнит слова Уилла Роджерса{28} о Гувере{29}. Роджерс сказал: «Меня беспокоит не то, чего тот не знает. А скорее то, в чем он абсолютно уверен, тогда как на самом деле он заблуждается».
Так кто же прав? Когда имеешь дело с такими сложными вопросами, лучше всего обратиться к эксперту. Я спросил Гретхен Либ, сотрудника научно-исследовательской библиотеки колледжа Вассар, работающую в тесном сотрудничестве с кафедрой английского языка. Она предоставила мне этот анализ, который многое объяснил:
Цитаты — вещь сложная. Они эквивалентны статистике в том, что касается лжи, наглой лжи и т. д., — только выражены буквами. Старые цитаты выглядят как перевод с другого языка, в том смысле, что они скорее интерпретируют старые тексты, чем передают их дословно, потому что те авторы писали на выдуманном языке, это было что-то вроде языка Гекльберри Финна, который сейчас сложно читать и почти невозможно понять.
Я могла бы проверить и другие словари цитат, например Оксфордский, но это уже был бы абсолютно XX век.
Вам доводилось работать с HathiTrust? Это книжный корпус, собранный из научно-исследовательских библиотек, который стоит за Google Books, и это просто золотая жила, особенно если говорить о материалах, напечатанных до 1928 года.
И вот вам цитата, приписываемая Джошу Биллингсу в словаре Respectfully Quoted (у нас он есть в электронном виде; мне даже не пришлось вставать из-за стола!). Он ссылается на Оксфордский словарь цитат, которым я, как показывает практика, пользуюсь чаще, чем словарем Джона Бартлетта:
«Основная проблема людей заключается не в том, что они чего-то не знают, а в том, что они знают столько всего, что знанием не является». Фраза приписывается Джошу Биллингсу Оксфордским словарем цитат, 3-е издание. С. 491 (1979). Этому, однако, нет подтверждений в его бумагах, хотя нечто похожее можно найти в его книге Everybody’s Friend, or Josh Billing’s Encyclopedia and Proverbial Philosophy of Wit and Humor. Изначальное написание этой фразы было исправлено: «Как же мало из того, что я знаю, на самом деле является знанием» (с. 502). «Мудрость заключается не в том, чтобы узнавать как можно больше нового, а в том, чтобы узнавать меньше того, что истиной не является» (с. 430). «Я искренне убежден в том, что лучше не знать ничего, нежели знать то, что не является истиной» (с. 286).
Кстати, говоря об упоминании Уолтером Мондейлом Уилла Роджерса, словарь Respectfully Quoted отмечает, что эту цитату не нашли в бумагах Роджерса. Кроме того, если вы поищете информацию о Марке Твене, то обнаружите, что Биллингс называет юмориста и острослова Марка Твена своим самым верным корреспондентом, они предавались беседам и обменивались афоризмами, или, как бы назвал это Биллингс, «аффуризмами». Но как теперь разобрать, кто что сказал? Я обычно закатываю глаза, когда люди, особенно политики, цитируют Марка Твена или Уилла Роджерса, и думаю: «Генри Луис Менкен, мы вас почти не знаем». Критически мыслящий ум, подобный тому, что был у Менкена, сегодня редко встретишь. Бедный Джош Биллингс. Положение второго по популярности юмориста спустя столетие ставит авторство под сомнение.
Так что это случай, когда цитата оказывается полностью поддельной и по смыслу, и в том, что касается авторства. Основная идея приписывается Биллингсу, хотя не совсем ясно, принадлежала оригинальная мысль ему, Твену или, может, их приятелю Брету Гарту. Уилл Роджерс тоже фигурирует в этом списке, потому что цитата звучит так, как мог бы выразиться именно он.
Цитату, открывающую часть 2, я услышал от одного своего знакомого, который по ошибке запомнил ее следующим образом:
Самая грязная ложь — отчасти правда, которая ведет вас к неверным заключениям.
Прозвучало это правдоподобно. И было похоже на Теннисона, который мог бы придать красок абстрактному понятию и смешать метафизическое с практическим. Вот только когда я готовил книгу в печать и проверял факты, то нашел оригинальную цитату: «Ложь, которая наполовину правда, — самая грязная ложь». Вполне в стиле Курта Воннегута.
Столкнувшись с новыми или противоречивыми утверждениями, мы со знанием дела можем решить, что есть правда, а что нет, если будем располагать доказательствами. Мы тщательно изучаем все утверждения самостоятельно и принимаем решение, будучи и судьей, и присяжными в одном лице. Важная часть этого процесса — поиск экспертного мнения. Как же найти таких специалистов?
Поиск экспертов
Первым делом, пытаясь получить оценку утверждения каким-нибудь экспертом, нужно понять, кто решил, что это мнение экспертное. Если человек оказался свидетелем какого-то события, то насколько его показания заслуживают доверия?
Даже самые авторитетные эксперты могут ошибаться. В начале 2000-х правительство США сильно заблуждалось насчет наличия у Ирака оружия массового поражения. Если приводить примеры из других, менее политизированных сфер, то можно вспомнить о том, что ученые годами считали, что у человека 24 пары хромосом, а оказалось 23[100]. Конечно, мнение признанных экспертов — не последнее дело в оценке какого-то утверждения, но не стоит считать их истиной в последней инстанции, это лишь начало пути.
У экспертов два способа представлять свое мнение, и нам очень важно уметь отличить один от другого. В первом случае они рассматривают факты и доказательства, обобщают информацию и делают выводы, основываясь на этих данных. Они сообщают вам, какие имеются доводы, почему они имеют значение и как они помогли сделать соответствующие выводы. Именно таким и должен быть научный подход — так проходят судебные заседания, таким образом принимают решения в бизнесе, медицине и при разработке военных стратегий.
Во втором случае эксперты просто делятся своим мнением. Они такие же люди, как и мы. И так же, как и мы, могут придумывать истории, увязывать воедино собственные разрозненные наблюдения, гипотетические ситуации и непроверенные факты. Тут нет ничего постыдного — из такого ассоциативного мышления могут рождаться хорошие рабочие идеи, но их нельзя путать с логическими аргументами, в основе которых лежат доказательства. В книгах и статьях, написанных учеными и рассчитанных на широкую аудиторию, часто содержатся подобного рода домыслы — и мы ведь покупаем их, потому что нас впечатлили знания и красноречие автора. Но если делать все по правилам, автор должен снять с себя маску эксперта, позволить вам заглянуть на «кухню» и своими глазами увидеть какие-то доказательства.
Под словом «эксперты» обычно подразумеваются люди, прошедшие специальную подготовку, посвятившие много времени развитию своих профессиональных навыков и умений (например, обладатели ученой степени, пилоты, музыканты или атлеты), чьи знания и умения считаются высокими относительно уровня других людей. Как таковая профессиональная компетентность — это оценка, данная обществом, ведь мы сравниваем навыки одного специалиста с профессиональным уровнем другого. Компетентность относительна. Эйнштейн был экспертом в области физики 60 лет назад. Будь он жив — возможно, и не считался бы таким докой и не смог бы понять то, что известно на сегодняшний день Стивену Хокингу и другим физикам. Компетентность гарантирует некоторый уровень. Хотя астронавт Джон Янг — один из 12 людей, ходивших по поверхности Луны, было бы неверно сказать, что капитан Янг — эксперт по лунным прогулкам, хотя он, определенно, знает об этом больше, чем почти кто бы то ни было.
Специалисты со схожей квалификацией и уровнем знаний не обязательно всегда соглашаются друг с другом. А если даже и соглашаются, то не всегда правы. Тысячи и тысячи финансовых аналитиков делают свои прогнозы относительно биржевого курса, которые получаются совершенно неверными, а пара абсолютных новичков в этом деле как раз оказываются правы. В свое время все британские звукозаписывающие компании отвергли демозапись Beatles, а Джордж Мартин, молодой продюсер, не разбиравшийся в поп-музыке, записал их на EMI. Научно-исследовательский центр Xerox PARC, создавший графический интерфейс для компьютера, не видел никакого будущего для PC. Стив Джобс, у которого не было совершенно никакого опыта ведения бизнеса, был уверен, что они ошибаются. Успех, который демонстрируют новички в этих областях, обычно объясняют тем, что курс акций на фондовой бирже, так же, как и вкусы людей, — дело непредсказуемое. Всякое бывает. Не то чтобы эксперты никогда не ошибаются, просто чисто статистически у них больше шансов оказаться правыми.
Многим изобретателям и новаторам говорили, что «это не будет работать», и часто это говорили эксперты. Отличным примером может служить история братьев Райт и их соратников-изобретателей, претендовавших на создание летающего аппарата с мотором. Братья Райт были исключены из школы и, так вышло, не имели никаких знаний в области воздухоплавания или физики. Многие тогдашние эксперты, знания которых были довольно формальными, уверяли, что полет на аппарате тяжелее воздуха невозможен. Братья были самоучками, и их воля к победе сделала свое дело — они де-факто стали экспертами, когда построили функционирующий самолет тяжелее воздуха, тем самым доказав несостоятельность бытовавшего экспертного мнения. Менеджер бейсбольной команды «Окленд Эйс» Билли Бин собрал достойную команду, использовав при этом показатели эффективности игроков, которые недооценивали другие, — он два года подряд приводил своих ребят к плей-офф, существенно увеличив благосостояние команды.
Эксперты — часто дипломированные специалисты с ученой степенью, признанные в деловом мире. Сертифицированный механик завода, где собирают Toyota, может считаться экспертом по Toyota. А какой-нибудь независимый механик, работающий в сервисе за углом, возможно, даже самоучка, может быть таким же хорошим специалистом, а то и лучше, но его услуги обойдутся дешевле. Просто шансы на это будут меньше, и, конечно, довольно сложно самому определить квалификацию этого механика. Тут все дело в среднем уровне: средний сертифицированный механик с завода Toyota будет лучше знать, как починить ваш автомобиль, нежели какой-нибудь средний механик-самоучка. Но из всех правил бывают исключения, и чтобы принять правильное решение, вам придется просто включить логику. Знавал я одного механика, 25 лет проработавшего в дилерском центре Mercedes, где он был на хорошем счету и все его очень ценили. Однажды он захотел стать самому себе начальником и открыл собственный магазин. Благодаря 35-летнему рабочему стажу (на тот момент, как мы познакомились) его квалификация была гораздо выше, чем у молодых механиков, работающих в компании дилера. Или вот еще пример: независимый эксперт может специализироваться на определенных видах ремонта, в то время как дилер не так часто имеет с ними дело (например, переборка коробки передач или перетяжка сидений). В таком случае вам лучше обратиться к независимому механику, который проделывает все это по пять раз в месяц, в то время как официальный дилер сталкивался с этим лишь однажды, и то пока учился на механика. Это все равно что с хирургами: если вдруг вам понадобится операция, вы скорее обратитесь к врачу, который провел их несколько сотен, а не одну и не две. И не важно, как прошли эти две операции.
Достижения экспертов в области науки, технологии, медицины освещаются в специализированных журналах (сейчас поговорим об этом) или подтверждаются патентами и дипломами. Они могут быть признаны профессиональным сообществом, о чем свидетельствуют различные награды, как то Нобелевская премия, орден Британской империи или Национальная научная медаль США. Если говорить о бизнесе, то эксперты могут иметь опыт ведения или создания компании, знать, как сделать состояние (Уоррен Баффетт, Билл Гейтс). Конечно, существуют и менее значительные достижения (продавец месяца, автомеханик года, лучший мексиканский ресторан, лучший подрядчик-кровельщик).
Если говорить об искусстве и гуманитарных науках, эксперты могут работать в университетах, их знания могут быть признаны теми, кто занимает такие же академические или правительственные должности, а также экспертными комиссиями. Подобные комиссии обычно формируются из бывших победителей конкурсов или хорошо подготовленных сотрудников университетов — подобные принципы лежат в основе выдвижения на Нобелевскую премию и стипендию Макартура для гениев.
Если человек из области искусств или гуманитарных наук получил награду, например Нобелевскую или Пулитцеровскую премию, награду вашингтонского Центра Кеннеди{30}, музыкальную премию Polaris Music Prize{31}, премию Джуно{32}, Национальную книжную премию{33}, премию Нью-бери{34}, Букеровскую премию, — мы приходим к заключению, что он эксперт в своем деле[101]. Награды от коллег особенно важны для оценки квалификации. ASCAP (Американское общество композиторов, авторов и издателей) вручает награды тем, за кого проголосовали его же члены. Особенно важно, что те, кто присуждает премию, как раз и входят в состав экспертной комиссии. В случае с «Грэмми» или «Оскаром» процесс выбора номинантов происходит так же.
Вы можете поймать себя на мысли: «Погодите-ка. В случае с такими наградами всегда есть элемент политической игры и личного отношения. Мой любимый актер (певец, танцор) никогда не получал эту премию — готов поспорить, есть тысячи людей, которые думают, что он ничем не хуже победителя этого года». Но это совсем другое дело. Система вознаграждения устроена таким образом, чтобы в первую очередь убедиться, что каждый победитель заслуживает награды, а это не то же самое, что сказать, будто каждый, кто заслуживает, и будет победителем (вспомните наш разговор об асимметрии). Те, чьи заслуги были когда-либо отмечены достойными наградами, обычно дорастают до уровня экспертов (опять же, бывают исключения, например вручение «Грэмми» в 1990 году, когда приз получила группа Milli Vanilli, но позднее ее участники добровольно вернули награду; или вручение Пулитцеровской премии репортеру Washington Post Джанет Кук, которая была отозвана два дня спустя, когда обнаружили, что победившая в конкурсе история была сфабрикована; Габриэль Гарсия Маркес язвительно заметил тогда, что Кук нужно было присудить Нобелевскую премию в области литературы). Если оказалось, что эксперт виноват, компрометирует ли это его как специалиста? Возможно. Во всяком случае, это точно подрывает к нему доверие — зная, что эксперт солгал однажды, вы теперь должны быть начеку — это может повториться.
Обычно экспертные знания носят довольно узкий характер
Доктор Рой Мидоу, педиатр, дававший показания во время судебного разбирательства по делу Салли Кларк, якобы убившей своего ребенка, не обладал профессиональными знаниями в области медицинской статистики или эпидемиологии. Он работал в сфере медицины, и прокурор, давший ему слово, безусловно, надеялся, что присяжные решат, что перед ними квалифицированный специалист. Уильяму Шокли была присуждена Нобелевская премия по физике как одному из трех изобретателей транзистора. В последующие годы он стал продвигать явно расистские взгляды, которые получили распространение, вероятно потому, что люди решили, что раз он был достаточно умен, чтобы получить Нобелевскую премию, то он, должно быть, знает то, что неизвестно другим. Гордон Шоу, «обнаруживший» ныне сильно дискредитированный эффект Моцарта, был физиком, которому не хватало профессиональных знаний в области бихевиоризма. Но все решили, видимо, как в случае с Шокли: «Он ведь физик. Он, должно быть, и правда умный». Но интеллект и компетенция обычно проявляются в какой-то определенной области, в противовес распространенному убеждению, что сведущий человек сведущ во всем. Лучший механик в мире, специализирующийся на Toyota, может и не определить, что случилось в вашем Volkswagen, а лучший адвокат по налогообложению может и не дать дельного совета в деле нарушения контракта. Ну а физик, вероятно, не лучший эксперт в области общественных наук.
Отдельное место в наших сердцах (но, надеюсь, не в наших рациональных умах) занимают актеры, которые с помощью своих экранных образов делают рекламу каким-то вещам. Например, Сэм Уотерсон очень убедительно сыграл адвоката Джека Маккоя в сериале Law & Order{35}. Будучи актером, он не сильно разбирался в банковском деле и инвестициях, хотя рекламные ролики с его участием для TD Ameritrade были потрясающими. Представитель другого поколения, Роберт Янг, роль которого в сериале Marcus Welby, M.D.{36} очень полюбилась зрителю, в свое время снимался в рекламе кофе Sanka. Актеры Крис Робинсон (General Hospital){37} и Питер Бергман (All My Children){38} рекламировали лекарство. По правилам Федеральной торговой комиссии (так называемое Правило белого халата) актеры должны были сопровождать свой рекламный текст пояснением, которое позже превратилось в крылатое выражение: «Я не доктор, но играю его на телевидении». Очевидно, легковерные зрители по ошибке принимали докторов из телевизионного сериала за авторитетных специалистов в реальном мире медицины.
Иерархия источников
Глядя на некоторые публикации, понимаешь, что авторы во время работы над материалом, скорее всего, обращались к настоящим экспертам. Существует даже иерархия источников информации, и одни из них кажутся более надежными, чем другие. Научные статьи, рецензируемые специалистами в данной области, обычно более надежны, нежели книги, а книги, выпущенные крупными издательствами, как правило, имеют лучшую репутацию, чем самиздат (потому что крупные издательства скорее будут вычитывать и править свои материалы, а также они больше мотивированы финансово). Печатные издания, не раз отмеченные разными профессиональными премиями, такие как New Your Times, Washington Post и Wall Street Journal, всегда следят, чтобы их новостные материалы были максимально точны. Они добиваются независимого экспертного подтверждения любой новости, которую публикуют. Если какой-то чиновник во время встречи с прессой говорит о чем-то, журналисты тут же получают подтверждение этой информации у другого члена правительства. Если заявление делает ученый, журналисты связываются с его коллегами и просят комментарий. Конечно, эти журналисты тоже ошибаются; даже репортеры газеты Times не раз обвинялись в фабрикации, и каждый день в газете, допустившей неточность, публикуют список опечаток. Некоторые, включая Ноама Хомски{39}, утверждают, что Times — рупор пропаганды, так как публикует новости о правительстве США, не сдабривая материалы здоровым скептицизмом[102]. Но, опять же, как и в истории про автомеханика, тут все дело в среднем уровне — материалы в New York Times вызовут в целом больше доверия, нежели, скажем, в New York Post.
Некоторые источники, находящиеся на хорошем счету, предпочитают проверять факты, прежде чем их публиковать. Однако в последнее время в сети появилось много источников, которые не придерживаются единых стандартов, а в некоторых случаях и сообщают горячие новости, опережая традиционные СМИ, для которых характерна более деликатная подача. Многие из нас узнали о смерти Майкла Джексона с развлекательного сайта TMZ.com, прежде чем сообщение появилось в традиционных СМИ. В отличие от сотрудников Los Angeles Times или NBC, редакторы TMZ поспешили поделиться новостью, хотя имевшихся у них фактов было недостаточно. Конкретно в этом случае новость, опубликованная сотрудниками TMZ, оказалась настоящей, но слепо доверять такого рода репортажам нельзя.
Бывали случаи, когда сообщения о смерти знаменитостей, циркулировавшие в Twitter, оказывались журналистской уткой. Не далее как в 2015 году сообщалось о смерти Карлоса Сантаны, Эрла Джонса, Чарльза Мэнсона и Джеки Чана. Непроверенные сообщения 2011 года стали причиной продажи акций компании Audience, которые упали в стоимости на 25 %[103]. Акции Twitter временно выросли в цене на 8 % после того, как на одном фиктивном сайте, визуально очень похожем на Bloomberg.com, появилась информация о поглощении компании. Как сообщила Wall Street Journal, «использование слухов в новостях для манипуляции торгами на фондовой бирже — давно известная уловка. Просто сегодня информации так много, что она мешает биржевым маклерам, работающим на больших скоростях, и те могут легко стать жертвами мистификации»[104]. И ведь такое случается с лучшими из нас. Джонатан Кейпхарт, маститый журналист (член профессиональной команды, получившей в 1999 году Пулитцеровскую премию), написал для Washington Post историю, в основе которой лежало сообщение в Twitter, сделанное несуществующим конгрессменом на несуществующем избирательном участке[105].
Как и в случае с графиками и статистическими данными, нельзя слепо верить всему, что мы читаем в достоверном источнике, точно так же, как и нельзя автоматически отвергать все, что мы узнаем из сомнительного источника. Не стоит доверять всему, что вы читаете в New York Times, или отвергать все, что вы читаете на сайте TMZ. А в зале суда нельзя полагаться на единственного свидетеля, нужно искать доказательства.
Домен сайта
Последние буквы в URL указывают на домен. Полезно знать домены своей страны, поскольку некоторые доменные имена имеют определенные ограничения и это поможет вам установить надежность сайта по выбранной теме. В США доменное имя. edu предусмотрено для некоммерческих образовательных учреждений, например Stanford.edu (Стэнфордский университет); доменное имя. gov предусмотрено для правительственных учреждений типа CDC.gov (Центры по контролю и профилактике заболеваний США);.mil — для военных организаций, например army.mil. Самое распространенное доменное имя —.com, его используют коммерческие предприятия, например GeneralMotors.com. Также стоит упомянуть. net, nyc и. management, у которых нет никаких ограничений по контенту. Caveat emptor{40}. BestElectricalService.nyc, возможно, вообще находится в Нью-Джерси (и у сотрудников этой компании может даже не быть лицензии для работы в Нью-Йорке), а AlphaAndOmegaConsulting.management может вовсе не разбираться в менеджменте.
Знание домена иногда помогает выявить потенциальный обман. Вы скорее найдете беспристрастную информацию не на коммерческом сайте, а на образовательном или некоммерческом (размещенном в домене с расширением. edu, gov или. org), хотя там часто находятся студенческие блоги и выражается личная точка зрения. Но и образовательные, и некоммерческие сайты не без греха: они могут подавать информацию таким образом, чтобы увеличивалось количество читательских взносов, а их миссия находила публичную поддержку. Редакторы сайта Pfizer.com могут выражать предвзятое мнение, делая обзоры лекарств, произведенных компаниями-конкурентами, например GlaxoSmithKline, а Glaxo может откровенно лоббировать свои товары.
Заметьте, однако, что вам не всегда нужно беспристрастное, нейтральное мнение. В поисках инструкции к холодильнику вы, вероятно, зайдете на выражающий пристрастную точку зрения сайт производителя (например, Frigidaire.com), а не на сайт, занимающийся повторным распространением устаревших версий руководства пользователя, в котором куча ошибок. Возможно, на сайте с доменом. gov и лоббируются интересы правительства, но именно там вы найдете наиболее точную информацию о законах, налогах, данных переписи, а также о том, как зарегистрировать автомобиль. А на сайтах CDC.gov и NIH.gov, возможно, будет более полная информация о большинстве медицинских случаев, потому что авторы текстов не преследуют никакой финансовой выгоды.
Кто за этим стоит?[106]
Может ли какой-то сайт работать под названием, которое заведомо сбивает вас с толку? Ассоциация производителей витамина C может создать себе сайт NutritionAndYou.info — и вы будете думать, что предоставляемая ими информация непредвзята. Президент сети бакалейных товаров Whole Foods был пойман на том, что притворялся в сети покупателем и навязывал товары своей компании. Многие рейтинговые сайты, например Yelp! или Amazon, обнаружили, что очень много отзывов оставляли родственники или друзья тех, кого оценивали (или чьи товары оценивали). Люди не всегда оказываются теми, кем они кажутся в сети. Тот факт, что сайт называется «Правительственная система здравоохранения США», не означает, что сайтом действительно занимается правительство, а сайт, носящий название «Независимые лаборатории», не обязательно будет независимым — им может управлять производитель автомобилей, который хочет, чтобы его машины выглядели хорошо во время проведения не таких уж независимых тестов.
В борьбе 13-го округа Флориды за место в Конгрессе, проходившей в 2014 году, местные представители Республиканской партии создали сайт, на котором поместили имя своего оппонента от партии демократов — Алекс Синк[107]. Они пытались обманным путем заставить избирателей думать, что те отдают свои деньги Синк. На самом же деле все деньги достались ее оппоненту, Дэвиду Джолли. Сайт contribute.sinkforcongress2014.com использовал цветовую гамму Синк и фотографии, где она улыбается, — это изображение было очень похоже на фото с ее собственного сайта.
Фотография с сайта в поддержку кандидата в Конгресс от партии демократов Алекс Синк
Фотография с сайта Республиканской партии, использованная для сбора денег в поддержку оппонента Алекс Синк — Дэвида Джолли
На сайте Республиканской партии действительно написано, что все деньги пойдут на то, чтобы разгромить Синк, поэтому нельзя сказать, что это мошенничество чистой воды. Но давайте говорить положа руку на сердце — большинство людей не утруждают себя чтением таких вещей или делают это на бегу. Наиболее яркие элементы, привлекающие внимание, — большая фотография Синк, а также заголовок «Алекс Синк | Конгресс». Это автоматически наводит на мысль, что сайт призывает голосовать за Алекс Синк, а не против нее. Не желая оставаться в долгу, демократы ответили подобным на подобное, создав сайт www.JollyForCongress.com, чтобы собрать деньги, предназначенные сопернику Синк.
Dentec Safety Specialists и Degil Safety Products — конкурирующие компании, предлагающие похожие услуги и продукты. У Dentec есть свой сайт DentecSafety.com, на котором они продвигают свои товары, и у Degil есть свой сайт, DegilSafety.com. Но все дело в том, что компания Degil также зарегистрировала DentecSafety.ca, чтобы перенаправлять канадских покупателей на свой сайт и таким образом красть клиентов у компании-соперника. Согласно судебному решению, вынесенному по этому делу, компания Degil была обязана выплатить Dentec 10 тысяч долларов, а также закрыть DentecSafety.ca[108].
У одной компании, торгующей онлайн, был свой сайт GetCanadaDrugs.com[109]. Суд счел, что название сайта — обман, так как он «неверно описывает то, чем торгует компания». Основные пункты обвинения заключались в том, что не все фармацевтические продукты были произведены в Канаде и что только приблизительно 5 % покупателей сайта были канадцами. На данный момент этот домен прекратил свое существование.
Если вам известно доменное имя, это, конечно, может помочь сориентироваться, но едва ли можно сказать, что это надежная система проверки. Название MartinLutherKing.org предполагает, что на этом сайте будет предоставлена информация о великом ораторе и защитнике гражданских прав. А так как расширение у него. org, можно и вовсе решить, что у его создателей нет никакой жажды наживы. На сайте говорится, что он предлагает «настоящее историческое исследование» жизни и творчества Мартина Лютера Кинга. Но погодите-ка. Большинство людей не начинают свое выступление со слов «То, что я собираюсь вам сказать, — абсолютная правда». Ведь BBC не начинает каждый свой выпуск новостей со слов «Это чистая правда». Мы всегда предполагаем, что другие будут честны с нами. Как говорится в одной старой шутке, «как узнать, что кто-то вам лжет? По тому, что он начинает со слов „честно говоря“». Честным людям не нужно предварять свою речь подобными ремарками.
Что же на самом деле можно найти на сайте MartinLutherKing.org?[110] Ассортимент бесстыдно искаженных фактов, антисемитских высказываний и цитат, вырванных из контекста. Кто занимается этим сайтом? Stormfront, группа неонацистов, пропагандирующая идею превосходства белых[111]. Отличный способ замаскировать расистскую программу: пообещать «всю правду» о великом борце за гражданские права.
Предвзятость организаций
Может ли что-нибудь повлиять на то, как человек или организация структурирует и представляет информацию? Знает ли этот человек или организация, что такое конфликт интересов? Заявление о пользе миндаля, сделанное Ассоциацией производителей миндаля, не так весомо, как заявление, сделанное независимой лабораторией.
Оценивая слова эксперта, нужно помнить, что он может выражать предвзятое мнение, сам того не осознавая. В случае с опухолью хирург-онколог может назначить операцию, радиационный онколог — облучение, а онколог-терапевт — химиотерапию. Психиатр может порекомендовать лекарство от депрессии, в то время как психолог ограничится психотерапией. Как гласит одна старая поговорка, «когда у вас есть молоток, все вокруг похоже на гвозди». Кто же прав? Посмотрите на статистические данные. Или найдите третью сторону, которая уже изучила разные варианты. Именно этим и занимается метаанализ в области науки и медицины (по меньшей мере должен заниматься). Метаанализ — техника исследования, предполагающая объединение результатов нескольких сотен исследований, проведенных разными лабораториями, с целью определения весомости доказательств в пользу того или иного утверждения. По этой причине компании приглашают аудитора, чтобы тот проверил их бухгалтерские записи, или финансового аналитика, чтобы он вынес решение о реальной стоимости компании, которую они присмотрели. Конечно, инсайдеры в компании, которую хотят купить, прекрасно знают, как обстоят у них дела в отношении финансов, но очевидно, что они — лица заинтересованные. И не всегда в том смысле, в каком вы думаете. Они могут завысить цену компании, если хотят продать ее, или занизить, если боятся агрессивного поглощения.
Кто дает ссылки на сайт?
Специальный сервис Google позволяет вам посмотреть, кто еще ссылается на ту же страничку, на которой находитесь вы. Вбейте слово «link:» («ссылка»), а затем URL сайта, и Google найдет все сайты, которые на него ссылаются (например, на запрос link: breastcancer.org выдаст две сотни сайтов, которые ссылаются на соответствующий сайт). Да, но зачем вам это? Если агентство по защите потребителей, Бюро по улучшению деловой практики или иная охранная организация дает ссылку на сайт, вы, возможно, захотите узнать, хвалят ли они его или ругают. Страничку можно предъявить в зале суда. Или на нее как на очень ценный ресурс может давать ссылку какая-нибудь авторитетная организация, например Американское общество борьбы с раковыми заболеваниями.
Alexa.com рассказывает о демографических данных посетителей сайта: из какой они страны, какое у них образование, какие сайты они посетили непосредственно до того, как зайти на этот. Подобная информация позволит вам лучше понять тех, кто пользуется вашим сайтом, а также их мотивацию. Сайт о лекарствах, который посещают врачи, вероятно, будет пользоваться большим доверием, нежели сайт, на который они не заходят. Отзывы о каком-то местном учреждении или местной компании, оставленные жителями вашего города, будут для вас, вероятно, важнее, нежели мнение приезжих.
Журналы, рецензируемые специалистами
В публикациях, рецензируемых специалистами, новый эксперимент, сообщение или утверждение оцениваются учеными, находящимися друг от друга на расстоянии вытянутой руки. Они должны быть экспертами в той области, которую анализируют. Следует, однако, сказать, что этот метод далек от того, чтобы считаться полностью надежным: находки, сделанные специалистами, иногда опровергаются, а публикации отзывают. Экспертные оценки не должны быть вашим единственным источником информации, но они представляют собой хорошую базу при принятии решений, ведь так же, как в случае с демократией, это лучшая система, которая у нас есть на сегодняшний день. Если какая-то информация появляется, например, в Nature, Lancet или Cell, будьте уверены, что она прошла строгую проверку экспертами. То же касается ситуации, когда вам нужно решить, верить таблоиду или серьезному новостному агентству. Скорее всего, верной информация будет в журнале, рецензируемом специалистами.
В научной статье должны быть сноски или какие-то ссылки на соответствующие научные работы, написанные экспертами. Все утверждения должны быть проверены, факты — подтверждены цитатами из достоверных источников. Десять лет назад было относительно просто выяснить, достоин ли журнал уважения, но из-за получивших широкое распространение журналов открытого доступа, бесплатно печатающих все что угодно, эта грань стерлась, появился параллельный мир, полный псевдонаучных статей. Отличить одно от другого вам помогут сотрудники справочных служб. Журналы, возникающие на таких платформах, как PubMed (при поддержке Национальной медицинской библиотеки США), — качественные; статьи, которые вы находите в обычном поисковике, — нет. Сайт Scholar.Google.com содержит больше ограничений, чем Google или другая поисковая система, он ограничивает результаты поиска научными статьями, хотя и не проверяет журналы, и тут тоже попадаются псевдонаучные публикации. Но он отлично отсеивает то, что даже не похоже на научную статью. Однако это палка о двух концах: такой подход может сильно затруднить выбор из-за обилия кажущихся подходящими результатов поиска. Джеффри Билл, библиотекарь в Колорадском университете, создал черный список журналов открытого доступа, которые он называет «грабительскими» (они часто берут с авторов высокую плату за публикацию). За четыре года этот список, изначально насчитывавший 20 изданий, вырос до 300 с лишним позиций. Существуют и другие сайты подобного толка, которые могут помочь вам отсеять лишнее, например Social Science Research Network (ssrn.com).
Регулируемая власть
В сети нет единого органа, который контролировал бы публикации пользователей и не допускал с их стороны заведомо ложных текстов. Нет иного способа закрыть сайт, содержащий нечто оскорбительное или нарушающее закон, кроме как получить дорогостоящий судебный запрет.
Вне сети с этим разобраться легче. Все учебники и энциклопедии подвергаются тщательной проверке специалистами (хотя порой школьное руководство вносит изменения в их содержание под влиянием политической ситуации и по требованию законодательной власти). Статьи в крупных газетах, выпускаемых в демократических странах, вычитываются очень скрупулезно, в отличие{41} от не вызывающих никакого доверия газет Ирана или, например, КНДР, цензурируемых правительством. Если фармацевтическая компания предъявляет претензию, то Управление по санитарному надзору за качеством пищевых продуктов и медикаментов, Министерство здравоохранения в Канаде или похожие организации в других странах должны ее засвидетельствовать. Если на телевидении выходит реклама, Федеральная торговая комиссия будет рассматривать жалобы на ее недобросовестность, этим занимается Управление по стандартам рекламы (в Канаде ASC; в Великобритании — ASA). В Европе за это отвечает организация под названием EASA (Европейский альянс рекламных стандартов). У многих других стран имеются похожие органы власти.
Все ловкачи и пройдохи, делающие ложные заявления, могут быть наказаны. Однако штраф часто бывает очень незначительным и не годится в качестве серьезного средства устрашения. В 2014 году компания Red Bull, выпускающая энергетический напиток, в результате судебного разбирательства была обязана выплатить более 13 миллионов долларов: потребители напитка сочли, что были введены в заблуждение, — им пообещали, что их физическая и умственная работоспособность повысится[112]. В 2015 году компания Target согласилась выплатить 3,9 миллиона долларов, чтобы с нее сняли обвинения в том, что цены на ее продукты в магазине были выше тех, что анонсировались в рекламе, а также в том, что вес продуктов отображался некорректно[113]. В 2015 году та же история произошла и с розничным магазином Whole Foods, торгующим натуральными продуктами. По решению суда компания Kellogg’s должна была выплатить 4 миллиона долларов за недобросовестную рекламу[114]. В ней говорилось, будто в результате клинических исследований было доказано, что употребление глазированных пшеничных хлопьев Frosted Mini-Wheats «повышало внимание у детей на 11 %». И хотя для нас все эти суммы кажутся огромными, для Red Bull (прибыль в 2014 году составила 7,7 миллиарда долларов), Kellogg’s (14,6 миллиарда) и Target (72,6 миллиарда) эти штрафы лишь немногим больше, чем ошибка округления в бухгалтерских отчетах.
Это актуальная информация? Ей можно доверять?
В отличие от книг, газет и традиционных источников информации, сайты редко публикуют даты; графики, таблицы, схемы не всегда указывают, к какому периоду эти данные относятся. Прочитав слова «продажи и прибыль с начала года и до сегодняшнего дня», вы не сможете с полной уверенностью утверждать, что эта информация актуальна на сегодняшний день или даже на текущий год.
Создать страничку в интернете — дело нехитрое и стоит недорого, поэтому люди их часто бросают, когда не хотят ими больше заниматься или переключаются на другие проекты. И такие странички становятся своего рода заброшенными витринами, украшенными неоновой вывеской, что магазин «открыт», хотя на самом деле он давно не работает.
По самым разным причинам, о которых мы уже говорили, — мошенничество, отсутствие компетентности, ошибки в измерениях, ошибки интерпретации — научные открытия и заявления сейчас ставятся под сомнение. Бывает, что отдельных участников преступления, которых сочли виновными в ходе проведенного судебного разбирательства, оправдывают. Эксперты меняют свое мнение. Беглого просмотра нового сайта недостаточно, чтобы понять, заслуживает ли он доверия. Новые сайты возникают чуть ли не каждую неделю, публикуя мифы, которые были полностью развеяны. Есть множество сайтов, развенчивающих городские легенды, например Snopes.com, или публикующих опровержения, например RetractionWatch.com.
В период с осени 2015 года и вплоть до президентских выборов 2016-го некоторое количество людей заходило на сайты, занимающиеся проверкой фактов, чтобы посмотреть, правду ли говорят политики. Политики лгут еще со времен Квинта Туллия Цицерона, писавшего об этом письмо своему брату Марку в 64 году до н. э. Чем располагаем мы и чего не было у Цицерона — так это возможность проверить факты в реальном времени. Это не означает, что все результаты проверок точны и непредвзяты, дорогой читатель. По-прежнему нужно смотреть, чтобы тут не были отражены интересы какого-то конкретного кандидата или конкретной партии.
Politifact.com, сайт, созданный газетой Tampa Bay Times, получил Пулитцеровскую премию за отчеты, в которых публикуются результаты мониторинга и проверки фактов, упоминаемых известными людьми в выступлениях, при появлении на публике, а также в интервью. В своей работе репортеры используют шестибалльную шкалу, с помощью которой оценивают услышанное: Правда, Практически правда, Полуправда, Практически ложь, Ложь и — в самых вопиющих ситуациях — На воре шапка горит, когда утверждения не соответствуют действительности и выглядят совершенно нелепо. У газеты Washington Post тоже есть свой сайт, где можно проверить достоверность упоминаемой публично информации, но оценивается она в Пиноккио{42} [115]. А также газета вручает свой собственный приз, «Одобрено Джеппетто»{43}, — за утверждения, в которых содержится «правда, только правда и ничего, кроме правды».
Вот, например, одна история: 21 ноября 2015 года кандидат в президенты Дональд Трамп выступил с речью на собрании в Бирмингеме, штат Алабама. Чтобы получить голоса в поддержку своей позиции (он, в частности, собирался создать орган регистрации мусульман в Соединенных Штатах в рамках программы предотвращения угрозы терроризма внутри страны), Трамп подробно рассказал о «тысячах и тысячах» мусульман в Джерси-Сити, выразивших радость, когда 9 сентября 2001 года рухнуло здание Всемирного торгового центра. Репортер ABC News Джордж Стефанопулос на следующий день публично возразил Трампу, заметив, что полиция Джерси-Сити отрицает эту информацию. Трамп ответил, что видел все это по телевизору собственными глазами и что это событие очень хорошо освещалось в прессе. Politifact и Washington Post проверили все телевизионные записи за три месяца, прошедшие с момента террористической атаки, и не нашли ничего, что могло бы подтвердить слова Трампа. На самом деле в городе Патерсон, штат Нью-Джерси, мусульмане разместили уличный баннер, на котором было написано: «Сообщество мусульман не поддерживает терроризм». Платформа Politifact подытожила свое журналистское расследование, написав, что воспоминание Трампа «идет вразрез со всеми доказательствами, которые мы могли найти. Мы оцениваем эти слова кандидата в президенты как грандиозную ложь»[116]. Газета Washington Post присвоила Трампу рейтинг «четыре Пиноккио».
Во время той же самой кампании Хиллари Клинтон заявила, что все ее бабушки и дедушки были иммигрантами. Согласно Politifact (и данным переписи населения США), только один из них был рожден за рубежом, а трое остальных родились в США[117].
Скопировано, вставлено, отредактировано?
Один из способов заставить людей поверить вам — найти соответствующие «умные» высказывания на чужом сайте и перетащить их на свой. Почему бы не вложить несколько собственных противоречивых мыслей в уста другого человека и не повысить посещаемость вашего сайта? Если вы преследуете какие-то корыстные цели, можно устроить публичную порку, отредактировав чужой тщательно продуманный аргумент — и добавив весу противоположной позиции. Наша задача — убедиться, что мы читаем оригинал, а не имеем дело с исправленной копией, полетом чьей-то фантазии.
Дополнительная информация
Недобросовестные составители рекламных текстов, журналисты, политики и прочие рассчитывают, что никто не будет проверять сноски или цитаты. Поэтому лгать становится все легче. Итак, вы хотите, чтобы на вашем сайте люди узнали, что крем, который вы производите, действительно замедляет процесс старения на десять лет. Для этого вы пишете статью и щедро сдабриваете ее ссылками, которые ведут на интернет-странички, не имеющие никакого отношения к предмету разговора. С помощью такой уловки вам удастся обвести вокруг пальца множество пользователей, потому что большинство даже не станут утруждать себя проверкой. А те, кто все же решит проверить, не уйдут дальше URL, связанного с каким-то значимым сайтом, например экспертным журналом о старении или дерматологии, даже если там ни слова не будет о вашем продукте.
Что еще хуже, цитата может иметь хоть какое-то, пусть второстепенное, отношение к обсуждаемому вопросу, но при этом не быть важной. Например, вы заявляете, что крем содержит витамин X, который должен сделать кожу более здоровой, качественно ее улучшить. Что ж, звучит разумно. Но как этого добиться? Говорится ли в ваших отчетах о том, что испытуемые мазали кремом кожу или принимали его перорально? И в каких дозах? Содержится ли в вашем креме достаточное количество витамина X?
Трудности терминологии
Вы можете прочитать на сайте CDC.gov, что заболеваемость какой-то определенной болезнью — один человек на 10 тысяч. А потом вы вдруг натыкаетесь на статью на сайте NIH.gov, в которой говорится, что распространенность того же заболевания — один человек на тысячу. Может, тут неправильно поставили запятую, разделяющую цифры, может, это опечатка? Не говорится ли в обоих случаях об одном и том же? На самом деле нет. Заболеваемость — это количество новых случаев (инцидентов), о которых сообщают за определенный период, например за год. А распространенность — это количество существующих случаев заболевания, то есть общее количество людей, у которых оно выявлено. (Те, кто боится цифр, бросив быстрый взгляд на данные, по ошибке видят, что единица на тысячу — меньше, чем единица на 10 тысяч, фокусируясь на большом числе со всеми этими нулями, а не на предлоге «на».)
Множественный склероз — демиелинизирующее заболевание головного и спинного мозга. В Соединенных Штатах ежегодно диагностируют 10 400 новых случаев, что приводит к заболеваемости, равной 10 400/322 000 000, или 3,2 случая на 100 тысяч человек[118]. Иными словами, вероятность заболеть равна 0,0032 %. Сравните это с общим числом жителей США, у которых склероз уже есть, а это 400 тысяч, что приводит к распространенности 400 000/322 000 000, или 120 случаев на 100 тысяч человек. Иными словами, вероятность заболеть склерозом в течение жизни равна 0,12 %.
Помимо заболеваемости и распространенности, часто говорят о третьем показателе, смертности — количестве людей, умерших от этого заболевания, как правило, за какой-то промежуток времени. Каждый год у 1,1 миллиона людей диагностируют ишемическую болезнь сердца, 15,5 миллиона американцев живут с этим заболеванием постоянно, а 375 295 человек ежегодно умирают от него[119]. Вероятность, что человеку диагностируют сердечное заболевание в этом году, составляет 0,3 %, что в 300 раз превышает вероятность получить множественный склероз. Вероятность того, что у человека он прямо сейчас, равна 5 %, а вероятность умереть от него в течение любого отдельно взятого года — 0,1 %. Вероятность умереть от него в некоторый момент в течение жизни равна 20 %. Конечно, как мы видели в части 1, это касается всей совокупности американцев. Если нам будет известно что-то о конкретном человеке, например история сердечных заболеваний в его семье, курит он или нет, каков его вес и возраст, мы сможем дать более точную оценку, используя условные вероятности.
Заболеваемость может быть высокой, в то время как распространенность и смертность — относительно низкими. Пример тому — обычная простуда. В течение года простудиться могут миллионы людей (высокая заболеваемость), но почти в каждом отдельном случае все быстро проходит, и поэтому распространенность — количество людей, у которых выявлено данное заболевание в определенный момент, — может быть низкой. Некоторые заболевания встречаются довольно редко, некоторые принимают хроническую форму, с какими-то легко справиться, поэтому заболеваемость может быть низкой (не так много случаев заболеваемости в год), распространенность — высокой (все случаи, вместе взятые, когда люди продолжают жить с заболеванием), а смертность низкой.
Как мы видели, часто, оценивая факты и доказательства, люди игнорируют цифры и названия осей, но наряду с этим часто игнорируют и вербальные описания. Вспомните часть 1 и карты Соединенных Штатов, на которых изображены данные о первичном коэффициенте рождаемости. Вам было интересно, что это такое? Вы могли представить себе, что определение этого коэффициента можно уточнять по-разному: например, родился ребенок живым или нет, выживет ли он в течение первых недель и т. д. Можно подумать, основываясь на слове «первичный», что речь идет о каком-то сыром, чистом, необработанном числе. Но это не так. Статистики пользуют термин «первичный коэффициент рождаемости», чтобы подсчитать живорожденных детей (следовательно, речь идет об исправленном, скорректированном числе, в него не входит число мертворожденных младенцев). Поэтому, принимая решение, запускать ли компанию по производству подгузников, вам необходимо знать первичный коэффициент рождаемости, а не общий ее уровень (потому что общий уровень рождаемости включает и малышей, которые не выжили во время родов).
Кстати, сопряженный с этим показатель, первичный коэффициент смертности, показывает количество людей, умирающих в любом возрасте. Если вычесть этот показатель из первичного коэффициента рождаемости, вы получите уровень естественного прироста населения — показатель, который представляет большой интерес для руководящих кругов (Томас Мальтус{44} тоже им интересовался).
Пропущенные, недооцененные альтернативные объяснения
Оценивая заявление или какой-то довод, спросите себя, нет ли иной причины — помимо той, о которой вам известно, — которая могла бы вызвать рассматриваемую ситуацию. Всегда найдутся какие-то альтернативные объяснения, и наша задача — их взвешивание и сравнение с теми, что предлагаются. А также мы должны решить, сделал человек, выносящий заключение, наиболее очевидный вывод или наиболее правдоподобный.
Например, если, проходя по коридору, вы здороваетесь с другом, а он ничего не отвечает, вы можете подумать, что он зол на вас. Но альтернативным объяснением может быть тот факт, что он вас просто не заметил, спешил на встречу, был чем-то занят, участвовал в психологическом эксперименте, поклялся молчать как рыба в течение часа или в него временно (а то и навсегда) вселился кто-то другой.
Альтернативные объяснения часто возникают в псевдонауке и контрзнании, но их можно встретить и в настоящей науке. Например, физики из ЦЕРН сообщили, что открыли нейтрино, двигающееся со скоростью, превышающей скорость света. Это могло бы пошатнуть теорию Эйнштейна, которая царствовала последнее столетие. Но выяснилось, что дело в неверно подключенном кабеле в линейном ускорителе. Это только подчеркивает тот факт, что методологическая ошибка в чрезвычайно сложном эксперименте — почти всегда более вероятное объяснение, чем то, что заставило бы нас полностью переписать наше понимание устройства Вселенной.
Рассмотрим еще один пример: если на каком-то сайте приведены результаты экспериментов, говорящие о том, что совершенно новый, до этого никому не известный витаминный коктейль повысит ваш уровень IQ на 20 пунктов — а фармацевтические компании не хотят, чтобы вы об этом знали, — вам стоит задуматься, насколько вероятно, что никто об этом коктейле ничего не слышал. Может, альтернативным объяснением происходящего будет чье-то желание заработать на этом.
Менталисты, предсказатели судьбы, экстрасенсы зарабатывают неплохие деньги, демонстрируя, казалось бы, невиданное мастерство чтения мыслей. Их умения можно было бы объяснить тем, что им известен некий секрет, доступна некая скрытая сила, идущая вразрез со всем, что мы знаем о причинах и следствиях, а также о самой природе пространства-времени. Есть альтернативное объяснение: они только иллюзионисты, они показывают фокусы и попросту лгут о том, как им удается все то, что они делают. В пользу последней версии говорит то, что существуют профессиональные иллюзионисты — например, Джеймс Рэнди{45}, которому пока что удавалось с помощью фокусов воспроизводить каждый трюк, показанный менталистом. Часто иллюзионисты, желая скомпрометировать самопровозглашенных экстрасенсов, рассказывают, как те делают свои фокусы. Справедливости ради надо сказать о другой возможности: именно иллюзионисты и пытаются нас обмануть — они сами экстрасенсы, но просто боятся показать нам свой талант (возможно, опасаются, что кто-то воспользуется этим себе на пользу, или просто боятся похищения) и притворяются, что используют какие-то иллюзии. Однако повторю, что надо взвесить обе возможности: одна заставляет нас отказаться от всего, что мы знаем о природе и науке, а другая нет. Любой психолог, сотрудник правоохранительных органов, человек из мира бизнеса, разведенный супруг, сотрудник иностранной компании, шпион или юрист скажут вам, что людям свойственно лгать. У них на это есть множество причин, и лгут они подчас с тревожной частотой и изобретательностью. Но если вы столкнулись с заявлением, которое покажется вам маловероятным, попытайтесь найти альтернативное объяснение: возможно, человек просто водит вас за нос.
Те, кто пытается предсказать будущее, не обладая никакими талантами экстрасенса, — военные лидеры, экономисты, бизнес-стратеги, — часто заблуждаются в своих выводах, потому что не учитывают альтернативное объяснение. Это привело к возникновению в мире бизнеса такого термина, как сценарное планирование, — когда приходится рассматривать все возможные варианты развития событий, даже те, что кажутся маловероятными. Порой это бывает очень сложно, и ошибаются даже эксперты. В 1968 году, например, Уилл и Ариэль Дюрант написали:
Более низкий уровень рождаемости в англиканских общинах в Соединенных Штатах снизил их экономическую и политическую мощь, а более высокий уровень рождаемости католиков предполагает, что к 2000 году католическая церковь станет основной силой национального, муниципального и государственного управления.[120]
Единственное, что они упустили, — это тот факт, что за грядущие 32 года многие католики покинут церковь, а другие, несмотря на запреты, прибегнут к контролю рождаемости. В 1968 году было сложно себе представить сценарии, альтернативные принятым в то время.
Социальные и художественные предсказания тоже переворачиваются с ног на голову: во времена Beatles эксперты уверяли, что «гитарные группы переживают закат». Многие авторы отзывов, полученных после первого исполнения Пятой симфонии Бетховена, уверяли, что никто никогда не будет ее слушать. В науке тоже все меняется. Эксперты когда-то говорили, что скоростные поезда никогда не будут ходить, потому что пассажиры умрут от удушья. Эксперты полагали, что свет двигается через невидимый «эфир». Наука и жизнь не стоят на месте. Все, что нам подвластно, — взвешивать доказательства и принимать решения с помощью тех инструментов, которые имеются в нашем распоряжении. Один из таких инструментов, которым напрасно пренебрегают, — креативное мышление, благодаря которому можно представить себе альтернативные решения.
Альтернативные объяснения часто играют решающую роль в юридических спорах во время судебных заседаний. Те фрейминговые эффекты, которые мы видели в части 1, а также непонимание того, что условные вероятности не работают в обратном направлении, не раз становились причиной неверных выводов.
В правильном научном рассуждении выдвигают две (или более) гипотезы, для каждой из которых определяется вероятность. Адвокаты в зале суда должны фокусироваться не на вероятности совпадения, а на вероятностях двух возможных сценариев: вероятности того, что образцы крови происходят из одного и того же источника, и вероятности того, что это не так. Более того, мы должны сравнить вероятности совпадения образцов при условии, что подозреваемый виновен, и при условии, что он невиновен. Также мы могли бы сравнить вероятность того, что обвиняемый невиновен, учитывая имеющуюся у нас информацию, и вероятность того, что он виновен, учитывая имеющуюся у нас информацию. При этом нам важна точность всех измерений. В 2015 году ФБР объявило, что анализ образцов волоса под микроскопом в 90 % случаев давал неверные результаты[121]. Не зная этого, невозможно вынести справедливое судебное решение[122]. То есть, если говорить исключительно о совпадениях, мы рассматриваем только одностороннее свидетельство: вероятность совпадения с учетом гипотезы, что подозреваемый был на месте преступления. Но чего мы не знаем, так это вероятности совпадения с учетом альтернативных гипотез. А эти две вероятности нужно сравнивать.
И такое происходит постоянно. Однажды в Великобритании был такой случай: обвинение подозреваемому Деннису Адамсу было основано только на результатах анализа его ДНК[123]. Жертва не смогла опознать его и заявила в зале суда, что Адамс не был похож на того, кто на нее напал. А также она сказала, что Адамс выглядит на два десятка лет старше, чем преступник. Кроме того, у Адамса было алиби: в ночь преступления он был в другом месте, что смогла подтвердить третья сторона, дав соответствующие показания. И единственным доказательством, которое обвинитель смог предоставить, было совпадение ДНК.
У Адамса был брат, чья ДНК тоже могла подойти; никаких иных доказательств, что брат совершил преступление, не было, поэтому во время расследования ставки на эту версию решили не делать. Но и дополнительных доказательств против Денниса тоже не имелось. И никому в зале суда не пришло в голову альтернативное объяснение, что преступление все же совершил брат… В результате Деннис был осужден во время первого судебного заседания, а потом проиграл и апелляцию.
Постройки древности, видимые из космоса
Возможно, вы слышали, что человеческая жизнь зародилась вовсе не на Земле, что раса пришельцев спустилась из космоса и положила начало нашей жизни. Нельзя сказать, что утверждение само по себе неправдоподобно, просто нет ни одного доказательства в поддержку этой идеи. Это не означает, однако, что такая мысль неверна и что нам не нужно искать доказательств. От того факта, что что-то могло бы быть правдой, пользы мало — ну разве что для научной фантастики.
В 2015 году в New York Times опубликовали статью о каком-то мистическом образовании на территории Казахстана, которое было видно только из космоса[124].
На снимках, полученных со спутников, видна глухая северная степь, где не растет ни одно дерево, зато хорошо видны колоссального размера сооружения — геометрические фигуры в форме квадратов, крестов, линий и кругов, размерами достигающие нескольких футбольных полей. И видно все это только с воздуха; возраст самого старого из них оценивается в 8 тысяч лет. Самое крупное сооружение, расположенное рядом с поселением неолитической эпохи, представляет собой гигантский квадрат из 101 кургана, его противоположные углы соединены косым крестом, фигура охватывает территорию, по размеру превосходящую площадь Великой пирамиды Хеопса. Еще одно сооружение похоже на трехконечную свастику, на ее концах расположены зигзагообразные фигуры, загнутые против часовой стрелки.
Легко увлечься и нафантазировать себе, что таким способом древние пытались подать сигнал пришельцам, следуя при этом строгим инструкциям внеземных цивилизаций. Или это была посадочная площадка древнего космического корабля, а может, зашифрованное послание, что-нибудь вроде «Пришлите побольше еды». Мы, люди, вечно представляем себе что-то экстраординарное. Уж очень мы любим рассказывать, слушать и придумывать истории.
Отставив довольно очевидный факт, что любая цивилизация, способная осуществить межзвездный перелет, должна была иметь в своем распоряжении более эффективную коммуникационную технологию, нежели сооружения из мусора и грязи, можно сказать, что существует альтернативное объяснение. К счастью, газета New York Times его предоставляет, как видно из слов Дмитрия Дея, человека, обнаружившего таинственные сооружения:
«Не думаю, что они были задуманы таким образом, чтобы их было видно с воздуха», — сообщил 44-летний Дей в одном интервью, находясь у себя дома, в родном Костанае. Он отмел нелепые версии о пришельцах или нацистах (задолго до Гитлера свастика являлась древним, практически всеобщим элементом украшения). Дмитрий Дей полагает, что фигуры, построенные на некотором возвышении, вдоль прямых линий, были «горизонтальными обсерваториями, необходимыми, чтобы отслеживать траекторию восходящего солнца».
Объяснение, связанное с древней обсерваторией, кажется более вероятным, нежели версия о пришельцах. Это не означает, однако, что оно верно, но информационная грамотность и размышления на тему предполагают правдоподобные альтернативные объяснения, например такое.
Отсутствие контрольной группы
Так называемый эффект Моцарта был дискредитирован, потому что во время экспериментов, показывающих, что прослушивание Моцарта в течение 20 минут в день временно увеличивает IQ, не хватало контрольной группы. Это значит, что одной группе давали слушать Моцарта, а второй не давали никакого задания. Ничегонеделанье не есть форма адекватного контроля, и оказалось, что если давать испытуемым задание — какое угодно, — то эффект исчезает. Эффект Моцарта возникал не от музыки Моцарта, повышающей IQ. Такой эффект наблюдался скорее на контрасте с той скукой, которую испытывала вторая группа, чей IQ временно снижался из-за ничегонеделания.
Если вы приведете в лабораторию 20 человек, страдающих головной болью, дадите им свое новое лекарство, способное творить чудеса, и десяти из них и правда станет лучше, это будет означать, что ничего-то вы не узнали. Некоторые виды головной боли проходят сами собой, с течением времени. Сколько их? Никому не известно. Вам нужно было бы иметь контрольную группу, состоящую из людей приблизительно одного возраста и происхождения, страдающих схожей формой головной боли. А так как даже сама вера в то, что вам может стать лучше, порой приводит к улучшению самочувствия, вам придется дать контрольной группе что-нибудь такое, что подкрепит эту веру, да так же сильно, как и изучаемое фармакологическое средство. Следовательно, потребуется хорошо всем известное плацебо — вещество, которое выглядит так же, как волшебная пилюля, устраняющая головную боль. Но предложить его нужно так, чтобы никто из испытуемых ничего не заподозрил, пока эксперимент не подойдет к завершению.
Малкольм Гладуэлл в своей книге David and Goliath: Underdogs, Misfits, and the Art of Battling Giants{46} распространил неверное заключение, заявив, что те, кто страдает дислексией, могут на самом деле считать себя счастливчиками. Он заставил многих родителей верить, что их дети-дислексики не должны получать то специальное образование, в котором так нуждаются. Гладуэлл допустил ошибку из-за отсутствия условий контроля, и мы не знаем, насколько успешнее могли бы стать отобранные им дислексики, будь у них возможность улучшить условия своего обучения.
Отсутствие контрольной группы сложнее обнаружить в повседневных разговорах, нежели в научных заявлениях, — просто потому, что там мы не ищем. Вот вы читаете — и признаете разумным — новое исследование, в котором говорится, что если ложиться спать и просыпаться в одно и то же время, повысятся продуктивность и креативность. Ваша подруга, художница, успешная во всех отношениях, возражает. Она говорит, что всегда ложилась спать тогда, когда хотела, частенько засиживаясь до утра, а иногда и проводила в постели по 20 часов кряду, — при этом все у нее хорошо. Видите, в этом примере нет контрольной группы. Насколько более продуктивной и креативной могла бы стать девушка, придерживайся она всегда четкого режима?[125] Нам неизвестно.
Братья-близнецы были разлучены после рождения и выросли отдельно друг от друга — один из них в нацистской Германии, а второй в Тринидаде и Венесуэле[126]. Одного воспитали в католической церкви (позже он стал членом гитлерюгенда), второго как иудея. Они воссоединились 21 год спустя и выяснили, что у них было поразительно много общего в поведении[127]. Многие восхищенные свидетели приписывали эти совпадения генетике: оба чесали голову безымянным пальцем, оба подкрадывались к незнакомцам и громко чихали, находя это забавным. Оба были небольшого роста, носили аккуратно подстриженные усики и прямоугольные очки в округлой проволочной оправе. Оба ходили в голубых рубашках с эполетами и карманами на военный манер. У них была одинаковая походка, и они в одинаковых позах сидели в кресле. Оба любили масло и острую еду, спускали воду в туалете до и после использования и заглядывали в конец книги, прежде чем ее прочесть. Оба обматывали свои ручки и карандаши изолентой, чтобы те меньше скользили в руке.
Подобные истории могут заставить вас задуматься о том, какое влияние оказывают гены на наше поведение. А может, мы всего лишь автоматы и наши действия предопределены? А как иначе объяснить такие совпадения?
Итак, существует два способа, но обоим недостает контрольной группы. Социальный психолог, возможно, скажет, что обычно к людям, которые похожи внешне, относятся схожим образом. С красавчиками обращаются иначе, нежели с теми, кто некрасив, к людям высоким отношение не такое же, как к низкорослым. Если по вашему лицу видно, что вы человек честный и не своекорыстный, то к вам будут относиться не так, как относились бы, будь выражение лица иным. Поведение братьев-близнецов сформировалось под влиянием того мира, в котором они жили. Нам нужно было бы иметь контрольную группу людей, не имеющих никаких родственных взаимоотношений, но которые все же выглядели бы поразительно похожими и были воспитаны отдельно друг от друга. При соблюдении этих условий в «естественном эксперименте» с близнецами, разлученными в детстве, мы бы получили четкий результат.
Есть тысячи вещей, которые мы регулярно делаем в течение жизни. Статистик или генетик-бихевиорист сказал бы, что у двоих произвольно выбранных незнакомцев может обнаружиться поразительное сходство, например в выборе одежды, уходе за собой, склонности к розыгрышам и т. д.[128] Нужно просто долго за ними наблюдать и хорошенько к ним присматриваться. Не имея контрольной группы, объединяющей незнакомцев и тех, кто проводит эксперимент и изучает их привычки, мы не знаем наверняка, что стало движущей силой в истории с близнецами: генетика или чистой воды случайность. Возможно, все же огромную роль играет генетика, но есть вероятность, что не такую большую, как нам кажется.
Избирательный подход
Наш мозг устроен так, чтобы придумывать истории, по мере того как он впитывает все многообразие мира, в котором каждую секунду происходит миллиард событий. Конечно, бывают совпадения, которые на самом деле ничего не значат. Если вы думаете о своей подруге, с которой давно не общались, и вдруг в эту минуту она вам звонит, это не значит, что один из вас ясновидящий. Если вы три раза подряд выиграете в рулетку, это не значит, что у вас началась полоса везения и нужно ставить последние деньги. Если механик, не имеющий ни одного сертификата, починил вашу машину, это не означает, что он справится с этим и в следующий раз, — возможно, ему просто повезло.
Предположим, у вас есть гипотеза, что избыток витамина D приводит к недомоганию; вы даже можете найти доказательства, подтверждающие эту точку зрения. Но если вы всецело настроены на поиски только доводов в поддержку своей идеи, ваше исследование нельзя назвать качественным, потому что вы игнорируете доказательства обратного — их может быть мало, а может и много, но вы о них не узнаете, потому что не обратили на них внимания. Ученые это называют «избирательный подход» — вы выбираете только те данные, которые доказывают вашу гипотезу. Качественное же исследование требует сохранения объективности в любом вопросе. Старайтесь честно рассматривать все «за» и «против» и только потом формировать свое мнение, исходя из имеющихся доказательств (а не из эмоций типа «Надо же! Лучше бы это было по-другому»).
Избирательный подход идет рука об руку с ограниченностью точки зрения. Такое случается, когда информация, к которой у вас есть доступ, оказывается нерепрезентативной по отношению к целому. Если вы смотрите на город из окна поезда, то видите только его часть, и не обязательно репрезентативную: вы ограничены окном, а значит, получаете искаженную информацию. Кроме того, поезда шумят. Чем люди более состоятельны, тем дальше они селятся от железнодорожных путей, значит, те, кто живет ближе к ним, как правило, не очень состоятельны. Если все, что вам известно о городе, — кто живет у путей, значит, вы не видели всего города.
Конечно, все это связано с дискуссией о сборе данных, которую мы начали в части 1, и важностью наличия репрезентативных выборок. Мы ведь стараемся понять, как устроен мир — или по меньшей мере новый город, мимо которого проезжаем на поезде, — и хотим получить альтернативные объяснения тому, что видим, или тому, что нам говорят. Удачное альтернативное объяснение, проливающее свет на многие ситуации, заключается в том, что вы видите только часть общей картины, а то, что скрыто от вашего взгляда, может выглядеть совсем иначе.
Например, ваша сестра гордо демонстрирует рисунок своей пятилетней дочери. И он может быть восхитительным! Если вы любите живопись, поставьте его в рамочку. Ну а если вы обдумываете вариант, инвестировать ли деньги в племянницу как в будущего великого художника мирового масштаба, то вам нужно задать несколько вопросов: кто отобрал эту работу? Кто обрезал рисунок? Каким по размеру был оригинал? Сколько рисунков было у маленького Пикассо до этого? Что было сначала, а что потом? Перебирая работы и отсеивая лишнее, вы можете наткнуться на серию выдающихся работ или удачный фрагмент чего-то более крупного (и менее впечатляющего), что было отобрано учителем.
При чтении заголовков мы тоже сталкиваемся с ограниченностью точки зрения. Например, вы видите: «Американцев, поддерживающих новое законодательство, втрое больше, чем тех, кто выступает против». И даже если окажется, что исследование было проведено на репрезентативной и достаточно большой выборке американцев (о необходимости этого мы писали в части 1 нашей книги), нельзя говорить, что большинство жителей США поддерживают законодательство. Может получиться так, что 1 % выступает против, 3 % поддерживают, а 94 % воздерживаются. Примените тот же принцип, читая заголовок про выборы: «На президентских праймериз кандидата А поддерживают в пять раз больше республиканцев, чем кандидата B». Может, это и правда, но этот заголовок может скрывать, что за кандидата C отданы 80 % голосов.
Попробуйте подбросить монетку десять раз. Вы «знаете», что в половине случаев должна выпасть решка. Но есть вероятность, что этого не случится. Даже если вы подбросите ее тысячу раз, решка может и не выпасть ровно 500 раз{47}. Теоретические вероятности достигаются только в случае неограниченности количества попыток. Чем больше раз подбрасывать монетку, тем ближе соотношение орлов и решек будет к пропорции 50 на 50. Это парадоксально, но существует вероятность, которая близка к 100 %, что где-то в череде тысячи бросаний у вас выпадет пять раз подряд решка. Почему же это так парадоксально? Эволюция не подготовила нас к интуитивному пониманию случайности. Случайные бросания обычно не чередуются строго (орел — решка — орел — решка), бывают длинные промежутки постоянства, когда выпадают одни решки или одни орлы. И тогда можно кого-нибудь легко обмануть: просто снимите на телефон, как вы подкидываете монетку тысячу раз подряд. Перед каждым броском произносите следующую фразу: «Это будет первая решка из пяти подряд». И если у вас выпадет решка, прежде чем кидать монетку еще раз, скажите: «Это будет вторая решка из пяти подряд». Если в следующий раз выпадет орел, начните заново. Если нет, перед следующим броском скажите: «Это будет третья решка из пяти подряд». А затем просто вырежьте сцену с пятью решками подряд. Вот вы всех и перехитрили! Если вам действительно хочется впечатлить кого-нибудь, попробуйте сделать это десять раз подряд! (Шанс на то, что, подбросив монетку тысячу раз, вы получите решку десять раз подряд, равен всего 38 %. Но посмотрите на это с другой стороны: если попросить сто человек в одной комнате подбросить монетку пять раз, то шанс, что у одного из них пять раз подряд выпадет решка, равен 96 %.)[129]
Опыт общения 75-летнего мужчины, занимающего высокий пост, с полицейскими Нью-Йорка сильно отличается от впечатлений 16-летнего темнокожего подростка — их опыт определяется тем, что они видят. Последний может заявить, что его регулярно задерживают безо всяких на то причин и обращаются с ним как с преступником, а это уже расовая дискриминация. А 75-летний мужчина может даже не понимать, как такое возможно: «Мы всегда с этими полицейскими так мило общались».
Пол Маккартни и Дик Кларк скупили все пленки со своими выступлениями на экране за 1960 год — якобы чтобы контролировать, как журналисты преподносят историю их успеха[130]. Если вы ученый, проводящий исследование, или документалист, ищущий архивные кадры, то вы ограничены тем, что вам показывают. Получив данные или доказательства в поддержку какого-то заявления, задайте себе вопрос, репрезентативно ли то, что вам предоставили, по отношению к целой картине.
Маленькие селективные выборки
Маленькие выборки обычно не очень репрезентативны.
Представьте, что вы отвечаете за маркетинг гибридного автомобиля и хотите сообщить об эффективности его топлива. Вы сажаете за руль водителя и получаете данные, что машина проезжает 129 километров на 4,5 литра топлива. Выглядит впечатляюще — получилось! Но, может, вам просто повезло? Ваш конкурент проводит более масштабное исследование, выпускает пять водителей на пяти автомобилях и получает, что на таком количестве топлива можно проехать 97 километров. Кто же прав? Вы оба! Предположим, ваш конкурент сообщил о полученных результатах следующим образом:
Тест 1: 93 км (на 4,5 л топлива)
Тест 2: 61 км (на 4,5 л топлива)
Тест 3: 111 км (на 4,5 л топлива)
Тест 4: 87 км (на 4,5 л топлива)
Тест 5: 129 км (на 4,5 л топлива)
Дорожные условия, температура окружающей среды, манера вождения — все это создает определенную вариабельность. Если бы вам повезло (а вашему конкуренту нет), ваш единственный водитель мог бы получить предельный результат, о котором вы бы потом радостно сообщили (и, конечно, если вы хотите только лучшее, то вы просто игнорируете результаты остальных тестов). Но если вам нужна правда, то необходима выборка побольше. Какая-нибудь независимая лаборатория, протестировавшая 50 разных заездов, могла бы обнаружить, что среднее арифметическое будет совершенно иным. В целом аномалии вероятнее в маленьких выборках. Большие выборки отражают то, что происходит в мире, гораздо точнее[131]. Статистики называют это законом больших чисел.
Если вы посмотрите на количество детей, рожденных в какой-нибудь сельской больнице за месяц, и увидите, что 70 % новорожденных — это мальчики (по сравнению с 51 % в крупных городских больницах), то можете решить, что в сельских больницах происходит что-то странное. Может, и происходит, но это не доказательство, чтобы делать выводы. Мы снова имеем дело с маленькой выборкой. В крупной больнице могли заявить, что среди 100 новорожденных 51 был мужского пола, а в маленькой больнице могли сказать, что у них семь мальчиков из десяти новорожденных. Как и в случае с монеткой, описанном выше, среднее арифметическое в статистическом смысле, 50 на 50, чаще встречается в больших выборках.
А какой должна быть выборка, чтобы считаться достаточной? Это задачка для профессионального статистика, но существует несколько простых, но эффективных правил, которые вы можете использовать, чтобы самостоятельно разобраться в прочитанном. Для демографического исследования (например, предпочтения во время голосования, предпочтения в выборе зубной пасты и т. д.) в интернете можно найти калькулятор для расчета размера выборки. Чтобы определить частоту чего-либо (например, сколько новорожденных мужского пола, сколько раз в день человек в среднем говорит о том, что он голоден, и т. д.), нужно знать базовые данные о том, что вы исследуете. Если исследователь хотел узнать, сколько случаев рождения альбиносов было зарегистрировано в каком-то сообществе, изучил тысячу новорожденных и среди них ни одного альбиноса не нашел, было бы глупо делать вообще какие-либо выводы: альбиносы рождаются в одном случае из 17 тысяч. Выборка в тысячу случаев слишком мала, если учесть, как редко встречается исследуемый феномен. С другой стороны, если исследуется частота преждевременных родов, тысячи случаев было бы более чем достаточно, потому что такое случается в одном случае из девяти[132].
Статистическая грамотность
Давайте представим себе уличную игру: в шляпе или корзине лежат три карты, у каждой из которых две стороны, — одна карта красного цвета с обеих сторон, одна белая с обеих сторон, а третья белого цвета с одной стороны и красного с другой[133]. Мошенник вытягивает карту и показывает вам одну сторону — она красная. Он ставит пять долларов, что оборотная сторона тоже будет красной. Он хочет, чтобы вы думали, будто вероятность тут 50 на 50, — вы соглашаетесь, делаете ставку, думая, что оборотная сторона будет белой. Ход ваших мыслей может быть таким:
Он мне показывает красную сторону карты. То есть он вытянул либо красно-красную карту, либо красно-белую. Следовательно, оборотная сторона будет либо красная, либо белая — вероятность одинакова в обоих случаях. Могу себе позволить принять эту ставку, потому что, даже если я не выиграю в этот раз, то уж точно в следующий.
Отставим в стороне типичное заблуждение любого игрока — многие потеряли деньги, удваивая ставки в рулетку, а в результате их накрывало осознанием, что удача не саморегулируема, — мошенник как раз и рассчитывает на то, что вы придете к подобным, в корне неверным, выводам, и обычно начинает говорить быстрее, чтобы отвлечь вас. Попробуем представить себе происходящее визуально:
Вот эти три карты:
Если мошенник показывает вам красную сторону карты, то это может быть один из трех возможных вариантов. В двух из них другая сторона красная и только в одном случае белая. Поэтому шанс два из трех (а не один из двух), что если бы он показал вам красную сторону, вторая была бы тоже красной. Просто многие из нас забывают, что в случае с красно-красной картой он может демонстрировать любую из этих сторон. Если вы тут ничего не поняли, не переживайте — подобную ошибку допустил философ математики Готфрид Вильгельм Лейбниц, равно как и многие другие авторы недавно опубликованных учебников[134]. Когда вы оцениваете заявления, в основе которых лежат вероятности, постарайтесь определить модель, по которой они строятся. Это порой бывает непросто, но если вам удастся понять всю сложность вероятности и всю ограниченность мышления, которую большинство из нас демонстрируют, оценивая их, вас будет не так-то просто обвести вокруг пальца. А что, если все вокруг вас соглашаются с какими-то в корне неверными заявлениями? Напоминает короля, одетого в изысканное платье, разве нет?
Контрзнание
«Контрзнание» — термин, который придумал британский журналист Дэмиен Томпсон{48} [135]. Это дезинформация, поданная как факт, в который уже начала верить некая критическая масса людей. Примеры можно привести из мира науки, это могут быть текущие события, сплетни о знаменитостях, псевдоэкскурсы в историю. Это могут быть заявления, которым не хватает доказательной базы, а также заявления, сама доказательная база которых им противоречит. Возьмите псевдоисторические заявления, что Холокост, высадка на Луне или атака на башни-близнецы в сентябре 2001-го в Соединенных Штатах никогда не происходили, но были частью огромного заговора (контрзнание не всегда предполагает заговоры — лишь иногда).
Уж что помогает ему развиваться, так это интрига: а что, если все это правда? Но опять же, люди — существа социальные, любящие слушать и рассказывать истории. Да, мы ценим удачную выдумку. Контрзнание изначально привлекает нас налетом знания, со всеми этими цифрами или статистическими данными, но дальнейшее изучение показывает, что под всем этим нет никакой базы — распространители контрзнания надеются, что цифры так вас впечатлят (или запугают), что вы просто слепо их примете. А еще они часто цитируют «факты», которые таковыми не являются.
Дэмиен Томпсон рассказывает о том, как подобные заявления получают распространение, западают нам в душу и заставляют усомниться в том, что мы знаем… И так и будет продолжаться, пока мы не применим рациональный анализ[136]. Томпсон вспоминает случай, когда один его друг, говоря о теракте 9/11, завладел вниманием слушателей благодаря одному весьма правдоподобно звучащему наблюдению. «Обратите внимание, — сказал он. — Башни осели вертикально, а не обрушились.
Температура горения авиационного топлива недостаточна для плавления стали. Это под силу только управляемому взрыву».
Вот вам анатомия контрзнания:
Башни осели вертикально: это правда. Мы все смотрели видео. Если бы атака была произведена так, как нам сказали, вы бы думали, что здание сейчас обрушится: это неявная, скрытая предпосылка. Мы не знаем, правда ли это. Тот факт, что говорящий облекает все в форму заявления, не делает его слова правдой. Это утверждение требует подтверждения. Температура горения авиационного топлива недостаточна для плавления стали: мы также не знаем, правда ли это. А кроме того, в здании могли находиться и другие легковоспламеняющиеся вещества, которые туда принесли заранее: чистящие средства, краска, промышленные химикаты — и как только начался пожар, они тоже могли загореться.
Если вы не инженер-строитель, то можете счесть, что эти предпосылки правдоподобны. Но если проверить информацию, можно понять, что в том, что башни осели, не было ничего мистического.
Важно понимать, что в сложных событиях не все можно объяснить, потому что каких-то вещей не заметили, о каких-то не сообщили. В деле убийства президента США Джона Кеннеди фильм Запрудера{49} — единственное фотографическое доказательство, запечатлевшее последовательность событий, и он не завершен. Фильм снят на любительскую камеру, частота кадров 18,3 в секунду, разрешение очень низкое[137]. До сих пор это убийство остается окутанным тайной: множество неразрешенных вопросов, множество свидетелей, которых так и не опросили, внезапная смерть тех, кто мог что-то рассказать и на кого делали ставки как на источник важной информации. Может, имел место и заговор, но тот факт, что до сих пор существуют вопросы без ответов и противоречивые мнения, нельзя считать доказательством этого. Как неожиданная головная боль, сопровождаемая расплывчатыми видениями, не может быть доказательством редкой опухоли мозга — скорее всего, это что-то менее драматичное.
Ученые и другие сторонники рационального мышления различают вещи, которые являются истиной (например, фотосинтез или то, что Земля вращается вокруг Солнца), и те, что, вероятно, истинны, например что атака 9/11 была осуществлена с помощью двух угнанных самолетов, а не силами правительства США. По этим версиям существует разное количество доказательств, и они в разной степени убедительны. И небольшое количество алогичностей не ставит под сомнение и уж тем более не подрывает теорию, которая зиждется на тысячах доказательств. Хотя все эти алогичности лежат в основе теорий заговора, ревизионизма Холокоста, антиэволюционизма и заговора 9/11[138]. Разница между ложной теорией и истиной — вероятностная[139]. Томпсон пытается приструнить контрзнание, когда оно идет вразрез с настоящим знанием и начинает распространяться.
Когда репортеры вводят нас в заблуждение
Репортеры собирают информацию о важных событиях двумя разными способами, которые, бывает, часто несовместимы друг с другом, и если журналист был не очень аккуратен, материал дезинформирует читателей.
Проводя научное расследование, репортеры работают совместно с учеными — делают репортаж о научных разработках и помогают перевести их на язык, понятный публике. Они делают то, что не всегда легко дается самим ученым. Репортеры читают об исследовании в журнале, рецензируемом специалистами в какой-то области, или в пресс-релизе. К тому моменту, как исследование получит экспертную оценку, трое или пятеро беспристрастных авторитетных ученых уже его просмотрят и согласятся с предложенными выводами. Обычно это не входит в обязанности репортера — определять вес научного доказательства, поддерживающего какую-то гипотезу, вспомогательные гипотезы и вывод. Это делается учеными, которые пишут статью.
Репортеры бывают двух видов. Серьезные, занимающиеся журналистским расследованием, например для Washington Post или Wall Street Journal, обычно обзванивают несколько ученых, не связанных с исследованием, и узнают их точку зрения. Они ищут мнение, идущее вразрез с тем, что было опубликовано в репортаже. Но другие (и их большинство) полагают, что их главная задача — пересказать статью своими словами.
Сообщая горячие новости, репортеры пытаются выяснить, что происходит в мире, собирая информацию из различных источников, разговаривая со свидетелями событий, например с кем-то, кто видел, как проходили вооруженное ограбление в Детройте, бомбежка в секторе Газа или наращивание военных сил в Крыму. У репортера может быть лишь один свидетель, но он может попытаться найти второго, третьего. Репортер в таком случае должен убедиться в достоверности и правдивости слов свидетеля. Тут помогают вопросы вроде: «Вы видели это своими глазами?» или «Где вы находились, когда все это случилось?» Вы удивитесь, насколько часто ответ свидетелей бывает отрицательным, как часто люди лгут, — и только благодаря тщательной проверке репортеров правда выходит наружу.
Поэтому в первом случае — с журналистским расследованием — авторы статей сообщают о научных находках, в основе которых, как правило, тысячи наблюдений и огромное количество данных. Во втором случае — с горячими новостями — журналисты сообщают о событиях, в основе которых — показания всего нескольких свидетелей.
А так как журналисты вынуждены работать с обоими видами новостей, они иногда принимают одно за другое, забывая, что сложение исторических анекдотов и курьезов — это еще не статистика, что ворох историй или случайных наблюдений не делает их статью научной. Отсюда и наше заблуждение, что газеты будут развлекать нас, рассказывать истории. А большинство хороших историй — это череда событий, имеющих причину и следствие. Рискованные ипотеки были превращены в инвестиционные продукты с наивысшим кредитным рейтингом, и это привело к обвалу жилищного рынка в 2007 году. Власти проигнорировали скопление хранившегося на возвышении строительного мусора в городе Шэньчжэнь, и в 2015-м случился оползень, накрывший 33 здания. Это не научные эксперименты — это события, в которых мы пытаемся разобраться и из которых мы пытаемся сделать истории. Доказательства в случае новостной и научной статей разные, но без объяснений, даже робких, неуверенных, у нас нет истории. А газетам, журналам, книгам — и людям — нужны истории.
Это основная причина, почему слухи, контрзнание и псевдофакты могут легко превратиться в пропаганду, распространяемую средствами массовой информации. Так было с Херальдо Риверой{50}: его репортажи о сатанистах вызвали панику по всей Америке. Уже бывали подобные медиастрашилки о похищении людей пришельцами или о подавленных воспоминаниях детства. Как заметил Дэмиен Томпсон, «для новостного редактора, испытывающего давление, и неубедительное свидетельское показание может стать козырем»[140].
Восприятие риска
Мы допускаем, что с помощью газетной площади, отданной под репортажи о преступности, можно в некотором роде измерить ее уровень. Или что количество газетных статей, освещающих самые разные причины смерти, соотносится с риском. Но подобные предположения не очень умны. Каждый год от рака желудка умирает[141] в пять раз больше людей, чем в результате неумышленного утопления[142]. Но взять хотя бы одну газету, Sacramento Bee: в 2014 году она не опубликовала ни одного материала о раке желудка, но разместила на своих страницах целых три статьи о неумышленном утоплении. Основываясь на обзоре новостей, можно сделать вывод, что смерть в результате утопления наступает намного чаще, чем в результате рака желудка. Когнитивный психолог Пол Словик{51} показал, что люди сильно переоценивают относительные риски, если ситуации, их вызывающие, получают повышенное внимание со стороны прессы. Отчасти освещение события в прессе зависит от того, получится ли из него хорошая история. Смерть в результате утопления более драматична, неожиданна, и, возможно, ее легче предотвратить, чем смерть от рака желудка, — налицо все элементы, необходимые для хорошей, хотя и печальной истории. Поэтому о случаях утопления сообщают чаще — а нам кажется, что они происходят чаще. Непонимание рисков может привести к тому, что мы будем игнорировать знаки, которые могут помочь нам защитить себя.
Используя вышеописанный принцип неправильно понятого риска, недобросовестные или просто плохо информированные статистики могут с помощью медиаплатформы обманным путем заставить нас поверить в ложь.
«Вы ужасно беспечны, а ведь в последнее время газеты так часто сообщают о цунами!»
Передовица в Times (Великобритания) в 2015 году сообщила, что у 50 % британцев в течение жизни обнаружится рак и число это возрастет по сравнению с 33 %, имеющимися на тот момент[143]. Это число может увеличиться, охватив две трети от сегодняшнего количества детей, и Национальная служба здравоохранения будет перегружена. На какие мысли это вас наводит? Что раковая эпидемия в самом разгаре? Возможно, виной всему современный образ жизни с бесполезным фастфудом, мобильными телефонами, представляющими собой источники электромагнитного излучения, канцерогенными моющими средствами, а также радиацией из-за дыр в озоновом слое. На самом деле эту идею могли бы использовать многие заинтересованные лица, которые не прочь на этом заработать: сторонники холистического подхода в медицине, инструкторы йоги, компании, занимающиеся распространением товаров здорового питания, компании, выпускающие солнцезащитные средства, и т. д.
Прежде чем паниковать, подумайте о том, что эта цифра включает в себя все виды рака, в том числе и медленно развивающиеся, например рак простаты, легко удаляемые меланомы и т. д. Это не означает, что все, у кого обнаружат рак, обязательно умрут. CRUK (Онкологический исследовательский центр Великобритании) сообщает, что благодаря ранней диагностике и более эффективному лечению процентное соотношение людей, победивших рак, начиная с 1970-х годов увеличилось в два раза[144].
Заголовки в СМИ умалчивают о достижениях в медицине и о том, что благодаря ее развитию люди живут дольше. Сердечные заболевания лечатся сегодня лучше, чем когда-либо, а количество смертей в результате респираторных заболеваний сильно снизилось за прошедшие 25 лет[145]. Просто смерть от рака настигает людей раньше, чем смерть от других возможных заболеваний. Ведь человек должен умереть от чего-то. Ту же самую мысль вы могли видеть в Times, если дочитали ее до соответствующей страницы (потому что ведь многие из нас не дочитывают до конца — мы обычно натыкаемся на заголовок и тут же начинаем переживать). На самом деле отчасти заголовок статьи отражает тот факт, что рак — заболевание пожилых людей (и многим из нас предстоит длинная жизнь, прежде чем мы заболеем). И тут нет причин для паники. Это ведь все равно что сказать: «У половины автомобилей в Аргентине когда-нибудь откажет двигатель». Ну да, откажет — ведь машины выходят из строя по какой-то причине. Это может быть сломанная ось, неудачное столкновение, полетевшая коробка передач или отказ двигателя — но должно быть хоть что-то.
Убеждение c помощью ассоциации
Если вы хотите подавить кого-то контрзнанием, хорошим вариантом будет собрать огромное количество фактов, которые можно легко проверить, и добавить к ним пару-тройку ложных. Пусть они будут как бы в защиту вашей точки зрения — и вы увидите, многие поверят и пойдут за вами. Вам удастся убедить людей благодаря фальшивым доказательствам или контрзнанию, смешанным с фактами и настоящим знанием. Посмотрите на следующие тезисы:
1) вода состоит из водорода и кислорода;
2) молекулярная формула воды H2O;
3) наши тела более чем на 60 % состоят из воды;
4) кровь человека на 92 % состоит из воды;
5) мозг состоит на 75 % из воды;
6) в мире есть много мест с зараженными источниками воды;
7) меньше 1 % доступной воды по всему миру является питьевой;
8) вы можете быть уверены в качестве воды, только если она бутилирована;
9) ведущие специалисты, занимающиеся проблемами здоровья, рекомендуют пить бутилированную воду, а большинство и сами пьют такую воду.
Пункты с первого по седьмой — абсолютная правда. Восьмой пункт не отличается логикой, а девятый… Кто такие ведущие специалисты, занимающиеся проблемами здоровья? И о чем говорит то, что они и сами пьют бутилированную воду? Возможно, на вечеринке, в ресторане, на борту самолета, где ее подают и нет других вариантов, они ее и выпьют. А может, это означает, что они тщательно избегают остальных видов воды? Между этими двумя вариантами — пропасть.
Факт в том, что бутилированная вода ничем не лучше воды из-под крана, если говорить о развитых странах, и в некоторых случаях даже менее безопасна из-за несоблюдения правил очистки. В основе этих заявлений — сообщения из огромного количества источников, включая Национальный cовет по охране природных ресурсов, клинику Мэйо, журнал Consumer Reports, публикующий отчеты сравнительных тестов разных потребительских товаров и услуг, а также ряд публикаций в журналах, рецензируемых специалистами[146].
Конечно, и здесь есть исключения. В Нью-Йорке, Монреале, Мичигане и многих других городах трубы в муниципальном водопроводе свинцовые: свинец может легко попасть в воду, из-за чего вполне возможно отравление этим металлом[147]. Периодические проблемы с очистными сооружениями вынуждают городские власти публиковать памятки о том, как пользоваться водопроводной водой. А при посещении стран третьего мира, где гигиенические нормы и стандарты очистки воды ниже, бутилированная вода может стать лучшим вариантом. Стандарты водопроводной воды в развитых промышленных странах очень высоки — сэкономьте деньги, не тратьтесь на покупную воду. Аргумент защитников псевдонаучного подхода к здоровью, как мы видим из вышеприведенного примера, не выдерживает никакой критики.
ЧАСТЬ 3. ОЦЕНКА МИРА
Природа позволяет нам вычислять только вероятности. Наука при этом пока еще держится.
Ричард Фейнман[148]
Как работает наука
Многовековое развитие критического мышления привело к изменению парадигмы человеческой мысли и истории: к научной революции. Не получив должного развития и применения в таких крупных центрах научного знания, как Флоренция, Болонья, Геттинген, Париж, Лондон и Эдинбург, наука не смогла бы повлиять на нашу культуру, промышленность и самые амбициозные достижения так, как она повлияла. Конечно, научные выводы не всегда безошибочны, но научное мышление лежит в основе многих наших поступков и попыток понять, что верно, а что нет. Поэтому стоит получше приглядеться к тому, что скрывается за этой завесой, чтобы понять, как все устроено. В частности, мы могли бы разобраться, как человеческому мозгу, который очевидно несовершенен — даже у самых ярких представителей, — удается самому себя обмануть.
К сожалению, следует также признать тот факт, что многие исследователи не гнушаются выдумывать данные. В самых крайних случаях они сообщают данные, которых никогда не получали в результате экспериментов, потому что такие эксперименты никогда не проводились. И им это сходит с рук, ведь обман среди исследователей — дело довольно редкое и поэтому коллегам-экспертам, как правило, незачем держать ухо востро. В иных случаях исследователь меняет какие-то данные, чтобы скорректировать результаты и подтвердить с их помощью свою гипотезу. В некоторых менее значительных случаях исследователь, бывает, опускает определенные данные, потому что они не отвечают требованиям гипотезы, или выбирает только те случаи, которые, по его мнению, добавят вес его теории. В 2015 году был случай мошенничества, когда бывший преподаватель биомедицинского факультета Университета штата Айова в Эймсе профессор Хан Донпё сфабриковал данные относительно потенциальной вакцины против ВИЧ[149]. В результате он не только потерял место в университете, но и был приговорен к пяти годам заключения в тюрьме.
Неразбериха относительно того, вызывает ли вакцинация от кори, эпидемического паротита и коревой краснухи аутизм, началась из-за статьи Эндрю Уэйкфилда, содержащей подтасованные данные, — теперь она отозвана, но миллионы людей по-прежнему продолжают верить в эту связь[150]. В некоторых случаях исследователь манипулирует данными и даже удаляет какие-то факты, но умалчивает об этих действиях, что затрудняет интерпретацию и воспроизведение эксперимента (а это уже граничит с нарушением научной дисциплины).
Наукой движет поиск доказательств, поиск правды, он же подстегивает наше чувство справедливости и лежит в основе судебной системы. Научный опыт показал нам, как правильно проводить эти исследования.
Существует два укоренившихся мифа о том, как работает наука. Согласно первому, наука развивается без сучка и задоринки, а ученые всегда и во всем согласны друг с другом. Согласно второму, один-единственный проведенный эксперимент дает нам ответы на все вопросы об изучаемом явлении, а после публикации результатов эксперимента наука делает скачок вперед. Настоящая наука полна противоречий, сомнений и споров о том, что уже известно. Настоящее научное знание постепенно занимает все более прочные позиции благодаря находкам и открытиям аналитического толка. Научное знание вырастает из массива данных, полученных в результате проведения огромного количества экспериментов в многочисленных лабораториях. И каждый из них — это лишь маленький кирпичик в огромном здании. И только когда наберется критическая масса экспериментов, мы сможем окинуть взглядом всю «постройку» и сделать твердые выводы.
Прежде чем ученые придут к соглашению в каком-то вопросе, нужно провести метаанализ, увязывающий воедино самые разные доказательства, выступающие в поддержку или против какой-то гипотезы.
Если идея сравнения метаанализа с одним-единственным экспериментом напоминает вам о селективности и проблемах, связанных с маленькими выборками, о которых говорилось в части 2, то это правильно. Один-единственный эксперимент, даже при наличии большого количества участников и наблюдателей, все равно может оказаться отклонением от нормы (вспомните историю про тест-драйв и 4,5 литра бензина на 129 километров — вам тогда просто повезло). Благодаря нескольким экспериментам, проведенным в разное время и в разных местах, вам будет проще представить, насколько значителен феномен. В следующий раз, читая о том, что использование крема способно подарить вам 20 лет молодости, или о новом растительном лекарственном средстве, применяемом в случае обычной простуды, вы должны поинтересоваться, а подтверждено ли это заявление результатами метаанализа или было проведено только одно исследование.
Дедукция и индукция
Научный прогресс зависит от двух типов обоснований. В дедукции мы идем от общего к частному и, если следовать правилам логики, можем быть уверены в наших заключениях. В случае с индукцией мы имеем дело с несколькими наблюдениями или фактами и пытаемся вывести основной принцип, который все сможет объяснить. Это рассуждение от частного к общему. Выводы индуктивного метода не всегда получаются точными — ведь в их основе лежат наши наблюдения и миропонимание, а это заведомо создает зазор между тем, что видим мы, и тем, что есть на самом деле.
Вероятность, как мы уже говорили в части 1, носит дедуктивный характер. Мы исходим из общей информации (например, «это симметричная, правильная монета») и движемся в сторону частностей (вероятность того, что решка выпадет три раза подряд). Статистика индуктивна. Мы исходим из нескольких разрозненных наблюдений (например, подбрасываем монетку три раза подряд) и движемся в сторону обобщений (например, является монета симметричной или нет). Или вот еще пример: мы используем вероятность (дедукцию), чтобы определить, каков шанс, что вам поможет конкретное лекарственное средство. Если бы ваша боль не прошла, мы бы с помощью статистики (индукции) могли определить, какова вероятность, что ваша таблетка — из партии дефектных товаров.
Индукция и дедукция не просто обращаются к численным вещам, как вероятность или статистика. Вот пример того, как дедуктивная логика срабатывает в словах. Если посылка (первая часть предложения) верна, то и заключение тоже должно быть верным:
Габриэль Гарсия Маркес — человек. Все люди смертны. Следовательно (и это дедуктивное заключение), Габриэль Гарсия Маркес смертен.
1. Некоторые автомобили — «Форды».
2. Все «Форды» — автомобили.
3. Парень, который сыграл Хана Соло{52}, — автомобиль!
Тип дедуктивного рассуждения о Маркесе называется силлогизмом. В силлогизмах именно форма рассуждения обеспечивает тот вывод, который последует. Вы можете построить силлогизм, используя имеющуюся у вас посылку, которая, как вам известно (или как вам кажется), неверна, но при этом не сводит на нет весь силлогизм, — иными словами, вся фраза остается логичной.
Луна сделана из зеленого сыра. Зеленый сыр стоит 22,99 доллара за полкило. Следовательно, Луна стоит 22,99 доллара за полкило.
А теперь разберемся: понятно, что Луна не сделана из зеленого сыра, но если бы она была из него сделана, то дедукция оказалась бы логически обоснована. Если вам станет легче, вы можете переписать силлогизм, чтобы все стало совершенно ясно:
Если Луна сделана из зеленого сыра и если зеленый сыр стоит 22,99 доллара за полкило, то Луна стоит 22,99 доллара за полкило.
Существует несколько различных типов дедуктивных рассуждений — их обычно изучают на уроках философии или математики, когда проходят формальную логику. Другая распространенная форма предполагает условные предложения. Они называются «правило вывода» (modus ponens). Этот термин легко запомнить благодаря такому примеру: (пусть По будет ponens):
Если бы Эдгар Аллан По пошел на вечеринку, он бы надел черный плащ. Эдгар Аллан По пошел на вечеринку. Следовательно, он надел черный плащ.
Требуется время, чтобы овладеть формальной логикой, потому что в случае с большим количеством рассуждений наша интуиция нас подводит. В логике, как и в случае с соревнованием по бегу, имеет значение последовательность. Как звучит приведенная ниже фраза? Это заключение имеет смысл или никуда не годится?
Если бы Эдгар Аллан По пошел на вечеринку, он бы надел черный плащ. Эдгар Аллан По надел черный плащ. Значит, он пошел на вечеринку.
И хотя то, что По пошел на вечеринку, может быть правдой, это не обязательно так. Он мог надеть плащ и по другой причине (например, было холодно, или был Хэллоуин, или он играл в спектакле и по роли должен был быть в плаще). Заключения, подобные тому, что мы видим в примере выше, содержат ошибку аргументации, которая называется ошибкой подтверждения следствием или ошибкой обратного утверждения.
Если вам сложно запомнить, как это называется, посмотрите на этот пример:
Если он вечером едет в Петербург, то утром возвращается. Он возвращается. Следовательно, он едет в Петербург.
Этот довод не очень-то убедителен, потому что в Петербург он ехал не вчера, а позавчера или вообще летел на самолете.
Как бы то ни было, вы можете сказать с абсолютной уверенностью, что если он едет не в Петербург, он не возвращается. Это называется контрапозицией первого утверждения.
Логические утверждения не работают по принципу знака «минус» в уравнениях — вы не можете просто сделать одну сторону отрицательной, вследствие чего и вторая автоматически станет отрицательной. Вы должны запомнить эти правила. Сделать это несколько проще с помощью квазиматематической системы обозначений. Утверждения, данные выше, можно представить следующим образом: А означает посылку, например «Если Луна сделана из зеленого сыра» или «Если команда Mets выиграет в этом году». B — это следствие, например «тогда Луна должна давать зеленый отсвет в ночном небе» или «я съем свою шляпу».
Используя эту распространенную систему обозначений, можно условиться так: «Если А» будет обозначать «Если высказывание А истинно». Мы будем говорить B или Не B, имея в виду «B истинно» или «B ложно». Тогда…
Если A, то B
A
Следовательно, B
В книгах по логике вы можете увидеть, что слово «то» часто заменяется стрелочкой (→), слово «не» — символом ~, а слово «следовательно» — знаком ∴, как, например:
Если A → B
A
∴ B
Но не дайте всем этим обозначениям сбить вас с толку. Видимо, просто кто-то хочет показаться затейливым.
Для утверждений, подобных этому, существует четыре разных варианта: высказывание А может быть истинным или ложным и высказывание B может быть истинным или ложным. И у каждого из вариантов есть свое название.
1. Правило вывода (modus ponens). Также называется гипотетическим силлогизмом.
Если A → B
A∴ B
Пример: Если та женщина — моя сестра, тогда она младше меня.
Эта женщина — моя сестра.
Следовательно, она младше меня.
2. Контрапозиция.
Если A → B
— B ∴ ~A
Пример: Если та женщина — моя сестра, то она младше меня.
Эта женщина не младше меня.
Следовательно, она мне не сестра.
3. Обратное утверждение.
Если A → B
B ∴ A
Это необоснованный вывод.
Пример: Если та женщина — моя сестра, то она младше меня.
Эта женщина младше меня.
Следовательно, она моя сестра.
Это утверждение неверно, потому что есть много женщин, которые младше меня и которые мне не сестры.
4. Противоположное утверждение.
Если A → B
— A ∴ ~B
Это необоснованная дедукция.
Пример: Если та женщина — моя сестра, то она младше меня.
Эта женщина не моя сестра.
Следовательно, она не младше меня.
Это утверждение неверно, потому что многие женщины, которые мне не сестры, все-таки младше меня.
Индуктивное рассуждение основывается на том, что есть доводы в пользу заключения, но они не гарантируют его истинности. В отличие от дедукции, индукция приводит к не вполне достоверным, но (если постараться) вероятным заключениям.
Пример индукции:
У всех млекопитающих, которых мы видели, есть почки.
Следовательно (вот это уже индуктивный шаг), если мы обнаружим новое млекопитающее, у него, вероятно, будут почки.
Наука движется вперед благодаря использованию как дедукции, так и индукции. Без индукции у нас не было бы ни одной гипотезы относительно того, как устроен мир. Мы постоянно используем ее в повседневной жизни.
Всякий раз, когда я нанимал Патрика заняться ремонтом и починить какие-то вещи в доме, он делал все очень небрежно.
Следовательно, если я найму Патрика для выполнения ремонтных работ в следующий раз, он опять сделает все спустя рукава.
Все пилоты, которые мне когда-либо встречались на пути, были очень организованными, добросовестными и осторожными.
Ли — пилот. У него есть эти качества, а также он хорошо знает математику.
Следовательно, все пилоты хорошо разбираются в математике.
Конечно, во втором приведенном мной примере вывод необоснован. Мы делаем предположение. При некоторых знаниях о мире, а также понимании, какие качества необходимы пилоту — умение прокладывать маршрут, оценить влияния скорости ветра на время прибытия и т. д., — все это кажется разумным. Ну а как насчет этого:
Все пилоты, которые мне когда-либо встречались на пути, были очень организованными, добросовестными и осторожными.
Ли — пилот. У него есть эти качества, а также он увлекается фотографией.
Следовательно, все пилоты увлекаются фотографией.
Теперь уже вывод кажется сомнительным. Наши знания о том, как устроен мир, подсказывают, что увлечение фотографией — личное предпочтение и отсюда не следует, что пилота этот вид деятельности будет интересовать больше или меньше, чем представителя любой другой профессии.
Плод писательского воображения, великий детектив Шерлок Холмс, делает свои выводы в ходе искусных рассуждений, и хотя он уверяет, что использует дедукцию, на самом деле это совсем другая форма логического хода мысли, которая называется абдукцией. Почти все заключения, сделанные Холмсом, — разумные предположения, основанные на фактах, но нельзя сказать, что они безупречны или неизбежны. В абдуктивном рассуждении мы начинаем с нескольких наблюдений, а затем выходим на теорию, которая все их объясняет. И из всего бесконечного множества самых разнообразных теорий, которые могли бы что-нибудь объяснить, мы выбираем ту, что наиболее вероятна.
Например, Холмс пришел к выводу, что предполагаемое самоубийство на самом деле было убийством:[151]
Холмс: Рана была на голове, с правой стороны. А Ван Кун был левшой. Пришлось изловчиться.
Инспектор Диммок: Левшой?
Холмс: О, я поражен, что вы этого не заметили. Все, что вам нужно сделать, — внимательно посмотреть по сторонам: кофейный столик расположен слева; ручка кофейной кружки направлена влево. Розетки: как видно, используются те, что слева… Ручка и блокнот лежат слева от телефона, потому что он брал трубку правой рукой, а записи делал левой… На доске для хлеба лежит нож, лезвие измазано маслом с правой стороны, потому что держал он его левой рукой. Очень маловероятно, что левша выстрелит себе в голову с правой стороны. Вывод: кто-то вломился в его дом и убил его…
Инспектор Диммок: Но пистолет… Почему?
Холмс: Он ждал убийцу. Он был предупрежден.
Обратите внимание, что Холмс использует словосочетание «очень маловероятно». Это говорит о том, что он не использует дедукцию. Но это и не индукция, потому что он не переходит от частного к общему — в некотором роде он переходит от одной детали (те наблюдения, которые делает Шерлок в квартире жертвы) к другой (делая вывод о том, что это все же убийство, а не суицид). Абдукция, мой дорогой Ватсон.
Аргументы
Когда в поддержку утверждения приводятся доводы, оно приобретает особый статус — то, что логики называют «аргументом». В данном контексте слово «аргумент» не означает «разногласие» или «спор»{53} — это формальная система логически выстроенных высказываний. У аргументов есть две стороны: довод и заключение. Довод может включать в себя одну или более посылок (утверждение без доводов, равно как и без заключения, — не аргумент в этом смысле слова).
Аргументы выстраиваются в систему. Мы часто начинаем с заключения — я знаю, это звучит странно, но так мы обычно и поступаем: делаем вывод и потом подбираем доводы.
Заключение: Жак жульничает во время игры в пул.
Довод (или посылка): Когда ты отвернулся, я видел, как он подвинул шар, прежде чем ударить по нему.
Дедуктивное рассуждение идет в противоположном направлении.
Посылка: Когда ты отвернулся, я видел, как он подвинул шар, прежде чем ударить по нему.
Заключение: Жак жульничает во время игры в пул.
Приблизительно так ученые и рассказывают о результатах эксперимента, это тоже выглядит как аргумент и снова состоит из двух частей.
Гипотеза = Г
Следствие = С
Г: Не существует черных лебедей.
С: Если Г — истина, то ни я, ни кто-либо еще никогда не увидит черного лебедя.
Но С не является истиной. Мой дядя Эрни видел черного лебедя и потом показал его мне.
Следовательно, гипотеза Г опровергнута.
Дедуктивный аргумент
Микробная теория болезней возникла благодаря применению дедукции[152]. Игнац Земмельвайс, венгерский врач немецкого происхождения, провел серию экспериментов (на 12 лет опередив Пастера с его исследованием микробов и бактерий) для определения причин высокого уровня смертности от родильной горячки в неспециализированной больнице Вены. Научные знания тогда еще были не на должной высоте, но его систематические наблюдения и действия не только помогли выявить причины горячки, но и способствовали продвижению научного знания. Его эксперименты представляют собой пример дедуктивной логики и научного рассуждения.
Тут нужно еще упомянуть о некоем условии контроля: в неспециализированной больнице Вены существовало два родильных отделения, располагавшихся рядом. В первом уровень смертности был очень высоким, а во втором — низким. И никому не удавалось понять, почему уровень материнской и младенческой смертности в одном отделении настолько превышает соответствующие показатели в другом.
Одно из объяснений, предложенных комиссией по расследованию, сводилось к тому, что само расположение первого отделения вызывало психологический дискомфорт: когда к умирающей женщине вызывали священника для отправления последнего обряда, ему нужно было проходить мимо родильного блока, расположенного в первом отделении. О его приходе возвещала сестра, звонившая в колокол. И комбинация этих действий, как считалось, сильно пугала рожениц, в результате чего они становились жертвами родильной горячки. Священнику не нужно было проходить мимо рожениц, когда он шел во второе отделение, потому что была возможность напрямик попасть в помещение, где содержались умирающие женщины.
Земмельвайс выдвинул гипотезу и сформулировал следствие, легшие в основу эксперимента:
Г: Присутствие колокола, в который бьют при появлении священника, повышает вероятность заражения.
С: Если не будет ни колокола, ни священника, не будет и увеличения случаев заражения.
Земмельвайс убедил священника ходить так, чтобы миновать рожениц из первого отделения, а также попросил сестру перестать звонить в колокол.
Уровень смертности не снизился.
С не является истиной.
Следовательно, Г — ложь.
Гипотеза не выдержала проверки.
Земмельвайс выдвигал и другие гипотезы. Оказалось, что дело было и не в количестве рожениц, потому что на самом деле во втором отделении их было больше. Причина была и не в температуре, поскольку она была одинаковой в обоих блоках. Как это часто бывает с научными открытиями, свою роль сыграл случай — он и стал ключом к пониманию ситуации. Один близкий друг Земмельвайса случайно порезался скальпелем студента, который только-только закончил вскрытие. Другу стало очень плохо, а последующее вскрытие проявило несколько схожих симптомов заражения, которые были найдены у женщин, умиравших при родах. Земмельвайс заинтересовался, нет ли связи между частицами химических веществ, найденных в трупах, и распространенностью заболевания. Еще одно различие между двумя отделениями, которое раньше казалось неважным, неожиданно стало определяющим: персонал в первом отделении состоял преимущественно из студентов-медиков, которые часто делали вскрытия или препарировали трупы, а потом бежали на вызов и принимали роды. Персонал второго отделения составляли акушерки, у которых не было других обязанностей. Врачи не имели обыкновения мыть руки, и поэтому Земмельвайс предположил следующее:
Г: Присутствие частичек трупных тканей на руках врачей увеличивает вероятность заражения.
С: Если нейтрализовать эти частички, инфекция не распространится.
Конечно, допустимы и другие, альтернативные следствия: если поменять местами работников двух отделений (акушерки перешли бы в первое отделение, а студенты-медики — во второе), уровень заражения снизится. Однако есть две причины, по которым подобные изменения были не таким эффективным решением проблемы, как мытье рук. Во-первых, если допустить, что гипотеза верна, уровень смертности в больнице остался бы тем же: все, что удалось бы сделать Земмельвайсу, — перенести заражение из одного отделения в другое. Во-вторых, даже если врачи не принимали роды, они все равно должны были работать в своих лабораториях в первом отделении, и потому они бы сильно задерживались, спеша к роженицам, что могло бы тоже спровоцировать определенный уровень смертности. Проблему можно было решить, только обязав врачей мыть руки.
Земмельвайс отважился на эксперимент и попросил врачей дезинфицировать руки раствором хлорной извести. Уровень смертности в первом отделении снизился с 18 % до 2 %.
Логические ошибки
Иллюзорная корреляция
Наш мозг — огромный детектор, распознающий разные закономерности; он пытается упорядочить и структурировать то, что порой кажется случайной конфигурацией. Мы видим созвездие Ориона в ночном небе не потому, что звезды так расположились, а потому, что наш мозг может наложить известный ему образ на всю эту звездную россыпь.
Вам звонит друг ровно в ту минуту, когда вы о нем думаете, — такого рода совпадение настолько удивительно, что мозг заостряет на нем внимание. Но ведь он так не поступает всякий раз, когда вы не думали о человеке, а он вам позвонил. Подумайте об этом на примере четырехчастной таблички из части 1. Предположим, у вас удивительно удачная неделя, наполненная совпадениями (вам перебежала дорогу черная кошка, когда вы проходили мимо свалки, вы поднялись на 13-й этаж здания и обнаружили, что по телевизору передают фильм «Пятница, 13-е»). Ну, скажем, на этой неделе вам позвонили 20 раз: два звонка были от тех, с кем вы давно не виделись, но кто позвонил вам спустя десять минут после того, как вы о них подумали. Это будет верхняя часть вашей таблички: 20 звонков, два из которых произошли в силу ваших экстрасенсорных способностей, а 18 были обычными. Но погодите-ка! Нам ведь еще нужно заполнить и нижнюю часть таблички: сколько раз вы думали о своих знакомых, а они не позвонили, или — и это мое любимое — сколько раз вы не думали о ком-то и он не позвонил?
Чтобы полностью заполнить таблицу, давайте допишем, что вы думаете о ком-то 52 раза в неделю, а 930 раз в неделю — не думаете[153]. (Последний показатель взят наобум, но если мы поделим неделю, в которой 168 часов, на десятиминутные фрагменты, то получим около 980 мыслей, и мы уже знаем, что 50 из них были о людях, которые вам не звонили, значит, 930 — о чем-то другом. Возможно, я вас недооцениваю — на самом деле вы можете взять любое число, просто поэкспериментируйте.)
Наш мозг действительно замечает только верхний левый квадрат и игнорирует три остальных в ущерб логическому мышлению (и в угоду экстрасенсорному). Прежде чем забронировать билет до Лас-Вегаса, где можно поиграть в рулетку, давайте пробежимся по цифрам. Какова вероятность, что кто-то позвонит при условии, что вы только что о нем подумали? Она составляет два из 52, или 4 %.
Да, верно, в 4 % случаев, когда вы думаете о человеке, он вам звонит. Не очень-то впечатляет.
Что же может объяснить такого рода совпадение? Физик рассмотрит тысячу событий в вашей четырехчастной табличке и заметит, что только два из них (0,2 одного процента) кажутся «странными», и потому вы вполне можете ожидать, что они произойдут случайно. Социальный психолог поинтересуется, не было ли какого-нибудь внешнего события, которое могло спровоцировать ваши со звонившим мысли друг о друге, предшествующие звонку. Вот пример: вы прочли о теракте 13 ноября 2015 года в Париже. На подсознательном уровне вы вспоминаете, что всегда думали со своей университетской подругой поехать в Париж. Она звонит вам — и вы так удивлены этим звонком, что совершенно забываете о связи теракта с вашими студенческими планами, — а дело в том, что она отреагировала на то же самое событие и потому взялась за телефонную трубку.
Если все это напоминает вам об истории с разлученными близнецами, о которой мы говорили ранее, то и правильно. Иллюзорная корреляция — стандартное объяснение, предлагаемое генетиками-бихевиористами для понимания странных совпадений в поведении (например, тот факт, что оба близнеца чешут голову одним и тем же пальцем или что оба обматывают карандаши и ручки изолентой, чтобы те не скользили). Нас всегда завораживают данные, находящиеся в левой верхней ячейке четырехчастной таблицы, — это все те вещи, которые объединяют близнецов. При этом мы совершенно игнорируем то, что один из них делает, а второй нет.
Фрейминг вероятностей
После того звонка от вашей давней подруги вы решаете поехать следующим летом на недельку в Париж. И, стоя перед «Моной Лизой», слышите знакомый голос, оглядываетесь и видите своего старого соседа по комнате Джастина, которого не видели много лет.
«Поверить не могу!» — восклицает Джастин. «Знаю!» — вторите ему вы. «Каковы шансы, что я наткнусь на тебя здесь, в Париже, стоя перед „Моной Лизой“! Да один на миллион!»
Да, шансы столкнуться с Джастином перед «Моной Лизой», вероятно, один на миллион (будет сложно подсчитать точно, но любой подсчет показал бы однозначно, насколько это маловероятно). Но такой способ фрейминга вероятности ошибочен. Давайте немного вернемся назад. А что, если бы вы столкнулись с Джастином, стоя не перед знаменитой картиной Леонардо да Винчи, а перед Венерой Милосской, в туалете или при входе в музей? А что, если бы вы столкнулись в вашем отеле, в каком-нибудь кафе или на Эйфелевой башне? Ведь вы были бы удивлены не меньше.
Поэтому забудьте о Джастине — если бы вы столкнулись со знакомым, будучи на каникулах, где-нибудь на улицах Парижа, вы были бы так же сильно удивлены. Впрочем, зачем привязываться именно к каникулам в Париже? Это могло случиться и во время командировки в Мадрид, пересадки в Кливленде или посещения спа-салона в Таксоне. Давайте зафреймим вероятность следующим образом: когда-нибудь, став взрослым, вы столкнетесь со своим знакомым в таком месте, где вы меньше всего этого ожидали. Ясно, что шансы на такую встречу довольно высоки. Но наш мозг не думает таким образом — когнитивистика как раз и учит нас тому, как важно тренировать мозги, чтобы мыслить разумно.
Фрейминг риска
С фреймингом вероятностей тесно связана одна проблема — невозможность логически зафреймить риски. Даже учитывая количество жертв во время крушения самолетов 11 сентября в Америке, путешествия на самолетах остаются самым безопасным способом передвижения. На втором месте идут путешествия на поезде.
Вероятность умереть во время перелета или поездки на поезде близка к нулю. Да, после трагических событий 9/11 многие американцы стали избегать самолетов, отдавая предпочтение автомагистралям. Но тут сильно увеличилось количество несчастных случаев на дорогах. Люди следовали скорее своей интуиции и эмоциям, нежели здравому смыслу, не обращая внимания на увеличившийся риск. Уровень автотранспортных аварий не сильно поднялся относительно изначального, но количество погибших в авариях на дорогах увеличилось, так как больше людей стали выбирать менее безопасный способ передвижения[154].
Вам может попасться такая статистика:
В 2014 году в результате крушения самолетов погибло больше людей, чем в 1960-м.
И вы сделаете вывод, что путешествия по воздуху стали менее безопасными[155]. Статистические данные верны, но тут дело в другом. Если вы пытаетесь понять, насколько безопасно путешествовать самолетами, общее число смертей в результате крушений ничего вам не даст. Нужно обратить внимание на уровень смертности — количество людей, погибших за определенное количество преодоленных миль, или за перелет, или что-нибудь, что приравнивается к исходному показателю. В 1960 году полетов было меньше, но они были, без сомнения, опаснее[156].
Следуя той же логике, вы можете сказать, что больше людей погибает на автострадах в период с пяти до семи вечера, нежели в промежутке между двумя и четырьмя утра, поэтому нужно избегать вождения с пяти до семи. Но факт остается фактом: гораздо больше людей садятся за руль между пятью и семью — вам нужно посмотреть на уровень смертности (за километр, за поездку или в одной машине), а не на голые цифры. В таком случае вы увидите, что водить машину по вечерам гораздо безопаснее (отчасти потому, что водители, управляющие автомобилем в промежуток с двух до четырех утра, чаще бывают пьяными или сонными).
После теракта в Париже 13 ноября 2015-го CNN сообщило, что по меньшей мере один из террористов прибыл в Европейский Союз как беженец. Активисты, выступающие против наплыва беженцев, призывали ужесточить приграничный контроль. Это вопрос социальный и политический, и в мои планы не входит подробно на нем останавливаться, но цифры могут дать нам кое-какую информацию для принятия решения. Абсолютное закрытие границы для мигрантов и беженцев могло предотвратить атаки, в результате которых погибли 130 человек. Запрет въезда в страну миллионам мигрантов, бегущих из регионов, разрываемых боевыми действиями, таких как Сирия и Афганистан, с большой долей вероятности мог стоить жизни тысячам людей — и это число было бы выше 130. Но у тех, кому чужда логика, заголовки типа «Один из террористов был беженцем» только вызывают неприязнь к иммигрантам. Люди совершенно не думают о том, сколько жизней было спасено благодаря политике иммиграции. Террористы добиваются только одного — чтобы вы поверили, будто находитесь в непосредственной опасности.
Те, кто работает в сфере продаж, говоря о рисках, часто жульничают, чтобы убедить клиентов купить продукт. Представьте, что вы получили письмо от компании, занимающейся безопасностью жилищ. В нем говорится: «90 % ограблений раскрываются с помощью видео, предоставленного владельцем дома». Звучит очень сухо. Очень по-научному.
Давайте начнем разбираться и проверим утверждение на правдоподобность. Забудьте пока про вторую часть предложения, про видео, и сконцентрируйтесь на первой: «90 % ограблений раскрываются…» Звучит ли это разумно? Если не знать настоящей статистики, а просто использовать свой жизненный опыт, кажется сомнительным, что 90 % ограблений удается раскрыть. Для любого полицейского участка это было бы показателем фантастической эффективности работы. Давайте обратимся к интернету. На страничке ФБР написано, что около 30 % ограблений раскрыты[157]. Таким образом, мы можем отбросить обсуждаемое утверждение как весьма маловероятное. Оно гласило, что 90 % домашних ограблений раскрывают с помощью видеозаписей, предоставленных владельцем дома. Но этого не может быть — это бы означало, что более 90 % ограблений частных домов раскрывают, потому что некоторые из них точно раскрывают и безо всяких видеозаписей. Тут, скорее всего, имеется в виду, что 90 % раскрытых дел были раскрыты благодаря видеоматериалам, предоставленным владельцем.
Но разве это не одно и то же?
Нет, потому что выборки были разными по сути. В первом случае мы рассматриваем все совершенные ограбления. Во втором же скорее смотрим на те случаи, которые были распутаны, а это гораздо более скромные цифры. Вот наглядное объяснение:
Все ограбления частных домов, совершенные в этом районе[158]
Раскрытые ограбления в этом районе (с использованием 30 % фигурок, задействованных ранее):
Означает ли это, что, будь у меня видеокамера, вероятность поимки преступника, ограбившего мой дом, будет равна 90 %?
Нет!
Вот все, что вам известно: если ограбление будет раскрыто, вероятность, что полиции в этом помогло домашнее видео, равна 90 %. Если вы полагаете, что у нас есть достаточно информации, чтобы ответить на интересующий вас вопрос (какова вероятность, что полиция сможет распутать дело об ограблении в моем доме, если я куплю сигнализацию, и какова, если не куплю), то вы ошибаетесь. Нам нужно будет начертить четырехчастную табличку, как в части 1. Проблема в том, что у нас есть данные только по одной из ячеек. Нам известно, какое процентное соотношение ограблений было раскрыто с помощью видеоматериалов. Но чтобы заполнить все ячейки таблицы, нам бы еще хорошо знать, сколько было ограблений, которые так и остались нераскрытыми, при том что в деле имелись видеоматериалы (или, иными словами, сколько домашних видеозаписей оказались бесполезными для раскрытия преступления).
Помните, P (раскрытое преступление | домашние видеоматериалы) ≠ P (домашние видеоматериалы | раскрытое преступление).
Основная цель жульнических утверждений в том, чтобы, играя на ваших эмоциях, заставить вас купить то, что вы не собирались покупать.
Стойкость убеждения
Особенность процесса познания такова, что стоит сформировать убеждение или принять какое-то утверждение, как нам становится очень сложно выбросить его из головы, даже несмотря на огромное количество контраргументов.
Скажем, исследователи говорят, что нужно придерживаться диеты с низким содержанием жиров и высоким — углеводов, и мы так и делаем.
Новые исследования, однако, подрывают — и довольно убедительно — веру в прежние научные находки, и мы начинаем сомневаться в своих привычках, касающихся питания. Почему? Потому что, получив новую информацию, мы выдумываем бесконечные истории, помогающие усвоить новые знания. «Если я буду есть жирную пищу, то стану толстым, — говорим мы себе. — Поэтому диета с низким содержанием жиров — то, что нужно». Мы читаем о мужчине, совершившем жестокое убийство. Мы видим в газете его фотографию, и нам кажется, что этот тяжелый взгляд исподлобья и квадратная челюсть принадлежат хладнокровному убийце. Мы убеждаем себя, что он «похож на киллера»: брови изогнуты, рот расслаблен, очевидно, ему незнакомо раскаяние. Когда же его отпускают на основании оправдательных доказательств, мы никак не можем избавиться от ощущения, что даже если он и не убивал этого человека, то наверняка совершил какое-нибудь другое преступление. Иначе бы он не выглядел таким виновным.
В одном известном психологическом эксперименте участникам показывали фотографии людей противоположного пола[159]. В это время испытуемые якобы были подключены к специальному оборудованию, на котором можно было посмотреть уровень их возбуждения. На самом деле подключены они не были — оно контролировалось ученым, проводившим исследование. Испытуемые получали ложную информацию, которая убеждала их, будто человек на конкретной фотографии привлекает их больше, нежели остальные. Когда эксперимент закончился, участники узнали, что «реакции» их тела на самом деле были заготовлены заранее и записаны на пленку. Утешительным призом стала возможность забрать понравившееся фото. По логике, участники эксперимента должны были выбрать фото человека, который им больше всего понравился на тот момент, — ведь доказательство того, что симпатию вызвало другое фото, было полностью дискредитировано. Но, как ни странно, они выбирали фото, понравившееся им вначале. Таким образом экспериментаторы доказали, что впечатление формировалось под влиянием самоубеждения. Что и требовалось доказать.
Аутизм и вакцинация: четыре ошибки при рассуждении
История об аутизме и вакцинации сопряжена с четырьмя возможными ошибками критического мышления: иллюзорной корреляцией, стойкостью убеждения, убеждением с помощью ассоциации и логической ошибкой, с которой мы уже встречались: после этого, следовательно, по причине этого.
В период между 1990-м и 2010-м число детей с расстройствами аутического спектра (РАС) увеличилось в шесть раз[160]. Распространенность аутизма имела экспоненциальный характер начиная с 1970-х годов и до наших дней.
Можно назвать три фактора, объясняющих этот феномен: повышенная информированность об аутизме (родители сегодня лучше осведомлены и чаще приводят детей к профессионалам для обследования; специалисты же, в свою очередь, гораздо охотнее берутся за диагностирование)[161]; расширенное определение, охватывающее больше случаев; а также тот факт, что больше людей рожают детей в позднем возрасте (это повышает вероятность выявления у ребенка аутизма и многих других расстройств).
Если поискать в интернете причины, по которым аутизм так быстро распространяется, то обнаружится, что виноваты продукты ГМО, рафинированный сахар, детская вакцинация, глифосат, вайфай и близость автострад[162]. Что же делать обеспокоенному жителю города? Будет здорово, если выступит эксперт. Вуаля — в игру вступает специалист Массачусетского технологического института! Доктор Стефани Сенефф{54} попала на первую полосу газет, заявив в 2015 году о связи между использованием глифосата{55}, активного ингредиента в гербициде «Раундап», и развитием аутизма. Действительно, мы наблюдаем одновременный рост двух показателей, как в случае с пиратами и глобальным потеплением, — между ними точно должна быть причинно-следственная связь, верно?
После этого, следовательно, по причине этого. Правильно?
Доктор Сенефф — специалист по информатике, у нее нет специального образования в области сельского хозяйства, генетики или эпидемиологии. Но она ученый, работающий в MIT, поэтому многие по ошибке считают, что ее знания выходят за рамки ее непосредственной сферы деятельности. Она выражает свое мнение наукообразным языком, придавая своим аргументам псевдонаучный лоск контрзнания[163]:
1) глифосат мешает шикиматному пути{56} биосинтеза у растений;
2) шикиматный путь биосинтеза позволяет растениям создавать аминокислоты;
3) когда шикиматный путь биосинтеза прерван, растение умирает.
Сенефф допускает, что у человеческих клеток нет шикиматного пути, тем не менее она продолжает:
4) в нашем организме содержатся миллионы бактерий («кишечная флора»);
5) у этих бактерий есть шикиматный путь;
6) когда глифосат попадает в организм человека, он негативно влияет на пищеварение и иммунную систему;
7) глифосат, находясь в организме человека, может угнетать функционирование печени.
Если вы недоумеваете, какое отношение все это имеет к РАС, то правильно делаете. Сенефф (не приводя никаких доказательств) описывает случай распространения проблем с пищеварением и иммунной системой, но они никак не связаны с РАС.
Другие исследователи проблемы аутизма, пытающиеся разобраться с причинами его возникновения, указывают на вакцину против кори, эпидемического паротита и коревой краснухи, а также на антисептический противогрибковый ингредиент тимерозаль, который она содержит. Он производится из ртути, а его количество, содержащееся в вакцине, обычно равно 1/40 от того количества, которое Всемирная организация здравоохранения (ВОЗ) считает допустимым в день. Обратите внимание, что ВОЗ говорит о количестве вещества, принимаемого в день, а при вакцинации вы получаете его единомоментно и один раз.
И хотя не было найдено никаких доказательств того, что тимерозаль каким-то образом связан с аутизмом[164], в 1992 году его удалили из состава вакцины в Дании и Швеции, а в 1999-м — в США, назвав это «мерой предосторожности». Уровень аутизма, однако, продолжил стремительно расти. Иллюзорная корреляция (как в случае с пиратами и глобальным потеплением) выглядит так: вакцинация от кори, свинки и краснухи обычно проводится у детей в возрасте от 12 до 15 месяцев, и если у ребенка аутизм, самое раннее, когда его можно диагностировать, — в возрасте от 18 до 24 месяцев. Родители обычно фокусировались на левой верхней части четырехчастной таблицы — количестве раз, когда ребенку делали прививку, а позже ставили диагноз «аутизм», — и не обращали никакого внимания на количество детей, которым не делали прививки, но у которых все равно диагностировали аутизм, или на миллионы детей, которым сделали прививку и у которых не нашли аутизма.
Что еще хуже, врач Эндрю Уэйкфилд, ныне дискредитированный, в 1998 году опубликовал научную статью, в которой упомянул эту связь. British Medical Journal заявил, что его работа была фальсификацией. А спустя шесть лет журнал Lancet, в котором она была опубликована изначально, отозвал статью. Медицинская лицензия доктора была также отозвана. Уэйкфилд работал хирургом, он не был специалистом в эпидемиологии, токсикологии, генетике, нейрологии или в какой-либо иной сфере медицинских знаний, которая бы позволяла считать его экспертом по аутизму.
Логика «после этого, значит, по причине этого» заставила поверить, что эта связь требовала установления причин. Из-за иллюзорной корреляции поверившие сфокусировались только на том, что у некоторых людей, кому диагностировали аутизм, были прививки. Показания информатика и врача убедили всех в этой ассоциативной связи. А стойкость убеждений, в свою очередь, только укрепила в этой мысли тех, кто изначально верил в связь событий, даже после того, как доказательство этой связи было опровергнуто.
Родители по-прежнему обвиняют в развитии аутизма вакцину, и поэтому многие перестали делать своим детям прививки. Это, в свою очередь, привело к вспышкам кори по всему миру. А виной всему — ложная мысль и неумение огромного количества людей видеть разницу между корреляцией и причинно-следственной связью, а также неспособность формировать убеждения исходя из убедительной научной доказательной базы.
Знание того, чего вы не знаете
Насколько мы знаем, есть известное известное, то есть вещи, о которых мы знаем, что мы их знаем[165]. Мы также знаем, что существует известное неизвестное: иными словами, есть вещи, которых мы не знаем. Но ведь существует и неизвестное неизвестное — вещи, о которых мы не знаем, что мы их не знаем.
Министр обороны США Дональд Рамсфелд
Это совершенно вымученная формулировка, и потому очень сложно уловить смысл сказанного. И совсем не нужно повторять столько раз одно и то же слово — министра было бы проще понять, если бы он сказал: «Есть вещи, которые мы знаем, вещи, которые мы точно не знаем, а также такие, о которых мы даже не догадываемся, но их не знаем». Есть, конечно, и четвертый вариант — вещи, о которых мы знаем, что не осознаем, что их знаем. Возможно, с вами такое случалось — кто-то задает вам вопрос, вы на него отвечаете, а потом думаете: «Интересно, а откуда я это знаю?»
Так или иначе, основная мысль ясна, я думаю? Что вам действительно может повредить, так это те вещи, про которые вы думаете, что знаете их, но на самом деле нет (вспомните цитату из Марка Твена / Джоша Биллингса в эпиграфе в начале книги), а также вещи, про которые вы не догадывались, но которые играют важную роль для принятия решения (неизвестное неизвестное). Формулирование хорошего научного вопроса требует понимания того, что мы знаем и что нам неизвестно. Хорошо сформулированная научная гипотеза опровергаема — мы можем предпринять какие-то действия, по крайней мере теоретически, чтобы проверить природу вещей и определить, верна ли наша гипотеза. На деле это означает, что мы должны вспомнить об альтернативных объяснениях, прежде чем проводить эксперимент, и спланировать его таким образом, чтобы все возможные альтернативы были исключены.
Если вы испытываете новое лекарство на двух группах людей, экспериментальные условия должны быть одинаковыми, чтобы по результатам принять решение: да, лекарство А лучше, чем лекарство Б. Если все участники эксперимента из группы А примут свое лекарство в комнате с окнами, из которых открывается красивый вид, а испытуемые из второй группы будут проходить эксперимент в вонючей подвальной лаборатории, то результаты окажутся обескураживающими и вы не сможете увидеть разницу в воздействии препарата — ведь к результатам будет примешано много других факторов. Вонючая подвальная лаборатория — это известное известное. То, что лекарство А лучше, чем лекарство Б, — это известное неизвестное (для этого мы и проводим эксперимент). Неизвестным неизвестным в этой ситуации будет какой-то другой потенциальный фактор, который может повлиять на чистоту эксперимента. Возможно, те, у кого повышенное давление, реагируют на лекарство А лучше в любом случае, а те, у кого оно низкое, лучше реагируют на лекарство Б. Как только вы выявите фактор, мешающий вам докопаться до истины, категория неизвестного неизвестного легко перейдет в категорию известного неизвестного. И тогда можно будет модифицировать эксперимент или провести дополнительное исследование.
Чтобы подготовить хороший эксперимент — или оценить тот, что уже был кем-то проведен, — нужно уметь находить альтернативные объяснения. Можно сказать, что открывать неизвестное неизвестное — основная задача ученого. Получая в результате эксперимента неожиданные данные, мы радуемся, потому что узнали то, чего не знали раньше. Иногда ученых, которые до последнего придерживаются своей теории, сравнивают с фильмами категории B{57}. Я таких не знаю. Настоящие ученые прекрасно понимают, что они узнают что-то новое, только когда результаты получаются не такими, каких они ожидали.
Итак, вот выводы.
1. Есть какие-то известные нам вещи, например расстояние от Земли до Солнца. Вы, возможно, не дадите правильный ответ на вопрос, каково оно, не подсмотрев в справочник, но вы точно понимаете, что ответ науке известен. Это «известное известное».
2. Есть вещи, которых мы не знаем, например как нейронная активность приводит к ощущению радости. И мы отдаем себе отчет в том, что нам неизвестен ответ на этот вопрос. Это «известное неизвестное».
3. Есть какие-то вещи, которые мы знаем, но мы не подозреваем, что их знаем, или забываем о том, что их знаем. Какова девичья фамилия вашей бабушки? Кто сидел рядом с вами в третьем классе? Если какие-то подсказки помогут вам вспомнить информацию, вы обнаружите, что знаете ее, хотя заранее и не подозревали об этом. И хотя Рамсфелд не говорит об этом феномене, дадим ему название — «неизвестное известное».
4. Есть какие-то вещи, которых мы не знаем, и нам даже неизвестно то, что мы их не знаем. Купив дом, вы наняли нескольких специалистов оценить состояние крыши, фундамента, посмотреть, нет ли нигде термитов или иных древоточцев. Если вы никогда не слышали о радоне, а вашего агента по недвижимости гораздо больше интересовала прибыль от сделки, нежели здоровье вашей семьи, то вам даже в голову не придет проверить, нет ли в доме утечки. Меж тем, во многих домах его уровень довольно высок, это известный канцероген. Такое положение дел можно назвать «неизвестное неизвестное» (хотя, прочитав этот абзац, вы поймете, что это уже не так). Обратите внимание, знаете вы о чем-то неизвестном или нет, зависит от вашей компетенции и опыта. Инспектор службы по борьбе с вредителями сообщит вам лишь о том, что видно невооруженным глазом, — ему известно, что в вашем доме могут скрываться повреждения (в тех местах, к которым он не сумел подобраться). Но природа и масштаб этой угрозы, если таковые имеются, ему неизвестны, однако он понимает, что она может быть («известное неизвестное»). Если вы слепо поверите его сообщению и решите, что проверка завершена, это будет означать, что вы не отдаете себе отчета, что в доме могут быть повреждения («неизвестное неизвестное»).
Мы можем наглядно представить четыре варианта, предложенные министром Рамсфелдом, в такой четырехчастной табличке[166]:
Мы знаем, что мы это знаем: | Мы знаем, что мы этого не знаем: |
ХОРОШО — ПОЛОЖИТЕ ЭТО В БАНК | НЕПЛОХО — МЫ МОЖЕМ УЗНАТЬ ОБ ЭТОМ |
Мы не знаем, что мы это знаем: | Мы не знаем, что этого не знаем: |
БОНУС | ОПАСНОСТЬ — ПОДВОДНЫЕ КАМНИ |
Самую большую опасность представляют ситуации, в которых есть неизвестное неизвестное. Наиболее страшные катастрофы, случившиеся по вине человека, можно отнести на счет таких вот случаев. Когда обваливаются мосты, страны проигрывают войны, люди лишаются права выкупить дом по закладной — все это зачастую случается потому, что кто-то не учел вероятности того, что не располагает всей информацией, и долгое время ошибочно полагал, будто просчитал все возможные случаи. Одна из основных целей обучения в докторантуре по специальности юриспруденция или медицина, MBA или военное руководство — научить определять то, что неизвестно, и по зрелом размышлении превращать неизвестное неизвестное в известное неизвестное.
Ну и еще одна группа, о которой министр Рамсфелд не сказал ни слова, — неверное известное, вещи, которые на самом деле не таковы, как мы о них думаем. В эту категорию относятся неверные по сути утверждения, в которые мы верим. И это одно из самых грустных и порой фатальных заблуждений.
Байесовский метод в науке и в суде
Вспомните часть 1 и описанную в ней идею байесовской вероятности, в которой вы можете поменять свою уверенность в чем-либо, основываясь на новых данных или же на априорной вероятности того, что что-то верно, — например, вероятности, что у вас пневмония при условии, что у вас наблюдаются определенные симптомы, или вероятности того, что какой-то человек будет голосовать за конкретную партию с учетом своего места жительства.
Пользуясь байесовским методом, мы назначаем гипотезе субъективную вероятность (априорную), а затем уточняем ее в свете собранных данных (апостериорная вероятность, потому что именно эти данные мы получаем, проведя эксперимент). Если бы у нас еще до проверки имелись основания верить, что гипотеза правильна, то нам было бы легко подтвердить ее при наличии небольшого количества доказательств. Если бы еще до проверки у нас были основания считать гипотезу маловероятной, то нам понадобилось бы больше доказательств.
Таким образом, согласно байесовской теории, маловероятные утверждения требуют большей доказательной базы, чем те, что заслуживают большего доверия. Предположим, ваша подруга говорит, что она видела, как что-то пролетело за окном. Вы можете выдвинуть три гипотезы с учетом ваших знаний об этом окне: это могли быть малиновка, воробей или свинья. И для всех этих гипотез вы можете назначить вероятности. И вот ваша подруга показывает вам фотографию свиньи, пролетающей за окном. Ваша априорная вероятность, что свиньи летают, была настолько мала, что и апостериорная вероятность оказалась не больше, даже при наличии доказательства. Возможно, сейчас вы уже выдвигаете новые гипотезы, что фотография была поддельной или что ваша подруга применила какой-то другой трюк. И если вся эта история напомнила вам четырехчастную табличку и вероятность, что у кого-то рак молочной железы при условии, что результаты тестов были положительными, то вы правильно мыслите — четырехчастные таблички прекрасно помогают проверить какие-то данные с помощью байесовского метода.
Ученым следует быть гораздо требовательней к тем доводам, которые идут вразрез со стандартными теориями или моделями, нежели к тем, что согласуются с ними. Зная, что при исследовании нового ретровирусного лекарства были проведены тысячи успешных экспериментов на мышах и обезьянах, мы не сильно удивляемся, когда обнаруживается, что оно хорошо воздействует и на человека, — мы охотно принимаем доказательство исходя из принятых стандартов. Нас может убедить одно-единственное исследование, в котором приняли участие лишь несколько сотен человек. Но если один человек скажет, что сидение в течение трех дней у изножья пирамиды вылечит СПИД — при правильном циркулировании энергии ци в чакрах, — тут нам нужно будет больше доказательств, потому что утверждение выглядит надуманным и ни о чем таком мы раньше не слышали. Мы бы захотели видеть результат, воспроизводимый много раз и в самых разных условиях, а еще лучше — метаанализ.
Байесовский подход — не единственный, с помощью которого ученые доходят до сути в случае с чем-то маловероятным. В поисках бозона Хиггса физики установили пороговую величину (используя традиционные, не байесовские, статистические тесты), которая была в 50 раз выше обычного, — не потому, что существование бозона было маловероятно (гипотезы о его существовании выдвигались десятилетиями), а потому, что цена ошибки была слишком высока (необходимо было провести очень дорогостоящие эксперименты).
Применение правила Байеса, возможно, лучше всего можно проиллюстрировать на примере из судебной практики. Один из краеугольных принципов судебного дела был сформулирован французским врачом и юристом Эдмоном Локаром{58}: любой контакт оставляет след[167]. По его мнению, правонарушитель либо оставляет следы на месте преступления, либо забирает их с собой — на себе, на одежде, — и тогда можно легко понять, где он был и что делал.
Предположим, злоумышленник пробрался в конюшню, чтобы дать допинг лошади накануне большой гонки[168]. Он наверняка оставит следы на месте преступления — отпечатки ботинок, возможно, частички кожи, волос, ниточки от одежды и пр. Иными словами, улики переходят с преступника на место преступления. А также он сам, скорее всего, запачкается, на его одежде останутся следы конских волос, ниточки от попоны, щепки или солома из стойла — то есть улики с места преступления перейдут на преступника.
А теперь представим себе, что кого-то арестовали на следующий день. Были взяты образцы ткани, отпечатки пальцев, грязь из-под ногтей — и в результате анализа обнаружились некоторые совпадения между этими образцами и теми, что были взяты с места преступления. Прокурор хочет определить, насколько весомы улики. Возможно, совпадение объясняется тем, что подозреваемый виновен. Или, если он не виновен, он мог находиться в контакте с преступником — подобное сотрудничество тоже не может остаться бесследным. Или, как вариант, подозреваемый находился на другой конюшне, совершенно невинно контактируя с другой лошадью, — а тесты показали сходство образцов.
С помощью байесовского метода мы можем сочетать объективные вероятности (такие как вероятность того, что ДНК подозреваемого совпадет с той, что была найдена на месте преступления) с личным субъективным мнением о надежности показаний свидетеля, а также честности и опыте криминалиста, хранившего образец ДНК. Совершал ли подозреваемый что-нибудь подобное раньше или он не знает ничего о забеге, не знаком ни с одним участником гонки и может предоставить убедительное алиби? Благодаря этим факторам мы можем говорить об априорной субъективной вероятности, что подозреваемый виновен.
Если взять буквальное значение слова «невиновный», принятое в американском законодательстве[169] (тот, чью вину не доказали), то априорная вероятность того, что подозреваемый виновен, будет равна нулю, а любая улика, не важно, насколько она изобличающая, не поднимет последующую вероятность выше нуля, потому что вы все время будете умножать на нуль. Выдвигая априорную гипотезу о невиновности подозреваемого, гораздо разумнее будет предположить, что любой человек из той же совокупности с равной вероятностью может оказаться виновным. Следовательно, если подозреваемый был задержан в городе с населением 100 тысяч человек, а у следователя есть причина верить, что преступник жил в этом городе, то априорная вероятность того, что подозреваемый виновен, будет один к 100 тысячам. Конечно, улики могут сузить совокупность — например, нам может быть известно, что не было следов взлома, следовательно, подозреваемый должен быть одним из 50 человек, имевших доступ к конюшне.
Наша априорная гипотеза состоит в том, что подозреваемый виновен с вероятностью 0,02 (один из 50 человек, имевших доступ). А теперь представим, что нашему злоумышленнику пришлось попотеть, чтобы справиться с лошадью, и на месте преступления остались следы крови. Как уверяют судебные эксперты, вероятность того, что образец крови подозреваемого совпадет с образцом, взятым на месте преступления, равна 0,85. Мы чертим четырехчастную табличку, как делали это раньше, и заполняем в первую очередь нижнюю строку под ней: один из 50 шансов за то, что подозреваемый виновен (виновен: столбец «да»), и 49 шансов из 50 за то, что невиновен. В лаборатории нам сообщили, что вероятность совпадения образов крови 0,85, — вписываем эти данные в верхнюю левую ячейку: вероятность того, что подозреваемый виновен и образцы совпадают. Это означает, что в нижнюю левую ячейку надо записать 0,15 (сумма вероятностей должна давать единицу). Совпадение образцов на 85 % означает, что с вероятностью 15 % кровь была оставлена кем-то еще, не нашим подозреваемым, — а значит, его можно оправдать. А еще есть 15 % вероятности, что следы крови оставил кто-то из оставшихся 49 человек, поэтому мы умножаем 49 на 0,15 и получаем 7,35 — вписываем это число в правую верхнюю ячейку. Мы вычитаем его из 49, чтобы найти значение, которое запишем внизу справа.
Теперь мы можем вычислить данные, которые должны будут оценить судья и присяжные.
P (Виновен | Совпадение) = 0,85 / 8,2 = 0,10
P (Невиновен | Совпадение) = 7,35 / 8,2 = 0,90
С учетом улик вероятность невиновности подозреваемого в девять раз выше, чем виновности. Начинали мы с 2 %-ной вероятности, что он виновен, новая информация увеличила эту вероятность в пять раз, но все же вероятность того, что он невиновен, больше. Давайте представим, что у нас появились дополнительные улики — конский волос, найденный на пальто подозреваемого, — а вероятность того, что это шерсть лошади, получившей допинг, равна 0,95 (шансы, что он принадлежит другой лошади, — пять из 100). Теперь мы можем увязать все байесовские вероятности друг с другом, заполнив новую табличку. В нижней строке вписываем те значения, которые только что получили путем математических подсчетов: 0,10 и 0,90 (статистики иногда шутят, что вчерашние апостериорные события — это сегодняшние априорные). Если вы скорее склонны интерпретировать эти цифры как «один шанс из десяти» и «девять шансов из десяти», смело вписывайте целые числа.
Мы знаем от наших судебных экспертов, что вероятность совпадения образцов волос равна 0,95. Умножив это на 1, мы получаем данные, которые вписываем в верхнюю левую ячейку, а вычитая результат из единицы, получаем значение для нижней левой ячейки. Если вероятность того, что образец совпадает с образцом лошади-жертвы, равна 0,95, то с вероятностью 0,05 образец совпадет с образцом другого животного (благодаря чему подозреваемый будет оправдан). Значит, в правую верхнюю ячейку мы вписываем 0,45 — результат умножения 0,05 на число внизу таблицы, то есть на девять. Теперь, закончив вычисления, мы видим следующее:
P (Виновен | Улика) = 0,68 | P (Улика | Виновен) = 0,95 |
P (Невиновен | Улика) = 0,32 | P (Улика | Невиновен) = 0,05 |
Новые улики показывают, что вероятность виновности подозреваемого в два раза выше, чем вероятность его невиновности. Многие прокуроры и судьи не знают, как работать с уликами, используя таблички, но вы видите, насколько это полезно. Ошибочное мнение, что P (Виновен | Улика) = P (Улика | Виновен), настолько распространено, что даже получило название «ошибка прокурора»[170].
Если вам так удобнее, правило Байеса можно использовать чисто математически, не прибегая к четырехчастной табличке. Как это сделать, описано в приложении.
Анализ конкретных случаев
Наука не дает нам уверенности, только вероятности. Мы не знаем на 100 %, появится ли солнце завтра на небосводе, примагнитится ли тот кусочек железа или есть ли что-нибудь быстрее скорости света. Мы думаем, что все это очень вероятно, но наука предлагает нам только лучшие байесовские заключения, с учетом того, что нам уже известно.
Байесовский вид рассуждений учит нас рассматривать вероятности в свете того, что мы знаем о современном мире. Тут важно научиться мыслить критически, как описано в этой книге. Это умение нужно тренировать и оттачивать. Тщательное изучение отдельных случаев — стандартный метод, потому что позволяет отточить полученные навыки по-новому — то, что теоретики обучения называют переносом. Это самый эффективный способ сохранения знания, который нам известен.
Бесчисленными путями ошибочные рассуждения и дезинформация проникают в нашу жизнь. Наш мозг не приспособлен к тому, чтобы противостоять им. Мы всегда придерживались научного подхода, старались, окинув мысленным взором данные, тщательно их осмыслить и уложить в систему. Конкретные практические ситуации предстают перед нами в виде историй, в основе которых лежат настоящие происшествия или их фрагменты, и, конечно, мы все очень любим рассказывать и слушать истории. Мы запоминаем истории и то, каким интересным образом они возвращают нас к фундаментальным идеям. Давайте вместе поразмышляем над конкретными примерами, приведенными ниже.
У чудо-пса по кличке Шедоу рак (или нет?)
Мы взяли нашу собаку Шедоу, помесь померанского шпица с шотландской овчаркой, из приюта, когда ему было два года. Мы дали ему такую кличку, потому что он изо дня в день ходил за нами тенью, из комнаты в комнату, всегда был поблизости{59}. Как это часто бывает с хозяевами домашних животных, наши ритмы синхронизировались — мы засыпали и просыпались в одно и то же время. Пес часто ездил с нами в командировки, побывал в других городах, приспособился путешествовать на самолетах, поездах и автомобилях.
Когда Шедоу исполнилось 13, у него начались проблемы с мочеиспусканием, и вот однажды мы обнаружили у него в моче кровь. Наш ветеринар провел УЗИ и нашел опухоль прямо на мочевом пузыре. И единственным способом точно определить, рак это или нет, было провести две операции, на которых настаивал онколог: цистоскопию, во время которой ему через уретру введут миниатюрную камеру в мочевой пузырь, и биопсию, чтобы взять анализы. Терапевт был против, потом что риски при общей анестезии в таком возрасте были слишком велики. Если бы оказалось, что это рак, онколог, скорее всего, провел бы операцию, а затем назначил бы курс химиотерапии. Не имея на руках никаких результатов анализов, доктора были уверены, что это рак мочевого пузыря, известный как промежуточно-клеточная карцинома (ПКК). В среднем собаки живут с таким диагнозом от силы полгода.
Мы с женой посмотрели Шедоу в глаза и ощутили абсолютную беспомощность. Мы не знали, больно ли ему, и если больно, то сколько еще боли он вынесет во время лечения или из-за самого заболевания. Забота о нем полностью легла на нас, поэтому решение далось нам непросто, мы были на взводе, но это не означает, что мы забыли о рациональности. Ведь можно думать критически, даже когда решение касается чего-то из области эмоций. Даже когда речь идет о вашей собаке.
Вот с чем обычно сталкиваются люди в ситуациях, когда речь идет об их питомцах: два доктора, два разных мнения, множество вопросов. Каковы риски во время операции? Каковы риски во время проведения биопсии? Сколько еще Шедоу будет жить, если операцию все же провести, а сколько — если не проводить?
Во время биопсии специалист с помощью тонкой иголки делает забор образцов ткани для анализа и отправляет их патологу. А тот уже взвешивает все шансы (патологи, как и большинство ученых, которых нам уже довелось встречать, работают не с несомненными фактами, а скорее с шансами, вероятностью того, что в образце могут быть раковые клетки, которая потом экстраполируется на вероятность, что и в непроанализированных тканях могут быть раковые клетки; если же вам нужна определенность, то не стоит ее ждать от патолога). Владельцы домашних животных никогда не интересуются возможными рисками во время биопсии. В медицине собрана специальная статистика для людей, и она известна, но в ветеринарии этот вопрос отражен гораздо хуже. По словам ветеринара, у нашей собаки могла бы возникнуть инфекция, угрожающая жизни (вероятность 5 %), а кроме того, какой-то злокачественный биоматериал (если у нашей собаки рак) мог бы попасть в брюшной отдел, когда иглу будут вытаскивать (вероятность 10 %), и спровоцировать дальнейшее распространение раковых клеток. Есть еще дополнительный риск — ведь после биопсии остается рубец, который только усложнит проведение операции. Анестезия, необходимая для этого, могла попросту убить Шедоу. Короче говоря, сама процедура диагностирования могла сильно навредить ему.
Наш ветеринар предложил шесть вариантов развития событий.
1. Провести биопсию через брюшную стенку в надежде, что таким образом мы получим более точный диагноз.
2. Установить диагностический катетер (который разбередит какое-то количество раковых клеток, они начнут отслаиваться, и таким образом их можно будет изучить).
3. Провести биопсию с помощью той же самой камеры для цитоскопии (введенной через уретру), которую он хотел использовать в любом случае, чтобы лучше увидеть, что там происходит.
4. Провести операцию прямо сейчас, чтобы увидеть все раковые клетки и удалить их, если это возможно. Однако самой большой опасностью было то, что в большинстве случаев рак мочевого пузыря снова наступал через год, потому что хирурги не в состоянии удалить абсолютно все раковые клетки, и те, что остаются в полости, начинают размножаться с огромной скоростью.
5. Ничего не делать.
6. Усыпить нашу собаку не мешкая, признав, что, скорее всего, у нее рак мочевого пузыря и ей в любом случае жить осталось недолго.
Мы спросили, каким будет лечение, если все же окажется, что у собаки рак, и что врачи будут делать, если это что-то другое. Очень часто пациенты концентрируются на предстоящей процедуре, совершенно не думая о последствиях. В случае рака мы опасались развития опухоли, способной заблокировать один из сосудов, по которому моча поступает в мочевой пузырь из почек и по которому она выходит из него. Из-за таких блокировок у нашего пса могли начаться жуткие боли и он мог бы умереть в течение одного дня. Помимо этого, в результате опухоли у него могли наступить временные блокировки. Из-за положения мочевого пузыря в организме, а также угла, под которым можно сделать исследование аппаратом УЗИ, было сложно сказать, насколько близко очаг находился к сосудам (мочеточнику и уретре).
Итак, у нас было шесть вариантов — какой же из них выбрать (если все же выбирать)? Мы остановились на двух: усыпить Шедоу или вообще ничего не делать. Вспомните, онколог настаивал на операции, потому что это золотой стандарт, протокол действий на такой случай. Мы попросили у врача какую-нибудь статистику, но она ответила, что нужно будет провести исследование. Позже она уточнила, что вероятность того, что все закончится плохо, то есть смертью Шедоу, равна 20 %. Поэтому мы исключили операцию — ведь мы даже не знали, есть ли у него рак.
Мы попросили статистику продолжительности жизни, если выберем оставшиеся сценарии. К сожалению, ветеринары не ведут подобного учета, ну а если и есть какие-то записи, то они, скорее всего, свидетельствуют о непродолжительной жизни, потому что многие владельцы домашних питомцев выступают за эвтаназию. Иными словами, многие выбирают усыпление, прежде чем болезнь начнет прогрессировать, — и тут многое определяет качество жизни самого животного либо его хозяина: собаки с диагнозом ПКК часто страдают недержанием мочи (мы уже заметили, что Шедоу оставляет нам по всему дому маленькие сюрпризы). У нас не было точного диагноза, но, основываясь на редкой статистике, которой мы располагали, было похоже, что нашему псу осталось три месяца, независимо от того, будет он проходить лечение или нет. Три месяца, если мы ничего не будем предпринимать, три месяца, если мы устроим ему курс химиотерапии, три месяца, если мы проведем операцию. Как такое возможно? Десять лет назад, сказал нам врач, ветеринары рекомендовали эвтаназию, как только у животного диагностировали ПКК, и едва собаки демонстрировали первые признаки хронического недержания, хозяева их тут же их усыпляли. Иными словами, владельцы сами обычно прерывали жизненный путь своих питомцев, прежде чем это сделает рак. И из-за этого статистика выглядела малоубедительной.
Мы сами постарались разобраться в ситуации, вбив в поисковую строку «промежуточно-клеточная карцинома» и «собака». Мы выяснили, что шансы Шедоу поправиться составляли 30 %, для этого нужно будет просто купить ему нестероидный противовоспалительный препарат. У него есть свои побочные эффекты, например расстройство желудка, рвота, потеря аппетита, а также проблемы с почками и печенью. Мы спросили, что наш ветеринар думает об этом, и она согласилась, что можно начать с этого препарата, независимо от того, что еще мы предпримем для лечения нашей собаки.
Мы нашли кое-какую статистику на сайте Университета Пердью (на их территории находится один из ведущих ветеринарных медицинских центров):
1) медиана продолжительности жизни животных после операции = 109 дней;
2) медиана продолжительности жизни после химиотерапии = 130 дней;
3) медиана продолжительности жизни после применения данного лекарства = 195 дней.
Хотя, конечно, продолжительность жизни во всех этих исследованиях сильно зависела от собаки и ее состояния. Некоторые из них умирали спустя всего несколько дней, в то время как другие жили более двух лет.
Мы решили, что наиболее разумно будет начать давать нашему питомцу упомянутый противовоспалительный препарат (потому что у него были не очень сильные побочные эффекты по сравнению с другими препаратами), провести цитоскопию (чтобы у доктора было более полное представление о состоянии внутренних органов Шедоу), а также сделать биопсию (чтобы нам было на что надеяться). Шедоу сделают легкую анестезию, вся процедура займет не так много времени — врачи были уверены, что он выдержит.
Спустя две недели мы получили результаты: цитоскопия показала, что очаг воспаления располагался очень близко к мочеточнику и мочеиспускательному каналу — так близко, что будь это рак, операция бы не помогла, потому что опухоль невозможно было бы удалить целиком. Патолог не мог сказать точно, была ли ткань раковой, потому что в результате он не смог взять пробу, достаточную для проведения анализа. В общем, у нас по-прежнему не было диагноза. Хотя согласно статистике, о которой я рассказывал ранее, благодаря приему препарата шансы Шедоу были равны 30 % — и это обеспечивало ему пока лучшую продолжительность жизни из возможных. И мы не стали подвергать его тяжелой операции или химиотерапии, а провели это время дома, все вместе.
Есть множество примеров, как с животными, так и с людьми, когда статистически лечение не продлевает жизнь. Прием статина, если вы не находитесь в группе высокого риска, или удаление простаты, если у вас не скоротечный рак простаты, — оба эти вида лечения имеют совершенно незначительное влияние на продолжительность жизни. Звучит парадоксально, но так оно и есть: не всякое лечение помогает. Понятно, что Шедоу было бы лучше без операции (и он избежал бы смерти под ножом хирурга, вероятность чего специалисты оценивали в 20 %), а в результате химиотерапии он бы не выиграл время, как показывает статистика.
Шедоу хорошо реагировал на препарат и уже через три дня пришел в себя — был полон энергии, счастлив и доволен. Еще через неделю мочеиспускание перестало доставлять ему сложности. Мы все чаще замечали, что в моче остается меньше и меньше крови, — как нам сказали, это было нормальным состоянием после биопсии. Спустя 161 день после первого подозрения на ПКК (которое так и не подтвердилось) у него начались проблемы с почками. Мы проверили Шедоу в специализированной онкологической клинике. Врачи не были уверены, была дисфункция почек связана с ПКК или нет, и не понимали, в чем ее причина. Они выписали какие-то препараты для улучшения общего состояния почек и провели множество тестов, но в результате так и не смогли приблизиться к разгадке. Шедоу становилось все хуже, он перестал есть. Мы поставили ему капельницу с обезболивающим, и спустя два дня, когда ее убрали, чтобы посмотреть, как он справляется, стало очевидно, что он мучается от боли. Мы поговорили с его лечащим врачом и с теми, кто наблюдал его ранее, описали ситуацию и его состояние. Все согласились, что пришло время отпустить бедолагу. Мы радовались компании Шедоу — а он нашей — на месяц дольше, чем в среднем это удается пациентам после химиотерапии. И в течение всего этого времени ему удавалось обходиться без больниц, катетеров, капельниц и скальпелей.
Мы отправились в онкологическую больницу — персонал нас хорошо знал, потому что мы навещали там Шедоу каждый день в перерывах между проведением анализов и процедур, — и договорились, чтобы его усыпили. Ему было очень больно, возможно, мы даже зря затянули все это на пару дней. Было ужасно видеть, как наш любимец умирает. Но нас утешала мысль, что мы смогли обеспечить ему должный уход на каждой ступени этого долгого пути и что его последние недели были настолько комфортны, насколько это только можно было устроить. Возможно, самые сильные эмоции, которые люди испытывают после того, как все заканчивается, — сожаление о принятых решениях. Мы смогли попрощаться с Шедоу, ни о чем не сожалея. Мы доверились своему критическому мышлению, сделав ставку на байесовское рассуждение, позволив логике направлять нас на этом пути.
Высаживались ли Нил Армстронг и Базз Олдрин на Луне?
Те, кто отрицает факт высадки человека на Луне, указывают на ряд неточностей и вопросов, так и оставшихся без ответа. «В силу расстояния между Землей и Луной задержка при прохождении сигнала должна была быть более двух секунд». «Фотографии неправдоподобно высокого качества». «Ни на одной из фотографий не видно звезд». «Откуда на фотографиях американского флага рябь, как будто он развевается на ветру, если на Луне нет атмосферы?» Вне конкуренции здесь заявление американского писателя Билла Кейсинга{60}, который утверждал, что вероятность успешного прилунения была равна 0,0017 % (обратите внимание на точность его расчетов!). Есть еще много таких заявлений. Отчасти именно из-за таких вот вопросов, на которые не были получены ответы и которые продолжают появляться (как кроты из нор в игре «Убей крота»), и развивается контрзнание. Если вы хотите убедить кого-то в том, что не является правдой, проще всего это сделать, забросав собеседников вопросами, и надеяться, что они будут достаточно впечатлены — и потрясены, — чтобы не подумать о поиске объяснений. Но, как известно любому исследователю, наличие даже тысячи неотвеченных вопросов не говорит о том, что этого не было. На сайтах, публикующих заявления, что высадки на Луне не было, невозможно найти никаких доказательств этому, впрочем, как и доказательств обратного.
Если говорить все же о высадке на Луне, то можно легко опровергнуть любое из этих (а также других) утверждений. В коммуникации между Землей и Луной действительно была двухсекундная задержка, о чем свидетельствует оригинальная запись, но в некоторых документальных фильмах и новостных сообщениях эта пауза была вырезана — и сделали это в целях повышения интереса к радиосообщению. Хорошее качество фотографий легко объяснить тем, что астронавты использовали камеру Hasselblad с 70-миллиметровой пленкой высокого разрешения[171]. На небе не заметно звезд, потому что большинство снимков, которые мы видели, были сделаны во время лунного дня (иначе бы нам не было видно астронавтов). На флаге нет никакой ряби: зная о том, что на Луне нет атмосферы, NASA подготовило флагшток в форме буквы Т, чтобы поддерживать верхний край, а «рябь» — это просто складки ткани. Если посмотреть на фотоснимки, создается ощущение, что рябь есть, но если взять кадры кинопленки, то видно, что флаг не развевается, он статичен.
А как быть с сообщением, что прилунение в принципе не имело никаких шансов на успех? Во-первых, тот, кто это сказал, не обладал никакой профессиональной подготовкой и не разбирался в инженерном деле. Это был журналист со степенью бакалавра по английскому, который, так случилось, работал в Rocketdyne{61}. Источником его знаний служили отчеты, опубликованные в 1950-е, когда космические технологии только-только зарождались. И хотя до сих пор есть много вопросов, остающихся без ответов (например, куда делись изначальные телеметрические записи), основная масса доказательств указывает на то, что высадка на Луне имела место. Это по-прежнему не точно, но все же очень и очень вероятно. И если вы хотите использовать расплывчатые вероятностные оценки, чтобы поставить под сомнение события прошлого, вам придется сначала признать, что и человечества на самом деле не существует: есть утверждение, что шансы зарождения жизни на Земле составляют много миллиардов к одному{62} [172]. Как и во многих случаях с контрзнанием, в этой фразе используют научный язык — говорят о вероятности, — но делают это таким образом, который только обесценивает этот прекрасный язык.
Статистка на сцене (и в прозрачном кубе)
Дэвид Блейн — известный иллюзионист. Он демонстрирует чудеса физической выносливости (по крайней мере один такой случай был занесен в Книгу рекордов Гиннесса). Возникает вопрос, который мог бы показаться интересным критически мыслящему человеку: а правда он демонстрировал чудеса физической выносливости или использовал какие-то хитрые трюки? Конечно, будучи умелым фокусником, он мог и схитрить.
В своем TED-выступлении{63}, набравшем 10 миллионов просмотров, Блейн заявил, что может удерживать дыхание под водой в течение 17 минут, и рассказал, как этому научился[173]. Другой волшебный случай связан с тем, как он провел неделю, сидя в глыбе льда. Еще одна история повествует о том, как он голодал в течение 44 дней, находясь в прозрачном кубе, а еще одна — как он был похоронен заживо и провел в гробу под землей неделю. Правда ли все это? Правдоподобны ли все эти заявления? Существуют ли какие-нибудь альтернативные объяснения?
В своих видео Блейн совершенно безыскусен: он говорит не очень быстро и не кажется краснобаем. Ему веришь, потому что он, бывает, сбивается, — поэтому довольно сложно себе представить, что он заранее продумал, что и как сформулировать. Но не забывайте: профессиональные иллюзионисты обычно очень тщательно подсчитывают и планируют все, что будут говорить. Каждый шаг, каждое почесывание репетируется и отрабатывается много раз. Иллюзия, которую они пытаются создать, — что магия происходит на наших глазах — удается, потому что они умеют мастерски отвлекать наше внимание и развенчивать наши представления о том, что спонтанно, а что срежиссировано.
Итак, как же нам применить критическое мышление, чтобы разгадать его фокусы?
Если вы размышляете о качестве источников, то вспомните о том, что он выступал на TED-конференции, где все выступления очень тщательно проверяются на предмет истинности фактов и курируются специалистами. Так ли это? На самом деле существует уже более 5 тысяч лекций и выступлений, вышедших под брендом TED, но только два бренда проверяются — TED и TED-GLOBAL[174]. Видео Блейна были сделаны в рамках TEDMED, во время одной из более 4998 конференций, устраиваемых энтузиастами и добровольцами, — они не курируются организацией TED. Это не означает, что с ними что-то не так, — просто в этом случае мы не можем полностью положиться на репутацию и авторитет TED и принять на веру то, что там говорят. Вспомните TMZ и сообщение о смерти Майкла Джексона — в каких-то случаях новости из подобных источников могут быть настоящими, не исключено, что даже во многих случаях, но вы не можете знать наверняка.
Прежде чем разбираться с задержкой дыхания под водой, давайте посмотрим на некоторые другие фокусы Блейна. Как-то на канале Fox прошло сообщение, что его трюк с глыбой льда был мистификацией[175]. Маленький люк, расположенный в полу той комнаты, где находился Блейн, вел в теплую, комфортную комнату, как сообщал Fox, а в это время в ледяной глыбе сидел его двойник. Но как же это могло сойти ему с рук? Многократная отработка трюка заставляет аудиторию поверить в то, что выходит за рамки повседневности. Ходили даже сплетни, будто трюк был наконец раскрыт. Во-первых, почему Блейн выступает в маске? (Разумно предположить, что это элемент шоу или что она помогает ему выглядеть более мужественно. Но настоящая причина может заключаться в том, что ему так проще обдурить вас и спрятать двойника.) Зачем во время фокуса его помощники с определенной периодичностью опрыскивают лед водой? (Блейн уверяет, что для того, чтобы лед не таял. Но, возможно, это для того, чтобы, завесив глыбу льда пеленой мелкодисперсной воды, он мог поменяться местами с двойником.) А как быть с устройствами, замеряющими физиологическое состояние Блейна, которые висят у него на поясе и сообщают нам частоту пульса и температуру тела, — это-то уж точно правда, как думаете? (А кто может доказать, что все эти аппараты действительно подсоединены к нему? Может, это не так и все они подключены к компьютеру.)
Если Блейн лгал насчет ледяной глыбы, утверждая, что это были чудеса физической выносливости, хотя на самом деле это был всего лишь фокус, то почему бы тогда не лгать и относительно других своих трюков? Выступая перед большой аудиторией, он уверял, что создаваемая им магия срабатывает всякий раз. Использовать иллюзии и фокусы гораздо безопаснее, нежели испытывать пределы выносливости. Но даже если для этого ему потребовался трюк, может, слишком сурово называть это обманом — это ведь часть шоу, правда? Никто, конечно, не верит, что фокусники взывают к невидимым силам. Мы знаем, что они репетируют как проклятые, а во время выступления отвлекают наше внимание. Но какая нам разница? Наиболее уважаемые фокусники, если их спросить, расскажут всю правду, признают, что показывают нам хорошо отрепетированные трюки, а не черную магию. Гленн Фолкенстейн{64}, например, демонстрировал чудеса телепатии — трюк, который долгое время считался одним из самых впечатляющих. Но в конце каждого своего шоу он непременно подчеркивал, что никаких мыслей на расстоянии он читать не умеет. Почему? Из этических соображений[176]. В мире полно людей, говорил он, которые верят в то, чего нет, и в то, что по сути своей просто нелепо. Миллионы людей, не отличающиеся смекалкой и не видящие причинно-следственных связей, впустую тратят свою энергию и время на экстрасенсов, астрологов, азартные игры и «альтернативную» терапию, эффективность которых так и не была доказана. Очень важно понимать, что стоит за всем эти развлечением, говорил он, чтобы не дать себя сбить с толку.
В другой раз Блейн уверял, что может воткнуть себе иголку в руку и вытащить с другой стороны. Был это фокус или он и правда мог так сделать? Конечно, на видео все выглядит убедительно, но ведь именно в этом и заключается иллюзия (поищите ролики на YouTube, и вы увидите, как это делается с помощью специального оборудования). А как же быть с 44-дневным голоданием в стеклянном кубе? В журнале New England Journal of Medicine даже выходила экспертная статья об этом, правда, как источник информации она оставляет желать лучшего[177]. Врачи, выступавшие авторами статьи, осматривали Блейна только после завершения периода голодания, не до него и не во время, поэтому они не могут предоставить независимое подтверждение того, что он действительно голодал. Поднимался ли этот вопрос когда-нибудь среди экспертов? Нынешний редактор журнала поискал в архивах материалы, но все записи об этом были уничтожены, так как статью опубликовали за десятилетие до моего запроса[178]. Основной автор статьи ответила, что если судить по гормонам, которые были найдены в крови Блейна после голодания, он действительно голодал, но также вполне вероятно, что он умудрялся получать еду[179]. Она не могла прокомментировать это и предложила мне почитать статью, написанную ее коллегой в другом экспертном журнале. Там говорится, что врач на самом деле отслеживал состояние Блейна во время голодовки (статью не удалось найти в базе PubMed или при запросе в Google Scholar, потому что Дэвид Блейн не упоминался в ней по имени)[180]. Для нас может представлять интерес вот какой пассаж, который появился в журнале Nutrition:
Перед началом голодовки ДБ демонстрировал мускулистое телосложение, о чем свидетельствуют индекс массы тела, данные, отражающие строение тела, и окружность мышц плеча, — все цифры приводятся ниже. Субботним вечером 6 сентября 2003 года ДБ вошел в прозрачный бокс из плексигласа, где должен был провести ближайшие 44 дня. Бокс, размеры которого составляли 2,1 × 2,1 × 0,9 м, был подвешен в воздухе, недалеко от Тауэрского моста в Лондоне. Одному из наблюдателей дали доступ к непрерывному детальному видео, отражающему все, что происходило в боксе (он мог следить за этим и дома, и на работе), и он мог оценивать как клиническое, так и физическое состояние ДБ. ДБ, которому было 30 лет, сидел до голодовки на диете, которая, как говорят (но эта информация не получила подтверждения), увеличила его вес на шесть-семь килограммов. Кроме того, за несколько дней до начала голодовки он принимал мультивитамины, которые прекратил принимать, войдя в бокс. По мере продолжения эксперимента он чувствовал себя все более слабым и апатичным. Начиная примерно со второй недели он стал ощущать головокружение и падать в обмороки, когда резко вставал, а иногда у него возникали и проблемы со зрением, он как бы «выключался». У него также появились временные острые стреляющие боли в конечностях и в теле, дискомфорт в брюшной полости, тошнота и какая-то нерегулярная пульсация… Спустя пять дней после того, как он вошел в бокс, у него началось легкое кровотечение из носа, которое позже повторилось. Больше не было никаких симптомов, говорящих о повторных кровотечениях. А также не было никаких признаков отечности ни до голодания, ни в конце. Не было и никаких признаков дефицита тиамина. По выходе из бокса ДБ, который поначалу выглядел весьма мускулистым молодым человеком, стал визуально более худым. Кровяное давление, которое ему измерили прямо перед началом эксперимента, было 140/90 мм рт. ст. в положении лежа и 130/80 мм рт. ст. в положении стоя, а по окончании голодовки оно было 109/74 мм рт. ст. в положении лежа (пульс 89 ударов/мин) и 109/65 мм рт. ст. в положении стоя (пульс 119 ударов/мин).
После прочтения этого отчета действительно возникает впечатление, что парень голодал. Скептически настроенный читатель может проигнорировать сообщения об испытываемой Блейном боли или тошноте, сочтя их элементами шоу, но подумайте: ведь сложно сымитировать нерегулярное сердцебиение и потерю веса.
Выступая на TED-конференци, Блейн фокусирует наше внимание уже на задержке дыхания, показанной в шоу Опры Уинфри. Он подкрепляет свой рассказ множеством научных и медицинских терминов и говорит, что это была демонстрация выносливости, которую подтвердили медицинские показатели, а не просто фокус. Блейн описывает исследование, которое он провел: «Я встретился с ведущим нейрохирургом и спросил его, как долго… как быстро задержка дыхания дольше, чем на шесть минут, может вызывать гипоксию и, как следствие, повреждение мозга…» Блейн упоминает жидкостное дыхание, гипоксическую тренировку, насыщение красных кровяных телец чистым O2. Благодаря всему этому он мог продержаться под водой 15 минут. Но он продолжает работать над режимом тренировок, чтобы постепенно дойти до 17 минут. Он бросается такими терминами, как «шунтирование» и «ишемия». Но действительно ли Блейн проделал все, о чем говорил? Были ли медицинские термины, которыми он так умело жонглировал, использованы со знанием дела? Или это была всего лишь псевдонаучная болтовня, которую он использовал, чтобы впечатлить нас, заставить думать, будто он действительно разбирается в этом?
Как всегда, мы начинаем с проверки истории на правдоподобие. Если вы когда-нибудь пробовали задерживать дыхание, то, наверное, смогли продержаться полминуты — может, минуту. Как показали исследования, профессиональные ныряльщики за жемчугом могут обходиться без кислорода в течение семи минут. Мировой рекорд, установленный еще до Блейна, был равен почти 17 минутам. Если вы углубитесь в изучение вопроса, то узнаете, что существует два вида соревнований по статическому апноэ: старая добрая задержка дыхания, что-то подобное тому, что вы со старшим братом делали летом в муниципальном бассейне, будучи детьми, и задержка дыхания с помощью каких-нибудь видов техники, когда участникам соревнований разрешается за полчаса до начала состязания подышать чистым, стопроцентным кислородом. Этот вариант звучит более правдоподобно, но как долго можно протянуть под водой в таком случае — действительно ли это помогает увеличить время с нескольких минут до 17? В таком случае нужно узнать, что говорят об этом ученые — пульмонологи (они все знают об объеме легких и дыхательном рефлексе) и неврологи (они знают, как долго мозг может обходиться без кислорода). Двое пульмонологов, с которыми я консультировался, рассказали о режиме тренировок, который выглядел очень похожим на то, о чем говорил Блейн в своем видео. И оба сочли возможным задержку дыхания в течение 17 минут при условии использования этого «трюка» или каких-либо иных техник. На самом деле рекорд Блейна был побит в 2012 году Стигом Северинсеном, сумевшим задержать дыхание на 20 минут и 10 секунд (конечно же, после того как он какое-то время дышал чистым кислородом) и побившим через месяц свой собственный рекорд, добившись задержки на 22 минуты[181]. Дэвид Эйдельман, магистр медицины, пульмонолог и декан медицинского факультета Университета Макгилла, сказал как-то: «Я согласен, все это выглядит так, что в это сложно поверить. Однако если регулярно голодать, использовать специальные йогические техники и предварительно подышать кислородом, все это вполне осуществимо. Поэтому, даже будучи в целом настроенным скептически, я не могу доказать, что это невозможно».
Чарльз Фуллер, доктор медицины, пульмонолог из Калифорнийского университета в Дейвисе, добавляет: «Существует достаточное количество доказательств того, что Блейн говорит правду, так как все, что он делает, физиологически исполнимо. Блейн — фокусник, и он мог прибегнуть к каким-то дополнительным трюкам, способствовавшим его успеху, но помимо этого существуют и чисто физиологические данные, что это все можно было проделать. Среди тех, кто умеет задерживать дыхание под водой, есть группа спортсменов, которые борются за установление рекорда, официально известного как „статическое апноэ после гипервентиляции легких“. Это соревнование спонсируется Книгой рекордов Гиннесса, поскольку спортивные дайверы считают все это жульничеством. Длительность задержки дыхания замеряется после гипервентиляции (выдувания углекислого газа) в течение 30 минут, пока ныряльщик дышит стопроцентно чистым кислородом. Обычно мероприятие проходит в теплом бассейне (это уменьшает метаболическую потребность в кислороде), голову ныряльщик держит совсем неглубоко под водой (еще больше снижая потребность в кислороде). Иными словами, он проделывает все те „фокусы“, которые увеличивают способность задерживать дыхание, оставаясь в сознании. Что особенно важно, до Блейна рекорд был менее 17 минут (и был он поставлен атлетом, а не фокусником). На сегодняшний день, однако, существуют люди, способные продержаться под водой и больше 20 минут. А это достаточное доказательство того, что подобное возможно».
Пока что история Блейна кажется правдоподобной, а его выступление на платформе TED — весьма убедительным. Но постойте, а как же быть с повреждениями мозга? Блейн сам говорил об этом как о потенциальной проблеме. Вы, без сомнения, знаете, что если головной мозг остается без кислорода даже в течение трех минут, могут наступить необратимые последствия вплоть до его гибели. А как же тогда предотвратить смерть мозга, если не дышать в течение 17 минут? Хороший вопрос, как раз для невролога.
Скотт Графтон, доктор медицины: «Кислород не задерживается в крови надолго. Он очень быстро из нее исчезает — ему нужно быть связанным с чем-нибудь. Представьте себе воду и масло. Кровь переносит эритроциты, каждый из которых наполнен молекулами гемоглобина (Hb). Всякий раз, когда эритроцит проходит через легкие, количество молекул гемоглобина, соединенных с кислородом, увеличивается. Чем выше концентрация кислорода в воздухе, тем больше молекул гемоглобина свяжется с ним. Порадуйте свои легкие! Подышите чистым, стопроцентным кислородом в течение 30 минут, чтобы максимально насытить ткани.
Всякий раз, когда эритроциты проходят через мозг, кислород высвобождается из молекулы и распространяется по мембранам клетки, чтобы войти в ткань головного мозга, где связывается с другими молекулами, которые используют его при окислительном метаболизме. Вероятность того, что данная молекула кислорода высвободится из гемоглобина и растворится, — это функция относительной разности концентрации кислорода по разные стороны мембраны».
Иными словами, чем больше кислорода требуется мозгу, тем скорее он начнет брать его из гемоглобина. Вдыхая чистый кислород в течение 30 минут, участник соревнования по задержке дыхания увеличивает количество кислорода в мозге и в крови. А во время соревнования, когда уровень кислорода в мозге будет постепенно снижаться, можно будет расходовать тот кислород, который еще останется в гемоглобине, и подпитывать мозг.
Графтон продолжает: «Не все молекулы гемоглобина насыщаются кислородом, проходя через легкие, и не все из них отдают его, проходя через органы. Необходимо несколько таких циклов, чтобы отдать весь кислород. Когда мы говорим, что смерть мозга наступает из-за нехватки кислорода, то речь идет о недостаточной циркуляции (сердечный приступ), когда сердце перестает доставлять кровь к мозгу. Стоит остановить этот насос, и не будет никаких красных кровяных клеток, приносящих кислород, — в результате мозговая ткань погибнет очень быстро. В организме человека, находящегося под водой, идет гонка: что произойдет первым — повреждение мозга или недостаточность нагнетательной функции сердца?
Ключевой момент: мышцы должны находиться в покое. В них содержится миоглобин, который держится за кислород в четыре раза сильнее, нежели гемоглобин в красных кровяных клетках. Напряжение мышц усиливает потерю кислорода в целом. Поэтому сохраняйте спокойствие». Именно о статике говорил доктор Фуллер, комментируя статичное апноэ.
Так что с медицинской точки зрения заявления Дэвида Блейна вполне правдоподобны. На этом можно было бы и закончить эту историю, но есть еще кое-что. В одной статье в Dallas Observer было написано, что задержка дыхания была трюком и что Блейн — иллюзионист высокого уровня — использовал хорошо спрятанную трубочку для дыхания[182]. Об этом не было никаких сообщений в других ведущих СМИ, что, конечно, не означает, что Observer ошибся, — но почему соответствующее сообщение появилось только в этом издании? Может, потому, что история мага, показывающего фокус, но при этом заявляющего, что все правда, — не такой уж значительный новостной повод?
Репортер Джон Тирни поехал на остров Большой Кайман, чтобы написать статью для New York Times о подготовке Блейна к задержке дыхания[183], а затем, спустя неделю, написал в своем блоге о появлении иллюзиониста в шоу Опры Уинфри[184]. Тирни много говорит о частоте пульса Блейна, который отображался на мониторе рядом с резервуаром на шоу Уинфри. Но, как и в случае с фокусом в ледяной глыбе, нет никаких доказательств, что монитор был на самом деле связан с Блейном. Возможно, все это было скорее сыграно на публику — чтобы люди думали, будто Блейн выполнял трюк в действительно суровых условиях (стандартная практика иллюзионистов и фокусников). Ни Тирни, ни врач, следивший за тренировкой, не сказали, насколько близко они наблюдали Блейна на Кайманах, — возможно, они просто поверили на слово, что тот не использовал никаких приспособлений. Может, настоящей целью тренировки Блейна было посмотреть, сможет ли он обмануть их, наблюдателей, — ведь в таком случае он сможет обмануть и телеаудиторию. Тирни пишет: «Я находился в бассейне вместе с несколькими дайверами, экспертами по статическому апноэ (задержке дыхания при полной неподвижности)[185]. Доктор Ральф Поткин, пульмонолог, изучающий задержку дыхания, лечащий врач команды фридайверов США, сам подключил электроды к телу Блейна и снимал показания сердца, крови и дыхания, пока Блейн находился под водой в течение 16 минут».
«Я всегда относился скептически ко всякого рода жульничеству, — продолжает Тирни. — Какое-то время назад я делал большой материал о Джеймсе Рэнди и находился рядом с ним в Детройте, когда он разоблачал евангелического проповедника по имени Питер Попофф. Но у меня не было никаких причин сомневаться в искусности Блейна. Он задерживал дыхание прямо передо мной, в прозрачной воде, в самом обычном бассейне при нашем отеле, с той его стороны, где неглубоко, в окружении экспертов по задержке дыхания, стоящих всего в нескольких футах и не сводящих с него глаз. Его нос и рот совершенно явно находились под водой — но всего на несколько дюймов, и их было хорошо видно. Скажите мне, как он умудрился протащить под воду трубочку для дыхания, да еще так, чтобы никто не заметил ни ее, ни пузырьков воздуха. Обычно фокусники отвлекают зрителей пустой болтовней и ненужными жестами — но вся суть статического апноэ в том, чтобы оставаться абсолютно неподвижным, сохраняя кислород, что и делал Дэвид. (Удивительно, как сильно это помогает: тренеры, работавшие с Дэвидом, провели короткую подготовительную сессию и со мной, и с моим фотографом. И хотя мы заранее подышали воздухом, а не кислородом, мы все равно были удивлены, как долго можно продержаться: меня хватило на 3 минуты 41 секунду, а моего фотографа и еще дольше.)».
И вот теперь газета Dallas Observer заявляет, что это было сфабриковано, а репортер New York Times, похоже, верит, что нет. А что думают профессиональные фокусники? Я поговорил с четырьмя. Один из них сказал: «Наверняка это какой-то трюк. Про многие из представлений Блейна — во всяком случае, нам, иллюзионистам, — известно, что он использует разные хитрости специально на камеру, а также очень сложный монтаж. Было бы проще, если бы он воспользовался трубочкой для дыхания и выдыхал углекислый газ, пуская в воде пузыри. А если попрактиковаться, ему бы не пришлось делать это все время — он мог бы по-настоящему задерживать дыхание на минуту-другую в промежутке между вдохами через трубочку. А еще ведь можно использовать и другой трюк с камерой: благодаря другому ракурсу или зеленому стеклу представить все так, как будто он в воде, хотя на самом деле нет».
Второй фокусник, который работал с Блейном десятилетие назад, добавил: «Его героем всегда был Гудини, который прославился своими удивительными трюками. Отчасти свою репутацию Гудини заработал демонстрацией того, что фокусники делали в 1920-х: сидение на шесте и т. д. Для выполнения некоторых фокусов и правда нужна выносливость, в других же можно немного схитрить. Некоторые для выполнения не так уж и сложны, как может показаться, но большинство людей никогда не решатся их повторить. Я не знаю, зачем Блейну ловчить в трюке с глыбой льда, — он ведь довольно прост в силу эффекта иглу{65}: внутри ведь на самом деле не так уж и холодно. Но выглядит все это впечатляюще. Если бы Дэвид проделал то же самое, находясь в холодильнике, было бы другое дело. Но задержать дыхание на 17 минут? Конечно, можно впрок насытить кровь кислородом, и это сильно поможет. Я знаю, что он действительно готовится к своим трюкам и много тренируется. Он делает нечто по-настоящему выдающееся. Но я уверен, что трюк с задержкой дыхания отчасти поддельный. Он, я думаю, и правда задерживает дыхание, но не на протяжении всего времени. Ведь это легко можно подделать. Наверняка у него есть трубочка для дыхания или другое приспособление.
Обратите внимание, что многие его трюки показываются по телевидению и какие-то ключевые моменты монтируются. Мы допускаем, что все происходит по-настоящему, мы все это видим, потому что именно так наш мозг и конструирует реальность. Но, будучи иллюзионистом, я замечаю монтаж. Интересно, что же остается на отснятой пленке, которую вырезали?»
Третий фокусник сказал: «Зачем тогда так усердно тренироваться, если иллюзионист может просто воспользоваться специальным оборудованием? В его силах отточить необходимые навыки и с помощью оборудования показывать какой-то трюк снова и снова. А уже в конце просто притворяться, как будто он обессилен, испытывает боль и головокружение, как будто правда подверг тело серьезной проверке и вышел за все мыслимые и немыслимые пределы. Осознавая, что цель — развлекать публику, иллюзионист не стал бы оставлять ничего на волю случая. Слишком многое стоит на кону».
Тот факт, что никто никогда не видел, как Дэвид использует трубку для дыхания, не означает, что он этого не делал, потому что именно в этом и состоит работа иллюзиониста — играть с тем, что вы видите, и с тем, что, как вам кажется, вы видите. А любая иллюзия становится только сильнее, когда происходит именно с вами. Со мной был случай: фокусник Гленн Фолкенстейн зачитывал вслух серийные номера купюр, лежащих в моем кошельке, в то время как сам находился в другом конце комнаты с повязкой на глазах. В другой раз фокусник Том Никсон вложил мне в руку бубновую семерку, которая спустя несколько минут стала совсем другой картой, — при том что я даже не заметил, чтобы он как-то трогал меня или карту. Я знаю, что в какой-то момент он заменил карту, но даже после того, как он проделал со мной тот же самый трюк пять раз и я еще несколько раз видел, как он показывал его другим, я до сих пор не понимаю, когда именно он делает замену. Это часть волшебного гения, равно как и часть развлекательной программы. Я ни на минуту не поверю, что у Фолкенстейна или Никсона есть какие-то оккультные способности. Я отдаю себе отчет в том, что это развлечение, и именно так они это и преподносят.
Четвертый фокусник, с которым я разговаривал, Джеймс Рэнди, профессиональный скептик, которого я уже упоминал, объясняет мнимые экстрасенсорные способности использованием иллюзий и фокусов. Вот что он мне написал в электронном письме в ответ на мой вопрос:
Я помню, что, когда Дэвид Блейн впервые выступил на телевидении и показал свои фокусы, я сам связался с ним и совершенно по-дружески предупредил, что как профессиональный фокусник считаю, что он сильно рисковал и мог получить физические увечья. Мы обменялись парой-тройкой милых писем на эту тему. Но вдруг однажды меня резко проинформировали, что его новый отдел управления сменил адрес и что ему дали четкое указание больше со мной не общаться. Конечно, мне ничего не оставалось, кроме как принять это его решение, втайне надеясь, что мистер Блейн учтет мои замечания, ведь они были сделаны от чистого сердца.
С тех пор я ни разу не общался с Дэвидом Блейном. Меня встревожили неблагоразумные заявления, которые он делал во время выступления на TED- конференции, но вместе с тем я уважал этот казавшийся мне неверным тон, который его агенты выбрали для его высказываний. Я с уважением отнесся к его выбору.
Дэвид позволил своим агентам вмешаться в нашу переписку и прекратить общение со мной. Возможно, это было сделано потому, что я попытаться заставить его оставаться честным. Но, как оказалось, мне это было не под силу.
Как показала проверка фактов, задержка дыхания на 17 минут вполне возможна. Это не означает, однако, что во время исполнения трюка Блейн не использовал никакой специальной трубочки для дыхания. Верить в его сверхспособности или нет — дело ваше, пусть каждый сам принимает решение. Как и в случае с любым иллюзионистом, мы не можем знать наверняка, что правда, а что нет, — но это и есть тот неоднозначный мир, который пытаются создать фокусники. Когда же речь заходит о критическом мышлении, обычно ищут наиболее простые объяснения, однако в некоторых случаях, как, например, здесь, очень сложно, а то и вовсе невозможно выбрать между вероятными объяснениями или понять, какое из них проще. Да и важно ли это вообще? Вообще-то да. Как сказал Фолкенстейн, людей, не отличающихся пониманием причинно-следственных связей или недостаточно хорошо разбирающихся в случайных ситуациях, легко ввести в заблуждение подобными заявлениями. Я уже не говорю о многочисленных добровольцах, которые могут захотеть проделать все эти трюки, несмотря на постоянные предупреждения «Не пытайтесь повторить в домашних условиях». Те, у кого нет специального образования, легче всего попадаются в такие ловушки. Одно дело выполнять подобные вещи по-настоящему, после долгой тренировки, а другое — стараться впечатлить кого-то зрелищным трюком. Этим-то и отличаются те, кого можно обвести вокруг пальца, от тех, кого нельзя.
Статистика во Вселенной
Когда вы слышите такие слова, как «водород», «кислород», «бор», «олово» или «золото», о чем вы сразу думаете? Все это химические элементы периодической системы, которые обычно проходят в средней школе. Элементами их назвали ученые, потому что верили, что это фундаментальные невидимые частички материи (от латинского слова elementum — «материя в своей наиболее базовой форме»). Дмитрий Иванович Менделеев обратил внимание на закономерности в свойствах элементов и собрал их в таблицу. В ходе работы он выявил в таблице пробелы, где должны были располагаться элементы, о которых науке еще не было известно. Все элементы от первого до 118-го были либо открыты в природе, либо синтезированы в лабораторных условиях, — теория, лежавшая в основе принципа организации таблицы, нашла подтверждение[186].
Позже ученые открыли, что химические элементы не были на самом деле неделимы — они состояли из того, что получило название атомов (от греческого слова atomos, «неделимый»). Но и насчет их неделимости ученые ошиблись — как выяснилось позже, атомы состояли из субатомных частиц: протонов, нейтронов и электронов. Их тоже поначалу считали неделимыми, но потом — как вы уже догадываетесь — обнаружилось, что это неверно. В 1950–1960-х была создана Стандартная модель физики элементарных частиц и выстроена теория, что электроны неделимы, а протоны и нейтроны состоят из более мелких субатомных частиц. Открытие кварков в 1970-х годах только подтвердило эту теорию. Если усложнять терминологию и дальше, скажу, что протоны, нейтроны и электроны — это фермионы, а фотоны — бозоны. Все это разнообразие категорий необходимо, потому что разные частицы подчиняются разным законам. Фермионы и бозоны получили название элементарных частиц, потому что считается, что они действительно неделимы (но время покажет).
Согласно Стандартной модели, существует 17 разных типов элементарных частиц: 12 видов фермионов и пять видов бозонов. Бозон Хиггса, получивший широкое освещение в прессе в 2012 и 2013 годах, оставался последним фрагментом Стандартной модели, существование которого не было доказано, — все остальные 16 уже были обнаружены. Если он существует, ученые смогут объяснить, как материя получает массу, и заполнят пробел в теории, которую использовали для объяснения природы Вселенной, — пробел, существующий уже более 50 лет.
Как узнать, нашли ли мы его? Когда частицы сталкиваются на большой… Ладно, забудьте об этом. Пусть лучше физик все объяснит. Вот что профессор Харрисон Проспер говорит об этом графике и о небольшой выпуклости на нем, отмеченной стрелочкой в районе 125 гигаэлектронвольт (ГэВ) на горизонтальной оси[187]:
* Стандартное отклонение, характеризует точность результатов.
** CMS (compact muon solenoid) — один из реакторов в Большом адронном коллайдере.
На графике виден «спектр, возникающий из-за столкновения протона с протоном, в результате чего появляется пара фотонов (гаммы, как их называют на языке высоких энергий), — говорит Проспер. — Согласно Стандартной модели, бозон Хиггса должен начать распадаться на пару фотонов (бозон Хиггса, как было предсказано, распадается и по-другому, например на несколько Z-бозонов). Выпуклость на графике в районе 125 ГэВ доказывает существование частицы определенной массы, которая распадается на пару фотонов. Как нам удалось выяснить, это должен быть бозон Хиггса».
Не все физики находят эксперименты убедительными. Луи Лайонс объясняет: «Бозон Хиггса <…> может распадаться на разные наборы частиц, и эти данные определяются С. М. (Стандартной моделью)[188]. Мы делаем замеры, но нам не хватает уверенности при том количестве информации, которой мы располагаем на сегодняшний день. Показатели совпадают с теми, что предсказывает С. М., но выглядели бы более убедительными, если бы у нас было больше данных. Отсюда и осторожность, с которой мы говорим, что открыли бозон Хиггса, предсказанный С. М.».
Иными словами, проводить эксперименты так дорого и так сложно, что физикам хочется избежать ложной тревоги — они уже ошибались раньше. Хотя в 2012 году ЦЕРН объявил, что они его нашли, многие физики сочли, что объем данных был слишком мал[189]. В этой ситуации так много поставлено на карту, что физики установили сами для себя очень строгий критерий доказанности. Но зачем такие жесткие требования к доказательствам? Проспер объясняет: «Учитывая тот факт, что на поиски бозона Хиггса ушло 45 лет, потребовались десятки тысяч ученых и инженеров, были потрачены миллиарды долларов (и это не говоря уже о случившихся за это время многочисленных разводах, огромном недосыпе и десятках тысяч невкусных обедов на борту самолетов), мы хотим быть уверенными, что, сделав все, что в человеческих силах, мы нашли ответ»[190].
Физик Мадс Тудал Франдсен добавляет: «Данные ЦЕРН обычно приводят в качестве доказательства того, что обнаруженная частица — бозон Хиггса. Он, конечно, может объяснить данные, но ведь есть и другие объяснения: мы бы могли получить те же сведения, изучая другие частицы. Та информация, которой мы располагаем сейчас, недостаточно точна, чтобы определить, что же такое данная частица. Ведь это может быть и скопление других, известных частиц»[191]. Вспомните ту часть книги, где говорится об альтернативных объяснениях. Физики начеку.
Если график свидетельствует о существовании частицы другого рода, чего-то, что не является бозоном Хиггса, это может существенно поменять наши представления о том, как была создана Вселенная. Но если он действительно существует, некоторые физики, например Стивен Хокинг, опасаются, что это может привести к концу Вселенной в том виде, в каком мы ее знаем. Они опасаются, что квантовые флуктуации могут создать пузырь вакуума, который будет расти и расти, пока не уничтожит Вселенную. И если вам кажется, что у физиков нет чувства юмора, то послушайте Джозефа Люккена, начальника Национальной ускорительной лаборатории имени Энрико Ферми в Иллинойсе[192]. По его словам, подобный сценарий нам не грозит в течение еще долгого времени — у нас в запасе еще 10100 лет, «поэтому, может, пока не стоит продавать свой дом, а лучше спокойно продолжать платить налоги».
Не все рады этому открытию, и не только потому, что оно может означать конец света, — а скорее потому, что тот факт, что вы нашли в науке что-то, предсказанное стандартной теорией, не ведет за собой новых исследований. Аномальный, неожиданный результат представляет для ученых больший интерес, потому что он означает, что и модель, и понимание ситуации были в лучшем случае несовершенными, а в худшем — совершенно неверными. А это уже открывает для науки новые возможности. Существует множество точек пересечения между искусством и наукой; дирижер Бенджамин Цандер{66} говорит, что, когда музыкант допускает ошибку, вместо того чтобы ругаться или восклицать «Упс!» или «Извините», он должен говорить: «А вот это интересно!» Интересно, потому что сложившаяся ситуация дает возможность научиться чему-то новому. Возможно, бозон Хиггса даст ответы на все наши вопросы. Или, как говорит писательница Сигне Брюстер, «это может привести к обнаружению скрытого принципа, который физики пока упускали. Конечная цель, как всегда, — найти ниточку, потянув за которую, вы начнете перезвон колоколов, который подтолкнет физиков к чему-то новому»[193]. Эйнштейн однажды заметил: «Если вы знаете, что получите на выходе, это не наука, это инженерное дело».
Ученые любопытны, они всю жизнь чему-то учатся и всегда готовы принять очередной вызов. Среди них есть те, кто опасается, что открытие бозона Хиггса может объяснить слишком многое и тогда это положит конец гонке за знаниями. Другие же полны благоговения и осознания, что и жизнь, и Вселенная настолько сложно устроены, что нам никогда не удастся понять все законы мироздания. Лично я отношусь к последним.
Вернемся к нашему разговору о физике. В ЦЕРН появились доказательства, не дающие мировой научной общественности покоя: открыта новая частица, которая может быть гравитоном или более тяжелой версией бозона Хиггса. Но наиболее вероятным объяснением этого удивительного открытия может быть простое совпадение: вероятность этого 1/93. Есть и качественные соображения. «Уже хорошо, что это не просто один-единственный ненормальный сигнал, передаваемый по довольно чистому каналу, — отметил физик Нима Аркани-Хамед{67} в статье в New York Times. — А раз мы еще не достаем бутылку охлажденного шампанского, чтобы отпраздновать открытие, интрига сохраняется»[194]. Никто пока не знает, что это за частица, но для Люккена и многих других ученых, любящих азарт, сопряженный с поиском чего-то нового, это отнюдь не проблема.
Наука и история состоят из вещей, о которых мы знаем или думали, что знаем, пока не обнаружили, что заблуждались. Очень важный компонент критического мышления — осознание того, что нам известно далеко не все. Ведущий принцип можно сформулировать так: мы знаем то, что мы знаем, пока не обнаружим, что ошибались. С помощью «Путеводителя по лжи» я хочу научить вас доходить до сути вещей, чувствовать себя более уверенными в том, что вы уже знаете, и в том, чего, как вам кажется, вы не знаете, ну и — по возможности — видеть разницу между одним и другим.
ЗАКЛЮЧЕНИЕ
Ваши собственные открытия
В книге Джорджа Оруэлла «1984» Министерство правды было агентством официальной пропаганды, занимавшимся фальсификацией исторической информации. Оно также продвигало контрзнание, отвечающее его задачам, например учило, что 2 + 2 = 5.
Роман «1984» был публикован в 1949 году, за полвека до того, как источником всех наших знаний де-факто стал интернет. Сегодня, как в «1984», сообщения на любом сайте можно так сильно изменить, что простой человек и не поймет, какими они были изначально. Любое сообщение можно переписать или (как это сделали Пол Маккартни и Дик Кларк) хранить в недоступном для общественности месте. Сегодня среднестатистическому пользователю довольно сложно понять, указаны на сайте правдивые факты или это контрзнание. К сожалению, сайты, бахвалящиеся тем, что сообщают только достоверную информацию, на деле оказываются сомнительными. Во многих случаях словом «правда» злоупотребляют те, кто распространяет контрзнание или мнения, идущие вразрез с тем, что традиционно считается истиной. Даже названия сайтов могут быть обманчивы и вводить пользователей в заблуждение.
Можно ли доверять экспертам? Когда как. Знания порой бывают узкопрофильными. Экономист, работающий в высших эшелонах власти, может и не знать, какие социальные программы будут эффективны для борьбы с преступностью. Бывает, что эксперты поглощены собственными интересами и, конечно, допускают ошибки.
В публичных рассуждениях и в интернете все чаще можно встретить антинаучные настроения. Все больше и больше вопросов, которые всегда входили в компетенцию ученых или считались техническими проблемами, — например, где строить электростанцию и сколько она должна стоить — оказываются в сфере интересов политиков[195]. Когда такое случается, процесс принятия решения переворачивается с ног на голову, а важные факты порой и вовсе игнорируются. Например, мы говорим, что хотим найти лекарство для борьбы с трудноизлечимым заболеванием, но сводим на нет все изначальные усилия, потратив десятки миллионов долларов на изучение всякой ерунды. На самом деле для прогресса в науке требуется понимание основ физиологии клетки. Из-за неверной постановки вопроса исследование выглядит тривиально, а правильная постановка может выявить потенциал, который приведет к важным изменениям. Те деньги, которые вкладываются в клинические испытания, возможно, когда-нибудь дадут возможность вылечить симптомы заболеваний нескольких сотен тысяч людей. Те же самые деньги, вложенные в фундаментальные научные исследования, потенциально могут помочь вылечить десятки заболеваний и миллионы людей, потому что раскрывают механизмы, общие для самых разных бактерий и вирусов. Именно научный метод и есть основа критического мышления.
Помимо антинаучных настроений, в последнее время имеет место и отсутствие скептицизма, когда речь заходит об интернете. Многие думают: «Если я нашел эту информацию в сети, значит, это правда». Ввиду отсутствия единого органа контроля за тем, что пишут в интернете, ответственность за проверку фактов лежит на нас самих. К счастью, появились сайты, которые могут помочь разобраться. Snopes.com и похожие платформы занимаются тем, что развенчивают мифы и городские легенды. У таких компаний, как Consumer Reports, есть свои независимые лаборатории для непредвзятой оценки различных продуктов. Consumer Reports существует уже многие десятилетия. Возможно, в XXI веке будут процветать и другие компании, активно использующие в работе критическое мышление. Будем надеяться. В целом, какие бы устройства ни были придуманы нам в помощь, надеяться мы должны только на себя.
Интернет — отличная демократическая платформа, позволяющая всем высказывать свое мнение, а также получать незамедлительный доступ к любой информации, имеющейся в мире. Объедините эти две идеи, как это делают интернет и социальные СМИ, и вы получите виртуальный мир информации и дезинформации, существующие бок о бок, смотрящие на вас, как однояйцовые близнецы, один из которых готов вам помогать, а второй — причинять вред. И понять, кто из них кто, должны мы сами, а для этого необходимо умение принимать взвешенные решения и еще кое-что, чего так не хватает большинству из нас: время. Критическое мышление — это не то, что можно попробовать один раз и потом бросить. Это активный и постоянный процесс, требующий от нас байесовского мышления, обновления своих знаний по мере поступления новой информации.
Время, которое было потрачено на оценку тех или иных утверждений, следует считать частью молчаливой сделки, которую все мы заключили. На сбор информации и ее анализ когда-то уходило от нескольких часов до нескольких недель — теперь же это занимает секунды. Мы сэкономили несчетное количество часов, которые были необходимы, чтобы добраться до библиотек или отдаленных архивов или чтобы просмотреть толстенные книги в поисках одного абзаца, дающего ответ на наши вопросы. Но теперь настало время превратить молчаливую сделку в открытые торги: использовать часть того времени, которое мы сэкономили на сборе информации, на ее тщательную проверку. Но как бывает сложно поверить тому, кто вас однажды обманул, так же непросто поверить собственным знаниям, если половина их оказывается контрзнанием. К сожалению, в наше время оно цветет пышным цветом в Facebook, Twitter и блогах.
Сегодня мы твердо уверены лишь в небольшом количестве вещей, а вот про большинство так сказать не можем. Контрзнание и дезинформация могут нам дорого обойтись, если говорить о жизни и счастье, а также о времени, потраченном на разбор ошибок. Настоящее знание упрощает нашу жизнь, помогает принимать решения, которые делают нас счастливее и экономят время. Следуя правилам, предложенным в «Путеводителе по лжи», мы сможем дать верную оценку тем многочисленным утверждениям, с которыми сталкиваемся ежедневно. Это сделает нас прозорливее в отношении существующей в интернете лжи и поможет не попасться на удочку всех тех лжецов и невежд, которые ее распространяют.
ПРИЛОЖЕНИЕ
Применение байесовского метода
Байесовский метод можно выразить следующей формулой:
Для решения текущей задачи примем такие обозначения: буквой G обозначим гипотезу{68} о виновности подозреваемого (до того, как мы узнаем что-нибудь о лабораторном отчете), а буквой E — улику: лабораторный анализ указывает на совпадение крови. Нам нужно выяснить P(G|E). Подставим эти переменные в формулу Байеса, заменив A на G, а B на E:
При использовании байесовского метода рекомендуется рисовать табличку[196]. Значения тут приведены такие же, как и в четырехчастной табличке.
СЛОВАРЬ ТЕРМИНОВ
Список терминов, представленный ниже, нельзя назвать исчерпывающим. Скорее это мой личный выбор. Безусловно, вы вправе применить собственное независимое мышление и оспорить какие-то определения.
Cum hoc, ergo propter hoc («Вместе с этим, следовательно, по причине этого») — логическая ошибка, результат следующего рассуждения: если два события происходят в одно время, значит, одно было вызвано другим. Корреляция не подразумевает причинно-следственных связей.
GIGO (Garbage in, garbage out) — «Мусор на входе, мусор на выходе».
Modus ponens — «правило вывода». Вид обоснованного дедуктивного рассуждения, имеющего следующую форму:
Если A, то B
A
Следовательно, B
Post hoc, ergo propter hoc («После этого, следовательно, по причине этого») — логическая ошибка, возникающая в результате такого рассуждения: из того, что одна ситуация (Y) происходит после другой (X), следует, что X стала причиной Y. X и Y могут быть взаимосвязаны, но это не означает, что имеет место причинно-следственная связь.
Абдукция — форма рассуждений, получившая известность благодаря Шерлоку Холмсу, в которой из разумных догадок выводится теория, способная объяснить все имеющиеся факты.
Бимодальное распределение — серия наблюдений, в которых два значения встречаются чаще, чем другие. На графике, отображающем частоты разных значений, видны два пика, или горба.
Верные цифры показывают, насколько близко число к настоящему количеству того, что измеряют. Не путать с точными цифрами.
Гипотетический силлогизм — то же, что и «правило вывода», или modus ponens.
Двойная ось Y — графическая техника для отображения двух серий наблюдений на одном графике, в котором все величины для каждой серии представлены на двух осях (обычно с разными шкалами). Этот метод хорош, только когда с помощью двух серий наблюдений мы измеряем непохожие величины, как было показано в графике в части 1. Графики с двойной осью Y могут только запутать, потому что тот, кто их составляет, может подправить шкалу осей, преследуя корыстные цели. На страницах книги мы приводили пример с компанией Planned Parenthood.
Дедукция — форма рассуждения, в которой мы идем от общего к частному.
Диаграмма рассеяния — тип диаграммы, изображающей значения двух переменных в виде отдельных точек. Например, ниже вы найдете диаграмму рассеяния данных, представленных в части 1.
Индукция — форма умозаключений, в которой серия конкретных наблюдений ведет к общему утверждению.
Интерполяция — отыскание промежуточных значений величины по некоторым известным ее значениям.
Контрапозиция — тип дедукции следующего вида:
Если A, то B
Не B
Следовательно, не A
Корреляция — статистический показатель, характеризующий, насколько близко связаны две переменные{69}. Может принимать любые значения от –1 до 1. Когда одна величина совершенно закономерно увеличивается с увеличением другой, имеет место полная корреляция (корреляция = 1). Если же наоборот, одна величина совершенно закономерно увеличивается с уменьшением другой, то имеет место полная отрицательная корреляция (корреляция = –1). Когда две переменные совершенно друг с другом не взаимосвязаны, корреляция равна 0.
Корреляция показывает только то, что две (или более) переменных как-то связаны, но не то, что одна есть причина другой. Корреляция не подразумевает причинно-следственных связей. Корреляция полезна, потому что отражает оценку того, насколько изменчивость в наблюдениях вызвана двумя переменными, которые мы отслеживаем. Например, корреляция 0,78 между ростом и весом показывает, что в 78 % случаев в изучаемой выборке разница в весе связана с разницей в росте{70}. Статистика умалчивает, какие факторы скрываются за оставшимися 22 %, — тут нужно проводить дополнительные исследования, но можно предположить, что это могут быть диета, генетика, занятия спортом и т. д.
Кумулятивный график — тот, на котором измеряемая величина, например продажи или членство в политической партии, представлена итоговой суммой, а не количеством новых наблюдений за какой-то период времени. Пример мы видели в случае с кумулятивными продажами iPhone.
Медиана — один из видов среднего значения (центральная тенденция серии наблюдений). Это значение, для которого половина наблюдений больше, а половина меньше. Когда существует равное количество наблюдений, статистики в качестве медианы могут взять среднее арифметическое двух срединных наблюдений. Например, для ряда (10, 12, 16, 17, 20, 28, 32) медиана будет 17. Для (10, 12, 16, 20, 28, 32) — 18 (среднее арифметическое двух срединных величин, 16 и 20).
Мода — один из видов среднего значения (центральная тенденция целой серии наблюдений). Это та величина, которая в распределении появляется чаще всего. Например, для ряда (100, 112, 112, 112, 119, 131, 142, 156, 199) мода будет 112.
Ошибка исключения — ошибка в рассуждении, которая случается, когда делают выводы о целой группе, основываясь на сведениях о нескольких частных случаях.
Обратное утверждение — вид необоснованного дедуктивного рассуждения, имеющего следующую форму:
Если A, то B
B
Следовательно, A
Объединение выборок — объединение наблюдений за одной или более группами. Если группы схожи в каком-то важном аспекте, то есть гомогенны, то это правильный подход. Если нет, это может привести к искажению данных.
Ошибка подтверждения следствием. См. Обратное утверждение.
Противоположное утверждение — вид необоснованного дедуктивного рассуждения, имеющего следующую форму:
Если А, то B
Не A
Следовательно, не B
Разделение на группы — разделение серии наблюдений на более мелкие группы. Это допустимо, когда мы имеем дело с разнородными данными и когда большая группа состоит из объектов, отличающихся только по одному важному показателю. Однако разделение на группы может применяться в жульнических целях, чтобы создать много маленьких групп, которые не сильно отличаются по изучаемой переменной.
Распространенность — число существующих случаев (например, заболевания).
Силлогизм — тип логического утверждения, в котором выводы должны обязательно следовать из посылки.
Среднее — суммарный показатель, характеризующий серию наблюдений. «Среднее» — нетехнический термин, часто под ним понимают среднее арифметическое, медиану или моду.
Среднее арифметическое — один из показателей среднего (центральная тенденция целой серии наблюдений). Его можно высчитать, суммировав все наблюдения и поделив на их количество. Два других типа среднего — это медиана и мода. Например, для (1, 1, 2, 4, 5, 5) среднее арифметическое равно (1 + 1 + 2 + 4 + 5 + 5) / 6 = 3. Обратите внимание, что, в отличие от моды, среднее арифметическое не обязательно находится среди наблюденных значений.
Точные цифры показывают, с точностью до какого десятичного разряда проводили измерение. Например, в числе 909 нет знаков после запятой, это результат измерения с точностью до целых. В числе 909,35 — два знака после запятой, это результат измерения с точностью до сотых. Точные цифры не всегда верные: второе число точнее первого, но не вернее его, если настоящее значение 909,00.
Усеченные оси используются в графиках, в которых шкалы на осях начинаются не с самых низких возможных значений. Иногда это может быть полезно: подробнее изображается та часть графика, где фиксируются результаты наблюдений. Но если использовать эту технику с целью манипуляции, то можно сильно исказить реальность. График, приведенный в качестве примера в этом разделе (см. Диаграмма рассеяния), эффективно использует две усеченные оси и не искажает данных. График, приведенный в части 1, данные искажает, истинные значения представлены на переделанном графике ниже.
Условная вероятность — вероятность, что какое-то событие произойдет при условии, что произойдет или уже произошло другое событие. Например, вероятность того, что сегодня пойдет дождь, при условии, что дождь шел вчера. Слова «при условии» обозначаются вертикальной чертой: |.
Фрейминг — способ, которым сообщают о статистических данных. Например, предоставленный контекст, группа сравнения или объединение выборок могут повлиять на то, как человек интерпретирует информацию. Сравнение общего числа авиакатастроф за 2016 год с показателями за 1936-й может быть неверным, потому что по сравнению с 1936-м в 2016-м было намного больше перелетов, — поэтому такие показатели, как количество авиакатастроф на 100 тысяч перелетов или количество авиакатастроф на 100 тысяч преодоленных километров, предоставляют более точную информацию. Нужно всегда найти лучший фрейм для статистического показателя — это значит наиболее подходящий и информативный. В этом смысле показатели в виде относительных частот обычно оказываются лучше, чем в виде общего количества.
Экологическая ошибка — ошибка в рассуждениях, которая случается, когда делают выводы о человеке, основываясь на совокупных данных (например, на среднем внутри класса).
Экстраполяция — процесс угадывания или выведения заключения о том, какие значения могут принимать величины за пределами интервала наблюденных значений.
БЛАГОДАРНОСТИ
Вдохновение для написания я почерпнул у Даррелла Хаффа в книге How to Lie with Statistics, которую прочитал несколько раз, с каждым разом все больше и больше понимая ее ценность. Я был большим фанатом книги Джоэла Беста Lies and Statistics, а также Чарльза Уилана и его Naked Statistics{73}. Я обязан всем троим юмором, мудростью и озарением. И, надеюсь, у всех тех, кто хочет научиться мыслить критически, моя книга займет достойное место на полке рядом с трудами этих авторов.
Мой агент, Сара Челфант из агентства Wylie Agency, просто мечта: дружелюбная, внимательная, неутомимая, всегда готовая оказать поддержку. Я чувствую свою избранность, потому что имел честь работать с ней и ее коллегами из TWA: Ребеккой Нэйджел, Стефани Дербишир, Альбой Циглер-Бэйли и Селией Кокорис.
Я очень благодарен всем, кто трудится в издательстве Dutton/Penguin Random House. Стивен Морроу работал в качестве редактора над четырьмя моими книгами и сделал каждую из них намного лучше. Он был очень хорошим наставником, я очень ценю его поддержку. Благодарю Адама О’Брайена, ЛиЭнн Пембертон, а также Сьюзен Шварц. Снимаю шляпу перед Беном Севиром, Амандой Уокер и Кристин Болл — они проделывают огромную работу, чтобы книги нашли своих читателей. Бекки Мейнз — больше, чем просто редактор, готовящий рукопись к печати. Мне очень понравились широта ее взглядов и глубина ее знаний, а также пояснения, которая она делала.
Выражаю признательность всем, кто участвовал в обсуждении, делился комментариями к моим черновикам, — вы все мне очень помогли: Джоуи Остервейл, Хизер Бортфельд, Лью Голдберг и Джеффри Моджил. За помощь со специфическими пассажами в книге я в неоплатном долгу перед Дэвидом Эйдельманом, Чарльзом Фуллером, Чарльзом Гейлом, Скоттом Графтоном, Прабхат Джа, Джеффри Кимболлом, Хоуи Клейном, Джозефом Лоренсом, Гретхен Либ, Майком Макгуайром, Региной Нуццо, Джимом О’Доннеллом, Джеймсом Рэнди, Джаспером Райном, Джоном Тирни и теми моими многочисленными коллегам из Американской статистической ассоциации, которые помогали с редактурой и вычиткой гранок. Особенно благодарю Тимоти Армистеда, Эдварда К. Ченга, Грегга Гаскона, Эдварда Грейсли, Кристал С. Лангле, Стэна Лазика, Доминика Лусинчи, Венди Мирвалдис, Дэвида П. Николса, Морриса Олицки и Карлу Зейлемакер. Мои студенты в Университете Макгилл, которые занимаются на моих семинарах по проведению независимых исследований, помогли мне с примерами и сделали мое мышление более ясным. Карл-Филип Зеймор на протяжении работы над четырьмя книгами помогал мне с цифрами, подбадривал, а также решал технические проблемы самого разного рода. Линдсей Флеминг, ассистент офиса, помогала мне планировать мое время и не терять концентрацию, а также выполняла множество самых разных поручений: проверяла примечания в конце книги, список терминов и факты, вычитывала гранки и делала много из того, что требовалось для написания книги. (Спасибо также Элиоту, Грейс, Луа и Кеннис Флеминг за то, что потратили на меня свое время.)
МАКСИМАЛЬНО ПОЛЕЗНЫЕ КНИГИ
Если у вас есть замечания и комментарии к содержанию, переводу, редактуре и корректуре, то просим написать на [email protected], вы поможете нам исправить недочеты и стать лучше.
Заходите в гости:
Для корпоративных клиентов:
НАД КНИГОЙ РАБОТАЛИ
Главный редактор Артем Степанов
Ответственный редактор Светлана Мотылькова
Арт-директор Алексей Богомолов
Литературный редактор Юлия Слуцкина
Дизайнер Наталия Байдужа
Верстка Екатерина Матусовская
Корректоры Надежда Болотина, Антон Снятковский
ООО «Манн, Иванов и Фербер»
Электронная версия книги подготовлена компанией Webkniga.ru, 2018
1
Фандрайзер (fundraiser, англ.) — тот, кто предоставляет услуги по привлечению ресурсов самостоятельно или по контракту. Здесь и далее, если не указано иное, прим. ред.
2
Изложение логически эквивалентной информации различными способами.
3
На момент издания книги почти 65 млрд. Прим. науч. ред.
4
В США финансовый год — период, на который устанавливается бюджет, — длится с 1 октября по 30 сентября. Прим. науч. ред.
5
SAT Reasoning Test (Scholastic Aptitude Test и Scholastic Assessment Test, дословно «Академический оценочный тест»).
6
Это не всегда так. Чтобы из равенства корреляции нулю сделать вывод об отсутствии связи между величинами, нужно проверить выполнение дополнительных условий. Достаточно, например, чтобы величины были распределены нормально. Прим. науч. ред.
7
Нет, нельзя оценить. Высокая корреляция не говорит о причинно-следственной связи, и результат может объясняться совсем другими факторами, не учтенными в исследовании. Например, наблюдается высокая корреляция между размером обуви и скоростью чтения школьников. Чем больше размер обуви, тем быстрее школьник читает, и наоборот. Корреляция есть, а причинно-следственной связи, конечно же, нет. Здесь играет роль совсем другой фактор — возраст. Чем старше школьник, тем больше у него ботинки и тем лучше он читает.
Корреляция между расходами на школьника и баллами за тесты может объясняться, например, работой администрации школы. Чем лучше она работает, тем больше средств привлекает и одновременно больше контролирует работу учителей, которая и обеспечивает высокие баллы.
Об этом еще будет рассказано в разделе «Отображение на графике несущественных данных». Прим. науч. ред.
8
После этого, следовательно, по причине этого (лат.).
9
Вместе с этим, следовательно, по причине этого (лат.).
10
Рэнделл Манро (Randall Munroe, р. 1984) — художник, программист. Работал в НАСА, занимался проблемами робототехники. Начатый в качестве хобби комикс xkcd — в настоящий момент его основное дело.
11
C-SPAN — сеть американского кабельного телевидения, освещающая слушания правительства США и служащая для связи с общественностью. В сеть входит 3 канала — C-SPAN, C-SPAN2, C-SPAN3.
12
t-критерий Стьюдента — общее название для класса методов статистической проверки гипотез (статистических критериев), основанных на распределении Стьюдента. Наиболее частые случаи применения t- критерия связаны с проверкой равенства средних значений в двух выборках.
13
Критерий хи-квадрат — любая статистическая проверка гипотезы, в которой выборочное распределение критерия имеет распределение хи-квадрат при условии верности нулевой гипотезы.
14
Регрессионный анализ — статистический метод исследования влияния одной или нескольких независимых переменных х1, х2 … хp на зависимую переменную Y.
15
Метод главных компонент (principal component analysis, PCA) — один из основных способов уменьшить размерность данных, потеряв наименьшее количество информации.
16
Batting average (средний коэффициент результативности отбивания) — число, которое выражает достижения игрока в бэттинге (отбивании). Его получают путем деления числа отбитых игроком подач на то, сколько раз он выступал как бэттер.
17
Шкала Глисона (сумма Глисона) используется для гистологической оценки дифференцировки рака простаты (малые значения шкалы соответствуют высокодифференцированным формам, а высокие — низкодифференцированным). Высокие значения по шкале Глисона связывают с плохим прогнозом исхода заболевания.
18
Издана на русском языке: Хокинг С. Краткая история времени. СПб.: Амфора, 2010.
19
В Гидрометцентре России имеют в виду совсем иное, когда дают вероятностный прогноз. На сайте http://meteoinfo.ru/forecasts-limits об этом рассказывается в разделе «Борьба с неопределенностью». Допустим, компьютерная программа по известным метеорологическим данным за понедельник дает некоторый вполне определенный прогноз на среду. Попробуем чуть-чуть «пошевелить» начальные понедельничные данные — вводить в программу немного другую температуру или немного другую влажность и т. п. Каждый раз программа будет выдавать новый прогноз на среду. Если 30 % этих прогнозов предсказывают дождь, считают, что вероятность дождя в среду 30 %. Такой подход используют потому, что прогноз очень неустойчиво зависит от начальных данных — даже взмах крыла бабочки может привести к неожиданным изменениям. Поэтому метеорологи стараются учесть неизбежные небольшие погрешности в исходных данных. Прим. науч. ред.
20
Амос Тверски (Amos Tversky, 1937–1996) — пионер когнитивной науки, в течение долгого времени соавтор Дэниела Канемана и ключевая фигура в открытии систематических когнитивных искажений в оценке риска и потенциальной выгоды.
21
Дэниел Канеман (Daniel Kahneman, р. 1934) — израильско-американский психолог, один из основоположников психологической экономической теории и теории поведенческих финансов, в которых объединены экономика и когнитивистика для объяснения иррациональности отношения человека к риску в принятии решений и в управлении своим поведением.
22
Система уравнений в дифференциальной или интегральной форме, описывающих электромагнитное поле и его связь с электрическими зарядами и токами в вакууме и сплошных средах.
23
Например, вы живете на улице 40 лет Октября, 40-летия Октября или Сорокалетия Октября? Прим. науч. ред.
24
Фильм режиссера Адама Маккея, в российском прокате «Игра на понижение» (2015).
25
Режиссер фильма — Дэвис Гуггенхайм, автор сценария — Альберт Гор, в российском прокате «Неудобная правда» (2006).
26
Джош Биллингс (Josh Billings, настоящее имя Генри Уилер Шоу (Henry Wheeler Shaw), 1818–1885). Был, возможно, самым известным писателем-сатириком в Соединенных Штатах во второй половине XIX столетия после Марка Твена.
27
Уолтер Фредерик «Фриц» Мондейл (Walter Frederick «Fritz» Mondale, р. 1928) — вице-президент США в 1977–1981 годах в администрации Джимми Картера, от Демократической партии.
28
Уильям «Уилл» Пенн Эдер Роджерс (William «Will» Penn Adair Rogers, 1879–1935) — американский ковбой, комик, актер и журналист.
29
Джон Эдгар Гувер (John Edgar Hoover, 1895–1972) — американский государственный деятель, занимавший пост директора Федерального бюро расследований на протяжении почти полувека, с 1924 года до своей смерти в 1972 году.
30
Награда Центра Кеннеди (Kennedy Center Honors) — награда, вручающаяся ежегодно за вклад в развитие национальной культуры Америки.
31
Музыкальная награда, которой каждый год награждается полноформатный альбом, выпущенный канадским исполнителем, за художественные достоинства, вне зависимости от жанра, объема продаж и лейбла.
32
Основная музыкальная премия Канады, ежегодно вручаемая с 1970 года, канадский аналог «Грэмми».
33
Одна из самых престижных литературных наград в США; учреждена в 1950 году группой издателей. В 1989 году вручение премии было передано Национальной книжной ассоциации (National Book Foundation), которая и управляет ею до сегодняшнего дня.
34
Первая детская литературная премия в мире; учреждена библиотекарями США и вручается с 1922 года писателям США за выдающийся вклад в американскую детскую литературу.
35
Сериал 1990 года, в российском прокате — «Закон и порядок».
36
Сериал 1969 года, в российском прокате — «Доктор Маркус Уэлби».
37
Сериал 1963 года, в российском прокате — «Главный госпиталь».
38
Сериал 1970 года, в российском прокате — «Все мои дети».
39
Аврам Ноам Хомски (Avram Noam Chomsky, р. 1928) — американский лингвист, политический публицист, философ и теоретик. Профессор лингвистики Массачусетского технологического института, автор классификации формальных языков, называемой иерархией Хомски.
40
Пусть покупатель остерегается — схема продаж, предполагающая ответственность покупателя за качество товаров, их назначение, соответствие целям и т. д. (Бизнес: Оксфордский толковый словарь. М., 1995). Прим. перев.
41
Позднее автор расскажет о том, что обратное утверждение нельзя считать обоснованным, но здесь он делает такое утверждение. Действительно, если материалы не вычитываются и не проверяются, то не заслуживают доверия. Однако обратное рассуждение не проходит. Если материалы не вызывают доверия, это не значит, что их не вычитывали и не проверяли. Северная Корея называет себя демократической республикой. Статьи в больших газетах там, конечно же, тщательно вычитываются, и не это отличает ее от других стран, объявляющих себя демократическими. Прим. науч. ред.
42
«Рейтинг Пиноккио» — принятая в США единица измерения лжи, названная в честь литературного героя, который, как известно, любил приврать.
43
По имени отца Пиноккио. Прим. перев.
44
Томас Роберт Мальтус (Thomas Robert Malthus, 1766–1834) — английский священник и ученый, демограф и экономист, автор теории, согласно которой неконтролируемый рост народонаселения должен привести к голоду на Земле.
45
Джеймс Рэнди (James Randi, настоящее имя Рэндалл Джеймс Хэмилтон Цвинге, Randall James Hamilton Zwinge, р. 1928) — канадско-американский иллюзионист и научный скептик, разоблачитель паранормальных явлений и псевдонаучных теорий, один из основателей Комитета по научному расследованию заявлений о паранормальных явлениях и основатель Образовательного фонда Джеймса Рэнди, известный участник движения «Брайтс», объединяющего сторонников натуралистического мировоззрения, свободного от религии, мистицизма и других элементов сверхъестественного.
46
Издана на русском языке: Гладуэлл М. Давид и Голиаф. Как аутсайдеры побеждают фаворитов. М.: Альпина Паблишер, 2014.
47
На самом деле вероятность того, что из 10 бросаний решка выпадет ровно 5 раз, равна приблизительно 0,25, а вероятность того, что из 1000 бросаний решка выпадет ровно 500 раз, примерно в 10 раз меньше. Прим. науч. ред.
48
Дэмиен Томпсон (Damian Thompson, р. 1962) — журналист, издатель и автор.
49
Любительский 26-секундный документальный кинофильм, снятый Абрахамом Запрудером (Abraham Zapruder) в Далласе в день убийства Джона Кеннеди 22 ноября 1963 года. Запрудер вышел на Дили-Плаза с кинокамерой, чтобы снять проезд президента США по Элм-стрит, и таким образом заснял убийство.
50
Херальдо Ривера (Geraldo Rivera, р. 1943) — американский адвокат, журналист, писатель, репортер и телеведущий. В 1988 году Ривера выдал в эфир несколько специальных репортажей, посвященных эпидемии сатанистских ритуалов. Он утверждал, что в США более миллиона сатанистов и большинство из них хорошо организованы и глубоко законспирированы. Однако утверждения Риверы о преступной деятельности сатанистов остались без подтверждения.
51
Пол Словик (Paul Slovic, р. 1938) — профессор психологии в Орегонском университете.
52
Хан Соло — один из главных героев киносаги «Звездные войны». Его сыграл Харрисон Форд. Прим. перев.
53
Английское слово argument имеет несколько значений: 1) довод, доказательство, аргумент; 2) спор, дискуссия. Прим. перев.
54
Стефани Сенефф (Stephanie Seneff) — научный сотрудник Массачусетского технологического института, широко известная своими исследованиями болезни Альцгеймера, сердечно-сосудистых заболеваний и аутизма.
55
Неселективный системный гербицид, использующийся для борьбы с сорняками, особенно многолетними. Занимает среди гербицидов первое место в мире по производству; действующее вещество средств, выпускающихся под торговыми названиями «Раундап», «Глифор», «Торнадо» и «Ураган».
56
Метаболический путь, промежуточный метаболит которого — шикимовая кислота (шикимат).
57
Малобюджетная коммерческая кинокартина, не пользующаяся большой популярностью (а часто и не рассчитанная на успех), в которой не снимались звезды и которая не отличается художественными достоинствами. Первоначально так называли фильмы, демонстрировавшиеся в кинотеатрах вторым номером на распространенных тогда сдвоенных киносеансах после крупнобюджетной, популярной картины категории А.
58
Эдмон Локар (Edmond Locard, 1877–1966) — пионер судебной медицины, который стал известен как «французский Шерлок Холмс».
59
Шедоу (от англ. shadow) — тень. Прим. перев.
60
Билл Кейсинг (Bill Kaysing, 1922–2005) — американский писатель, получивший известность благодаря книге We Never Went to the Moon («Мы никогда не были на Луне»), в которой утверждает, что шесть посадок «Аполлонов» на Луну в период с 1969 по 1972 год были мистификацией.
61
Rocketdyne — компания в США, которая производит жидкостные ракетные двигатели, основана в 2005 году.
62
В конце книги есть примечания и ссылки на источники, использованные автором. Утверждение, о котором говорит автор, в указанном им же источнике звучит иначе. Там оценивают не шансы зарождения жизни, а шансы того, что 300 молекул случайно могли соединиться в макромолекулу белка. Шансы эти оцениваются не как много миллиардов к одному, а как один из 10390. Прим. науч. ред.
63
TED (Technology Entertainment Design — технологии, развлечения, дизайн) — частный некоммерческий фонд в США, проводящий ежегодные конференции по науке, искусству, дизайну, политике, бизнесу и другим темам.
64
Гленн Фолкенстейн (Glenn Jacob Falkenstein, 1932–2010) — всемирно известный иллюзионист и менталист.
65
Иглу представляет собой куполообразную постройку из уплотненных ветром снежных или ледяных блоков. Эффект заключается в том, чтобы вход в иглу был ниже уровня пола, — это обеспечивает отток из постройки тяжелого углекислого газа и приток взамен более легкого кислорода, а также не позволяет уходить более легкому теплому воздуху.
66
Бенджамин Цандер (Benjamin Zander, р. 1939) — американский дирижер из Великобритании, музыкальный руководитель Бостонского молодежного филармонического оркестра, преподаватель Консерватории Новой Англии, музыковед, общественный деятель.
67
Нима Аркани-Хамед (Nima Arkani-Hamed, р. 1972) — канадский и американский физик-теоретик. Специалист в ряде областей: физика элементарных частиц, теория струн, космология.
68
Первая строка таблицы относится к гипотезе «подсудимый виновен», а вторая — к гипотезе «подсудимый невиновен». Прим. науч. ред.
69
Точнее было назвать корреляцией статистическую связь между двумя переменными, а количественное ее выражение — коэффициентом корреляции. Прим. науч. ред.
70
Это слишком сильное утверждение. Чтобы сделать подобный вывод, надо проверить некоторые дополнительные условия. Следует еще учитывать, что существуют разные показатели корреляции — точно так же, как существуют разные показатели средних, о чем рассказано в этой книге. Прим. науч. ред.
71
Издана на русском языке: Хафф Д. Как лгать при помощи статистики. М.: Альпина Паблишер, 2015.
72
Мысленный эксперимент, предложенный в 1814 году французским математиком Пьером-Симоном Лапласом, а также главный персонаж этого эксперимента — вымышленное разумное существо, способное, восприняв в любой момент положение и скорость каждой частицы во Вселенной, узнавать ее эволюцию как в будущем, так и в прошлом. Лаплас придумал это существо для наглядной демонстрации степени нашей неосведомленности и необходимости в статистическом описании некоторых реальных процессов в окружающем мире.
73
Издана на русском языке: Уилан Ч. Голая статистика. Самая интересная книга о самой скучной науке. М.: Манн, Иванов и Фербер, 2016.