Читать онлайн Эволюция разума, или Бесконечные возможности человеческого мозга, основанные на распознавании образов бесплатно

Эволюция разума, или Бесконечные возможности человеческого мозга, основанные на распознавании образов

Ray Kurzweil

HOW TO CREATE A MIND: THE SECRET OF HUMAN THOUGHT REVEALED

© 2012 by Ray Kurzweil. All rights reserved including the right of reproduction in whole or in part in any form. Th is edition published by arrangement with Viking, a member of Penguin Group (USA) Inc.

Серия «Большая наука»

© Мосолова Т. П., перевод на русский язык, 2015

© Оформление. ООО «Издательство «Эксмо», 2018

* * *

Введение

Просторней голубых Небес

Мой мозг во много раз —

В себя он с легкостью вместит

И небосвод, и вас.

Намного глубже моря он,

Хоть море глубоко —

Как губка, целый океан

Впитает он легко.

Он нужен Богу – чтобы Бог

Творенье взвесить смог —

И если с гирей он не схож,

То лишь как звук и слог.

Эмили Дикинсон[1]

Разум – самое важное явление во Вселенной; он способен выходить за границы физических законов и трансформировать мир. Человеческий разум позволил нам преодолеть ограничения нашей биологической природы и изменить самих себя. Человек – единственное животное, которое на это способно.

История человеческого разума началась с момента возникновения Вселенной, могущей создавать и кодировать информацию. Развитие Вселенной – тоже удивительная история. Современные физические модели зарождения Вселенной содержат десятки констант, которые должны иметь строго определенные значения. Иначе не было бы атомов, не было бы звезд и планет, не было бы мозга и книг о мозге. С трудом верится, что законы физики так точны, что могут предсказать эволюцию информации. Однако в противном случае мы с вами не могли бы говорить на эту тему. Там, где одни находят Божий промысел, другие видят мультивселенную, в которой происходит эволюция одних вселенных и гибель других, не несущих никакой информации. Но вне зависимости от того, каким образом образовалась наша с вами Вселенная, мы начинаем рассказ с того, что наш мир основан на информации.

Чтобы изложить историю эволюции, придется прибегать к все более и более абстрактным понятиям. Атомы (особенно атом углерода, образующий информационно богатые структуры за счет четырех связей с другими атомами) складывались в сложные молекулы. Постепенно физика породила химию.

Через миллиард лет появилась сложная молекула, называемая ДНК, а в ней записаны «программы», в соответствии с которыми образуются живые организмы. Так химия породила биологию.

Со все возрастающей скоростью в организмах эволюционировали коммуникационные сети, которые мы называем нервной системой и которые способны координировать все более и более сложные функции тел, а также их поведение, позволяющее организмам выжить. Нейроны нервной системы образовали головной мозг, способный осуществлять сложную мыслительную деятельность. Так возникла нейробиология, а мозг стал центром хранения и обработки информации. От атомов и молекул мы добрались до ДНК и мозга. Следующий шаг сделал только человек.

Мозг млекопитающих обладает одной способностью, которой нет ни у каких других животных: мы можем мыслить иерархически, понимать строение форм и рисунков, состоящих из различных элементов, представлять эти структуры в виде символов и использовать символы в еще более сложных структурах. Данный процесс реализуется частью головного мозга, называемой новой корой (неокортексом). У человека эта способность развита настолько сильно, что можно говорить не о рисунках и формах, а об идеях. Путем бесконечного рекурсивного процесса мы способны создавать еще более сложные идеи. Этот широкий спектр рекурсивно связанных идей мы называем знанием. Только Homo sapiens обладает знаниями, которые эволюционируют, растут по экспоненциальному закону и передаются от одного поколения другому.

Наш мозг создал еще один уровень абстракции, на котором используется наш разум и отставленный большой палец руки; с помощью таких приобретений мы изменяем мир и создаем орудия труда. Эти орудия – новая форма эволюции, и на ее уровне нейробиология породила технологию. И благодаря нашим орудиям возможности расширения наших знаний беспредельны.

Первым изобретением человечества стал рассказ – мы создали разговорный язык, который позволил нам передавать мысли словами. Позднее, научившись выражать мысли с помощью специфических символов, мы создали письменность. Письменный язык значительно расширил способность нашего мозга накапливать и расширять знания, составленные из рекурсивно структурированных идей.

Существуют разные мнения относительно того, могут ли другие животные, например шимпанзе, выражать иерархические идеи с помощью речи. Шимпанзе способны выучить ограниченный набор языковых символов и использовать их для общения с дрессировщиками. Однако очевидно, что существуют пределы сложности структурных знаний, которыми могут оперировать обезьяны. Произносимые ими предложения представляют собой определенные простые последовательности существительных и глаголов, и им не дана присущая человеку способность беспредельного усложнения языковых конструкций. В качестве занимательного примера сложности человеческой речи советую прочесть хотя бы одно из удивительных многостраничных предложений Габриэля Гарсиа Маркеса: его новелла «Последнее путешествие корабля-призрака» состоит из одного единственного предложения, которое прекрасно воспринимается как на испанском, так и на английском языке[2][3].

Главная мысль трех моих предыдущих книг («Эпоха мыслящих машин» (The Age of Intelligent Machines), написана в 1980-х и опубликована в 1989 г.; «Эпоха духовных машин» (The Age of Spiritual Machines), написана в конце 1990-х и опубликована в 1999 г., и «Сингулярность уже близка» (The Singularity Is Near), написана в начале 2000-х и опубликована в 2005 г.) заключается в том, что эволюционный процесс имеет тенденцию ускоряться (за счет усложнения абстракций), и его результаты по сложности и возможностям изменяются экспоненциально. Я называю этот феномен «законом ускорения отдачи» (ЗУО), и он имеет отношение как к биологической, так и к технологической эволюции. Самый яркий пример действия закона заключается в предсказуемом экспоненциальном росте объема памяти и производительности информационных технологий. Эволюция технологий привела к созданию компьютера, который, в свою очередь, позволил в значительной степени расширить наши знания и связать между собой информацию из разных областей знания. Интернет также является подходящим и выразительным примером способности иерархической системы охватывать большой объем информации, сохраняя при этом свою структуру. Сам мир устроен по принципу иерархии: деревья имеют ветви, на ветвях растут листья, на листьях есть жилки. Дома имеют этажи, на этажах расположены комнаты, в комнатах есть двери, окна, стены и полы.

Мы создали такие инструменты, которые позволили нам понять наше собственное биологическое строение. Мы быстро учимся обратному проектированию (воспроизведению) информационных процессов, лежащих в основе биологических законов, включая законы функционирования нашего собственного мозга. Теперь у нас в руках есть «объектный код» жизни в виде человеческого генома, что само по себе является удивительным примером экспоненциального роста знаний: за последние двадцать лет объем секвенированных генетических последовательностей в мире ежегодно увеличивался почти вдвое. С помощью компьютеров мы можем моделировать процессы трансляции последовательностей ДНК в последовательности аминокислот, которые складываются в трехмерные белковые структуры, являющиеся основой всей биологии. По мере экспоненциального роста компьютерных возможностей увеличивается сложность белковых структур, упаковку которых мы можем моделировать. Мы также способны моделировать взаимодействия между белками, происходящие за счет трехмерных межатомных сил. Углубление наших биологических знаний является важнейшим условием открытия секретов разума, которым наградила нас эволюция, и создания с помощью этих биологических концепций еще более разумных технологий.

В настоящее время тысячи ученых и инженеров чрезвычайно активно работают над проектом, посвященным изучению механизма самого совершенного интеллектуального процесса – функционирования человеческого мозга. Возможно, это самый важный проект в истории машинной цивилизации. В книге «Сингулярность уже близка» я писал о том, что одним из следствий закона ускорения отдачи является отсутствие других разумных существ. Если бы они были, мы бы их заметили, учитывая сравнительно быстрый переход цивилизации от слабо развитой технологии (только представьте себе, что в 1850-х гг. в Америке самым быстрым способом доставки корреспонденции был «Пони-экспресс»[4]) к технологии, которая вышла бы за пределы их планеты[5]. С этой точки зрения, обратное проектирование человеческого мозга можно рассматривать в качестве важнейшего проекта во всей Вселенной.

Цель проекта заключается в изучении принципов работы человеческого мозга и использовании этой информации для того, чтобы лучше понимать самих себя, ремонтировать мозг, если это необходимо, и – что непосредственно относится к теме данной книги – создавать еще более разумные машины. Вспомним, что инженерный подход заключается в многократном усилении природных эффектов. Рассмотрим, к примеру, достаточно слабое явление, описываемое законом Бернулли. Этот закон утверждает, что воздух оказывает чуть меньшее давление на движущуюся искривленную поверхность, чем на движущуюся плоскую поверхность. Ученые еще не до конца поняли, как математика закона Бернулли описывает закономерности подъема крыла, а инженеры ухватились за это тонкое различие, сконцентрировали его и создали авиацию.

Данную книгу я посвятил изложению принципа, который называю «теорией мысленного распознавания образов» (ТМРО; The Pattern Recognition Theory of Mind, PRTM) и который, я готов поспорить, описывает основной алгоритм функционирования новой коры мозга (ответственной за понимание, память и критическое мышление). Я рассказываю о том, как последние исследования в области нейробиологии, а также наши собственные мысленные эксперименты привели нас к неизбежному выводу, что этот принцип действует во всех отделах новой коры. Инженерное использование принципов ТМРО и ЗУО позволит значительно расширить мощь нашего собственного разума.

На самом деле этот процесс уже активно претворяется в жизнь. Можно назвать сотни задач и функций, которые считались исключительной прерогативой человека и которые сейчас могут выполняться компьютерами, причем обычно гораздо точнее и с гораздо большей производительностью. Каждый раз, когда вы отправляете электронную почту или звоните по мобильному телефону, разумные алгоритмы передают информацию оптимальным образом. Когда вам делают электрокардиограмму, вы получаете поставленный компьютером диагноз, конкурирующий с диагнозом врача. То же самое справедливо для изображений клеток крови. Разумные алгоритмы обнаруживают жульничество с кредитными картами, ведут и сажают самолеты, управляют разумными системами вооружения, помогают создавать продукты и отслеживать их запасы, собирают продукцию на автоматизированных производствах и мастерски играют в такие игры, как шахматы.

Миллионы людей следили за тем, как компьютер компании IBM по имени Ватсон играл в «Джеопарди!»[6] на человеческом языке и набрал больше очков, чем два лучших в мире игрока вместе. Нужно отметить, что Ватсон не только читал и «понимал» тонкости вопросов (например, каламбуры и метафоры), но находил необходимую для ответа на вопрос информацию среди миллионов страниц документов на человеческом языке, таких как «Википедия» и другие энциклопедии. Ему пришлось разбираться практически во всех областях человеческой интеллектуальной деятельности, таких как история, наука, литература, искусство и т. д. Сейчас IBM работает с компанией Nuance (прежнее название Kurzweil Computer Products – моя первая компания) над созданием новой версии Ватсона. Эта машина будет читать медицинскую литературу (включая все медицинские журналы и важнейшие медицинские блоги) и станет специалистом по диагностике и консультантом по медицинским вопросам. Для этого используется технология компании Nuance, позволяющая воспринимать медицинскую терминологию. Некоторые наблюдатели утверждают, что Ватсон на самом деле не «понимает» вопросов викторины или текстов в энциклопедиях, а только производит «статистический анализ». В книге я расскажу, что математические технологии, использующиеся для создания искусственного интеллекта (как у Ватсона или Сири[7]), очень похожи на те, что эволюционировали естественным путем и воплотились в новой коре. Если понимание языка и другие процессы, осуществляемые с помощью статистического анализа, не считаются «истинным пониманием», можно сказать, что люди тоже ничего не понимают.

Способность Ватсона разумно воспринимать информацию на человеческом языке вскоре будет использована для создания новых поисковых систем. Люди уже говорят по телефону на своем языке (причем через айфон – именно с помощью Сири; в разработке этой системы также принимала участие компания Nuance). Эти помощники, воспринимающие человеческую речь, станут еще разумнее, когда будут применять такие методы, которыми пользуется Ватсон, да и сам Ватсон продолжает совершенствоваться.

Самодвижущиеся машины Google проехали 200 тыс. миль по многолюдным городам и центрам Калифорнии (и эта цифра, без сомнения, значительно возрастет к тому моменту, когда моя книга окажется на полках реальных и виртуальных магазинов). В современном мире существует множество других примеров использования искусственного интеллекта, а на горизонте возникают все новые и новые примеры.

Еще одно проявление закона ускорения отдачи заключается в том, что возможности пространственного разрешения структур головного мозга и количество информации о мозге ежегодно увеличиваются в два раза. Кроме того, мы теперь можем использовать эти данные для создания рабочих моделей и для моделирования участков мозга. Нам удалось осуществить обратное проектирование ключевых функций слуховой коры, в которой обрабатывается звуковая информация, зрительной коры, где обрабатывается зрительная информация, и мозжечка, отвечающего за определенные навыки (например, за поимку летящего мяча).

Главная задача проекта по изучению и моделированию головного мозга человека заключается в обратном проектировании новой коры мозга, которая отвечает за рекурсивное иерархическое мышление. Кора составляет 80 % головного мозга человека и образована из повторяющихся структур, что позволяет нам создавать сколь угодно сложные идеи.

Моя теория мысленного распознавания образов описывает модель, с помощью которой человеческий мозг реализует эту свою способность, используя замечательную структуру, появившуюся в ходе биологической эволюции. Какие-то детали этого механизма мы пока понимаем не полностью, но мы знаем достаточно, чтобы создать алгоритм, приводящий к тем же результатам. Начав с изучения функций новой коры, мы продвинулись настолько, что можем значительно усилить ее возможности – таким же образом, как конструкторы самолетов усилили эффект принципа Бернулли. Принцип функционирования новой коры, безусловно, является важнейшей в мире идеей, поскольку новая кора способна не только аккумулировать знания и навыки, но и создавать новые знания. Ведь именно новая кора в конечном счете отвечает за все рассказы, все песни, все картины, все научные открытия и все другие результаты человеческой деятельности.

Нейробиология остро нуждается в теории, которая смогла бы связать воедино результаты всех обширных и разнообразных наблюдений. Никакая наука не может существовать без единой теории. В следующей главе я расскажу о том, как двое мечтателей соединили физику с биологией – два раздела науки, которые до них считались безнадежно разупорядоченными, и как можно применить эту теорию для изучения головного мозга.

Сегодня часто говорят о сложном строении человеческого мозга. Если осуществлять поиск с помощью Google, вы обнаружите около 30 млн ссылок на эту тему (однако указать точное число цитирований невозможно, поскольку некоторые сайты цитируются много раз, а другие однократно). Джеймс Уотсон писал в 1992 г., что «головной мозг – это [для нас] последняя и самая серьезная биологическая преграда, самая сложная вещь из всех, что мы до сих пор открыли во Вселенной». И объяснял это тем, что мозг «содержит сотни миллиардов клеток, соединенных между собой триллионами связей. Мозг поражает разум»[8].

Я согласен с Уотсоном в том, что изучение головного мозга – самая сложная биологическая задача, но тот факт, что в нем миллиарды клеток и триллионы связей, не обязательно указывает на особую сложность его изучения, если только нам удастся идентифицировать понятные (и воспроизводимые) структуры этих клеток и связей, особенно учитывая их избыточность.

Давайте подумаем, что означает быть сложным? Ну, например, сложен ли лес? Ответ зависит от точки зрения. Можно сказать, что лес состоит из тысяч деревьев и каждое дерево отличается от других. Кроме того, на каждом дереве тысячи веток, и все они тоже различны. Затем можно отметить причудливые формы этих ветвей и прийти к выводу, что лес настолько сложен, что и вообразить трудно.

Но такая точка зрения буквально иллюстрирует выражение «не видеть леса за деревьями». Безусловно, все деревья и все ветви различаются, но, чтобы правильно понять принцип устройства леса, следовало бы начать с идентификации повторяющихся рисунков с имеющимися стохастическими (то есть случайными) вариациями. Можно сказать, что принцип устройства леса проще принципа устройства дерева.

То же самое относится и к головному мозгу, для которого характерна такая же невероятная избыточность, особенно в области новой коры. И как я покажу ниже, вполне можно сказать, что один нейрон устроен сложнее, чем вся новая кора.

Моя задача в этой книге заключается не в том, чтобы в миллион первый раз сообщить о сложной структуре мозга, а скорее в том, чтобы удивить вас мощью его простоты. Я расскажу, как оригинальные базовые механизмы распознавания, запоминания и предсказания, повторяющиеся в новой коре сотни миллионов раз, обеспечивают всю широту наших мыслительных способностей. Как фантастическое разнообразие организмов возникает в результате различных комбинаций букв генетического кода в ядерной и митохондриальной ДНК, так и фантастическое множество идей, мыслей и навыков создается из образов (синаптических связей и потенциалов), распознаваемых специализированными модулями новой коры. Нейробиолог Себастьян Сеунг из Массачусетского технологического института говорит: «Личность определяется не нашими генами, а связями между клетками нашего мозга»[9].

Нужно понимать разницу между истинной сложностью строения и кажущейся внешней сложностью. Рассмотрим, к примеру, знаменитое множество Мандельброта, которое долгое время считалось символом сложности. Чтобы оценить его кажущуюся сложность, увеличьте его изображение (обратитесь к ссылке, приведенной в комментарии[10]). Вы увидите бесконечное множество рисунков внутри рисунков, и все они различаются между собой. Но строение (формула) множества Мандельброта чрезвычайно просто и описывается последовательностью из знаков: Z = Z2 + C. Не нужно полностью понимать смысл функции Мандельброта, чтобы оценить, насколько она проста. Этот закон реализуется многократно и на всех уровнях иерархии. То же самое справедливо для мозга. Его повторяющаяся структура не так проста, как формула множества Мандельброта, но и далеко не так сложна, как можно заключить на основании миллионов ссылок о строении головного мозга. Основная структура новой коры повторяется вновь и вновь на каждой иерархической ступени. Задачу, которую я попытался решить в данной книге, озвучил Эйнштейн, сказавший: «Любой дурак может увеличить и усложнить проблему… но нужно много храбрости, чтобы сделать наоборот».

Рис.0 Эволюция разума, или Бесконечные возможности человеческого мозга, основанные на распознавании образов

Вариант изображения множества Мандельброта – результата многократного повторения простой математической формулы. При приближении к какой-либо точке кажется, что изображение постоянно меняется непредсказуемым образом.

До сих пор я говорил о мозге. Но что можно сказать о разуме? Например, как связана активность новой коры с сознанием? И сколько осознанных мыслей в нашем мозге, когда мы обдумываем ту или иную проблему? Кажется, иногда бывает больше одной.

Еще один важный вопрос о разуме: что такое свобода воли и есть ли она у нас? Некоторые эксперименты показывают, что мы начинаем реализовывать задуманное даже прежде, чем осознаём, что приняли решение. Означает ли это, что свобода воли – лишь иллюзия?

Наконец, какие атрибуты мозга определяют личность? Тот ли я человек, которым был полгода назад? Ясно, что не совсем тот, но сохранил ли я собственную личность?

Посмотрим, как теория мысленного распознавания образов помогает ответить на эти извечные вопросы.

Глава первая

Мысленные эксперименты над миром

Дарвиновская теория естественного отбора появилась очень поздно в истории развития человеческой мысли. Связано ли ее запоздалое возникновение с тем, что она противоречила очевидным истинам, была абсолютно новым предметом в истории науки, касалась только живых существ и рассматривала лишь причинно-следственные связи, но ничего не говорила о сотворении мира? Я думаю, причина в другом. Дарвин открыл роль отбора – причинной связи, которая очень сильно отличается от пушпульных механизмов, знакомых науке в то время. Происхождение фантастического разнообразия живых существ объяснялось появлением новых признаков, возможно случайным, которые позволяли этим существам выжить. В физике и биологии практически не существовало никаких доказательств причинной функции отбора.

Б. Ф. Скиннер[11]

Ничто так не свято, как чистота вашего разума.

Р. У. Эмерсон[12]

Аналогия из геологии

В начале XIX в. геологи заинтересовались фундаментальным вопросом. Во всем мире были обнаружены гигантские пустоты и каньоны, такие как Большой каньон в США и каньон Викос в Греции (который считается самым глубоким каньоном в мире). Как возникли такие грандиозные структуры?

Конечно, в каждом случае на дне ущелий протекала вода, которая использовала этот естественный путь, но до середины столетия совершенно абсурдной казалась бы мысль, что эти ручейки и были причиной появления гигантских провалов и расщелин. Однако британскому геологу Чарлзу Лайелю (1797–1875) пришло в голову, что за очень длительный срок именно вода могла вызвать столь значительные изменения ландшафта. Сначала эту идею высмеивали, но за двадцать лет она завоевала всеобщее признание.

Одним из тех, кто внимательно следил за реакцией общественности на гипотезу Лайеля, был английский натуралист Чарлз Дарвин (1809–1882). Что происходило в биологии в 1850-х гг.? Эта область исследований казалась чрезвычайно запутанной, учитывая бесконечное множество видов животных и растений, каждое из которых обладало сложным строением. И в большинстве своем ученые даже не пытались создать общую теорию, объясняющую разнообразие живых организмов. Это разнообразие считалось доказательством божественного происхождения мироздания (и его анализ оказался не под силу ученым, не сумевшим в нем разобраться).

Дарвин подошел к проблеме происхождения видов, используя тезис Лайеля о постепенных изменениях. Эту аналогию в сочетании с собственными экспериментами и наблюдениями Дарвин изложил в своем знаменитом «Путешествии на Бигле»[13]. Дарвин утверждал, что в каждом поколении те особи, которые лучше всего приспособлены к условиям своей экологической ниши, дают жизнь следующему поколению.

Труд Дарвина «О происхождении видов» появился в продаже 22 ноября 1859 г. В книге Дарвин отдает должное Лайелю: «Я вполне сознаю, что это учение о естественном отборе, поясненное вышеприведенными вымышленными примерами, может встретить те же возражения, которые были впервые выдвинуты против великих идей сэра Чарлза Лайеля о “современных изменениях на земной поверхности, объясняющих нам геологические явления”; но теперь мы редко слышим, чтобы факторы, которые находятся еще в действии, признавались ничтожными и ничего не значащими, когда идет речь о причинах образования глубочайших речных долин или формирования внутриматериковых длинных скалистых гряд. Естественный отбор действует только путем сохранения и кумулирования малых наследственных модификаций, каждая из которых выгодна для сохраняемого существа; и как современная геология почти отбросила такие воззрения, как, например, прорытие глубокой долины одной делювиальной волной, так и естественный отбор изгонит веру в постоянное творение новых органических существ или в какую-либо большую и внезапную модификацию»[14][15].

Всегда есть множество доводов, объясняющих неприятие новых и важных идей, и в случае теории Дарвина их несложно идентифицировать. Мысль о том, что мы произошли не от Бога, а от обезьяны, а еще раньше от червя, мало кому понравилась. Многие сочли богохульством считать родственником своего домашнего пса или гусеницу, не говоря уже о растениях, по которым она ползает (конечно, очень-очень-очень дальним, но все же родственником).

Рис.1 Эволюция разума, или Бесконечные возможности человеческого мозга, основанные на распознавании образов

Чарльз Дарвин, автор книги «О происхождении видов», обосновавший теорию биологической эволюции.

Однако идея быстро распространилась, поскольку объединяла то, что долгое время считалось множеством несвязанных наблюдений. В шестом издании книги, которое увидело свет в 1872 г., Дарвин писал следующее: «В качестве напоминания о прежнем положении вещей я сохранил в предшествующих параграфах и в других местах несколько строк, указывающих на то, что натуралисты верят в отдельное сотворение каждого вида, и меня сильно осуждали за то, что я выражался таким образом. Но не подлежит сомнению, что таково было общее убеждение, когда появилось первое издание этой книги. …Теперь положение совершенно иное, и почти каждый натуралист допускает великий принцип эволюции»[16].

На протяжении следующего столетия обобщающая идея Дарвина углублялась и развивалась. Всего через десять лет, в 1869 г., швейцарский врач Фридрих Мишер (1844–1895) открыл в клеточном ядре вещество, которое он назвал «нуклеином», а мы теперь называем ДНК[17]. В 1927 г. русский биолог Николай Кольцов (1872–1940) описал «гигантскую наследственную молекулу», которая состояла из «двух зеркальных нитей, способных реплицироваться по полуконсервативному механизму, используя каждую нить в качестве матрицы». Эти идеи также многими не были приняты. Коммунисты считали их вражеской пропагандой, и неожиданную кончину Кольцова связывают с деятельностью КГБ[18][19]. В 1953 г., почти через сто лет после публикации основополагающего труда Дарвина, американский биолог Джеймс Уотсон (род в. 1928 г.) и английский биолог Френсис Крик (1916–2004) впервые описали структуру ДНК, представляющую собой спираль из двух скрученных между собой длинных молекул[20].

Следует заметить, что их открытие было основано на так называемой фотографии 51 – рентгенограмме, полученной Розалиндой Франклин и являющейся первым изображением двойной спирали. Учитывая вклад Франклин в открытие двойной спирали, высказывалось мнение о том, что она должна была разделить Нобелевскую премию с Уотсоном и Криком[21].

Описание молекулы, которая может кодировать биологические программы, подтвердило унифицирующую теорию биологии. Эта молекула просто и элегантно объясняет структуру всего живого. В зависимости от последовательности оснований в нити ДНК в ядре (и, в меньшей степени, в митохондриях) организм станет травинкой или человеческим существом. Данное открытие не умаляет изумительного разнообразия природы, но позволяет нам понять, что все разнообразие определяется вариантами структур, которые записаны в этой уникальной молекуле.

Прокатимся на луче

В начале XX в. серия другого рода мысленных экспериментов привела к перевороту в физике. В 1879 г. в семье немецкого инженера и домохозяйки родился сын. Говорить он начал только в три года, а в девять лет плохо справлялся со школьной программой. В шестнадцать он мечтал о полете на луче лунного света.

Юноша знал об эксперименте, в 1803 г. проведенном английским математиком Томасом Юнгом (1773–1829) и показавшем, что свет состоит из волн. В те времена считалось, что световые волны распространяются в некой среде, подобно тому, как морские волны бегут по воде, а звуковые – по воздуху и другим материалам. Ученые называли среду, по которой распространяется свет, «эфиром». Юноша знал и об эксперименте американских ученых Альберта Майкельсона и Эдварда Морли, в 1887 г. пытавшихся подтвердить наличие эфира. Их эксперимент строился на аналогии с плаванием на гребной лодке вверх и вниз по реке. Если вы гребете с постоянной скоростью, скорость движения лодки, измеренная с берега, будет больше, когда вы движетесь по течению, чем когда вы гребете против течения. Майкельсон и Морли считали, что свет движется через эфир с постоянной скоростью (то есть со скоростью света). Они предположили, что скорости света при движении Земли по своей орбите вокруг Солнца в одну и в другую сторону должны различаться (на двукратную величину скорости вращения Земли). Это подтвердило бы существование эфира. Однако никаких различий в скорости солнечного света при любом положении Земли на орбите они не обнаружили. Их эксперимент доказал несостоятельность идеи «эфира», но не объяснил, как же распространяется свет. Ответа на этот вопрос ждали еще около двадцати лет.

Когда немецкий юноша мечтал о путешествиях на световом луче, он рассуждал так, что следует рассмотреть световые волны «остановившимися»: представьте себе, что вы движетесь параллельно движущемуся поезду с такой же скоростью – тогда вам покажется, что поезд стоит на месте. Поэтому он попытался представить себе, что будет, если двигаться вдоль светового луча, но с несколько меньшей скоростью. Допустим, он движется со скоростью, которая составляет 90 % скорости света. Если лучи света можно сравнить с поездами, то он должен был бы видеть свет, движущийся перед ним со скоростью, составляющей 10 % скорости света. По крайней мере, это должны были бы видеть наблюдатели на Земле. Но мы знаем, что скорость света постоянна, как показал эксперимент Майкельсона – Морли. Таким образом, наблюдатель должен был видеть свет, движущийся впереди «на полной скорости» света. Тут какое-то противоречие – как такое может быть?

Ответ был получен немецким юношей (как вы могли догадаться, это был Альберт Эйнштейн), когда ему исполнилось 26 лет. Очевидно, для молодого Эйнштейна замедлилось само время. Он объяснял свои рассуждения в статье, опубликованной в 1905 г.[22] Если наблюдатели на Земле смогли бы смотреть на часы молодого человека, они бы обнаружили, что они идут в 10 раз медленнее. И когда он вернулся бы на Землю, его часы прошли бы лишь 10 % того времени, которое длилось его отсутствие для земных наблюдателей (в данном случае мы не учитываем ускорение и замедление). Однако для самого юноши часы шли нормально, а луч света перед ним двигался со скоростью света. Десятикратное замедление времени (по отношению к земным часам) объясняет кажущееся противоречие. Если рассматривать крайний случай, когда скорость движения равна скорости света, время бы остановилось, хотя двигаться наравне со световым лучом невозможно. Однако теоретически ничто не запрещает двигаться быстрее света, и в таком случае время пойдет вспять.

Сначала такие утверждения многим показались абсурдными. Как может время замедляться в зависимости от скорости движения? Действительно, на протяжении 18 лет, которые прошли со времен эксперимента Майкельсона – Морли, никто не смог прийти к выводу, который казался Эйнштейну таким очевидным. Многие ученые, пытавшиеся разобраться с этой проблемой на протяжении всего XIX в., можно сказать, «падали с лошади», цепляясь за привычные представления о том, как должен быть устроен мир (наверное, лучше сказать «падали со светового луча»).

Второй мысленный эксперимент Эйнштейна заключался в том, что он представил себя и своего брата в космосе. Между ними расстояние 300 тыс. км. Эйнштейн хочет двигаться быстрее, но при этом сохранять между собой и братом одно и то же расстояние. Он подает брату сигнал фонариком каждый раз, когда хочет ускориться. Поскольку он знает, что до брата сигнал дойдет только через секунду, он подает сигнал, ждет секунду и только потом ускоряется. Каждый раз, когда брат получает сигнал, он тут же ускоряется, а так как братья ускоряются точно в одно и то же время, расстояние между ними не меняется.

Но что увидим мы, наблюдая за ними с Земли? Если братья удаляются от нас (Альберт впереди), нам покажется, что до брата свет доходит быстрее, чем за секунду, поскольку он движется навстречу свету. Кроме того, мы увидим, что часы брата замедляются (по мере увеличения его скорости, поскольку он к нам ближе). Ввиду этих двух причин мы будем видеть, что братья постепенно сближаются и наконец сталкиваются. А с точки зрения братьев, они по-прежнему находятся на расстоянии 300 тыс. км друг от друга.

Как это возможно? Ответ – очевидно – заключается в том, что расстояния в направлении параллельном (но не перпендикулярном) направлению движения сокращаются. Таким образом, в результате ускорения братья Эйнштейн становятся меньше ростом (при условии, что они передвигаются головой вперед). Это странное заключение, возможно, стоило Эйнштейну большего числа поклонников его теории, чем выводы об изменениях времени.

В том же году Эйнштейн исследовал вопрос о связи материи и энергии. В 1850-х гг. Джеймс Клерк Максвелл показал, что частицы света, называемые фотонами, не имеют массы, но обладают импульсом. В детстве у меня было устройство под названием радиометр (или вертушка) Крукса[23], которое состояло из четырех лопастей, вращающихся на острие иглы внутри герметичной стеклянной колбы с разреженным воздухом. Лопасти с одной стороны были черными, а с другой – белыми. Белая сторона каждой лопасти отражала свет, а черная поглощала (именно поэтому в жару прохладнее в белой футболке, чем в черной). Когда на вертушку попадал свет, лопасти вращались таким образом, что черные стороны удалялись от источника света. Этот эксперимент показывает, что фотоны обладают достаточным импульсом, чтобы заставить вращаться лопасти прибора[24]:

Рис.2 Эволюция разума, или Бесконечные возможности человеческого мозга, основанные на распознавании образов

Радиометр Крукса – вертушка с четырьмя лопастями, которая вращается под действием света.

На основании подобных наблюдений Эйнштейн сделал вывод, что импульс зависит от массы: импульс равен массе тела, помноженной на скорость его движения. Таким образом, паровоз, идущий со скоростью 50 км/ч, обладает гораздо бо́льшим импульсом, чем, скажем, насекомое, передвигающееся с той же скоростью. Однако как объяснить наличие положительного импульса у частицы, масса которой равна нулю?

Мысленный эксперимент Эйнштейна состоял в исследовании поведения коробки, находящейся в космосе. Внутри коробки происходит испускание фотона, который движется слева направо. Суммарный импульс системы должен сохраняться, поэтому при испускании фотона коробка смещается влево. Через какое-то время фотон ударяется о правую стенку коробки, возвращая импульс коробке. И вновь общий импульс системы должен сохраняться, так что коробка перестает двигаться.

До сих пор все нормально. Но что видит господин Эйнштейн, находящийся снаружи? Он не видит ничего, что происходит внутри коробки. Никакие частицы (с массой или без массы) в нее не попадают, и никакие частицы из нее не выходят. В соответствии с описанным выше сценарием видно только, что коробка какое-то время движется влево, а затем останавливается. В рассмотренной нами ситуации каждый фотон должен сдвигать коробку влево. Поскольку на коробку не производится никакого внешнего воздействия и ее содержимое не оказывает никакого влияния на внешнюю среду, центр массы коробки не должен смещаться. И движущийся внутри коробки фотон не может сместить центр массы коробки, поскольку он не имеет массы.

Или имеет? Эйнштейн пришел к выводу, что, поскольку фотон определенно обладает энергией и импульсом, он должен иметь массу. Энергия движущегося фотона пропорциональна его массе. Рассчитать коэффициент пропорциональности можно, если учесть, что при перемещении фотона центр массы системы не смещается. Математическим путем Эйнштейн показал, что энергия и масса связаны между собой простым коэффициентом. Но в том-то и дело, что простым, но огромным: этот коэффициент равен скорости света в квадрате (примерно 1,7 х 1017 м22, то есть 17 с шестнадцатью нулями). Так получается[25] знаменитое уравнение Эйнштейна E = mc2. Это означает, что одна унция (14 г) массы эквивалентна 6 млн т тротила. Письмо Эйнштейна президенту США Рузвельту, отправленное 2 августа 1939 г., в котором ученый сообщал о возможности создания атомной бомбы, обозначило начало атомного века[26].

Возможно, вы думаете, что это было очевидно и ранее, учитывая эксперименты с радиоактивными веществами, масса которых уменьшается в процессе радиации. Однако считалось, что радиоактивные элементы содержат некое специфическое высокоэнергетическое «топливо», которое сгорает. Это предположение нельзя назвать в корне неверным. Просто дело в том, что этим «сгорающим топливом» является масса.

Почему я начал книгу с описания мысленных экспериментов Дарвина и Эйнштейна? Во-первых, по той причине, что они раскрывают фантастическую мощь человеческого мозга. Без помощи каких-либо инструментов, за исключением пера и бумаги для изображения схем этих простых мысленных экспериментов и выведения из них простых формул, Эйнштейн перевернул формировавшиеся столетиями представления о физическом мире, оказал глубокое влияние на ход истории (включая Вторую мировую войну) и открыл двери в атомный век.

Безусловно, Эйнштейн опирался на некоторые экспериментальные открытия XIX в., но и эти эксперименты были проведены с использованием достаточно простого оборудования. Также справедливо, что последующие экспериментальные доказательства теорий Эйнштейна потребовали использования более современных технологий, и если бы этого не было сделано, мы не имели бы доказательств справедливости и значимости его идей. Однако все эти замечания не умаляют того факта, что эти знаменитые мысленные эксперименты раскрывают всю мощь человеческого разума.

Эйнштейна многие считают самым выдающимся ученым XX в. (а Дарвин был бы прекрасным кандидатом на это звание в XIX в.), хотя математический аппарат в основе его теорий достаточно прост. Более важную роль в создании его теорий сыграли сами мысленные эксперименты. Поэтому можно задать вопрос: в чем именно заключалась необычайная способность Эйнштейна? Позже мы обсудим, что происходило в его голове, когда он создавал свои теории, и где именно базируются эти замечательные способности.

Однако эта история также демонстрирует ограниченность человеческого разума. Эйнштейн смог прокатиться и удержаться на солнечном луче (хотя и пришел к выводу, что это невозможно), но ведь тысячи других наблюдателей и мыслителей оказались неспособны выполнить столь простые мыслительные упражнения. Одна из общечеловеческих проблем заключается в том, что большинству людей трудно отбросить идеи современников и переступить через границы этих идей. Но есть и другие недостатки, которые мы обсудим подробнее после того, как рассмотрим механизмы функционирования новой коры головного мозга.

Унифицированная модель новой коры

Основная причина, заставившая меня в качестве вступления рассмотреть наиболее известные мысленные эксперименты в истории человечества, заключается в том, что я хочу использовать такой же подход в изучении головного мозга. Вы увидите, что мы сможем продвинуться очень далеко в анализе функционирования человеческого мозга с помощью собственных несложных мысленных экспериментов. Учитывая тему нашего исследования, мысленные эксперименты мне кажутся очень удачным методом анализа.

Если праздных мыслей молодого человека, ручки и бумаги было достаточно для совершения революционного переворота в физике, мы должны суметь достаточно далеко продвинуться в привычном упражнении – мы ведь упражняем наш мозг постоянно, в каждый момент реальной жизни и во сне.

Затем мы создадим модель мыслительного процесса и посмотрим, до какой степени можем подтвердить ее справедливость, наблюдая за реальным мозгом и самыми совершенными машинами, воспроизводящими мыслительный процесс.

Глава вторая

Мысленные эксперименты над мышлением

Я вообще редко думаю словами. Мысль приходит, и потом я могу попытаться выразить ее в словах.

Альберт Эйнштейн

Мозг, который весит три фунта и который вы можете удержать в руке, способен постичь Вселенную размером в сотни миллиардов световых лет.

Мариан Даймонд[27]

Кажется невероятным, что объект весом менее трех фунтов, состоящий из тех же атомов, что и все остальные объекты в этом мире, отвечает практически за все, что делает человек: летает на Луну и отбивает до семидесяти хоум-ранов[28], пишет «Гамлета», и строит Тадж-Махал, и даже открывает секреты самого мозга.

Жоэль Хейвманн[29]

Я начал задумываться о мышлении примерно в 1960-х гг., тогда же, когда открыл для себя компьютер. Сегодня трудно найти двенадцатилетнего ребенка, не использующего компьютер, но в то время в моем родном Нью-Йорке таких, как я, было совсем немного. Конечно, те первые экземпляры никак не могли поместиться на ладони, а тот, на котором мне позволили поработать, занимал целую большую комнату. В начале 1960-х гг. на компьютере IBM 1620 я выполнил несколько задач по анализу вариаций данных (статистический тест), собранных при подготовке образовательной программы для младших школьников. Работа над программой складывалась весьма драматично. Алгоритмы и анализируемые данные были достаточно сложны, так что мы не могли предугадать, какие ответы выдаст компьютер. Конечно, ответы определялись нашими данными, но предсказать результат было невозможно. Следует заметить, что детерминированность и предсказуемость – далеко не одно и то же, и мы еще поговорим об этом позднее.

Я помню тот волнующий момент, когда непосредственно перед окончанием расчетов лампочки на передней панели тускнели, как будто компьютер впадал в глубокую задумчивость. Когда приходили люди, ожидавшие новой серии результатов, я показывал пальцем на слабо мерцающие огоньки и говорил: «Он думает». Это было шуткой и правдой одновременно – действительно казалось, что компьютер ищет ответ, и сотрудники лаборатории в какой-то степени относились к машине как к личности. Наверное, это можно назвать антропоморфизмом, но именно тогда я начал серьезно задумываться о связи между мышлением и вычислением.

Чтобы понять, в какой степени мой собственный мозг похож на знакомую мне компьютерную программу, я начал думать о том, что должен делать мой мозг в процессе обработки информации. Я занимался этим вопросом на протяжении пятидесяти лет. Все, что я расскажу дальше о наших современных представлениях относительно функционирования мозга, будет очень сильно отличаться от стандартной концепции компьютерной обработки информации. Однако на самом деле мозг действительно хранит и обрабатывает информацию, а ввиду универсальности вычислительного процесса между мозгом и компьютером гораздо больше общего, чем может показаться на первый взгляд.

Каждый раз, когда я что-то делаю или о чем-то думаю – чищу зубы, прохожу через кухню, решаю деловые проблемы, играю на музыкальной приставке или обдумываю новую задачу, – я пытаюсь понять, как мне это удается. И еще больше я думаю о вещах, которые я не умею делать, поскольку определение пределов человеческой мысли обеспечивает не менее важный набор данных. Такое количество размышлений о мышлении вполне могло бы затормозить мою активность, однако, к счастью, эти эксперименты по наблюдению за самим собой позволяют мне усовершенствовать мыслительный процесс.

Чтобы лучше понять механизм работы нашего мозга, давайте проделаем несколько мысленных экспериментов.

Попробуйте следующее: повторите алфавит.

Думаю, вы помните его с детства и сделаете это без труда.

Хорошо, теперь попробуйте повторить алфавит задом наперед.

Если вы раньше не пытались выучить алфавит таким образом, вполне вероятно, что вы сочтете это задание невыполнимым. Возможно, кто-нибудь, кто провел особенно много времени в начальной школе, где на стенах классной комнаты вывешен алфавит, может напрячь визуальную память и прочесть алфавит задом наперед. Однако даже эта задача окажется непростой, поскольку мы обычно не помним всю картинку целиком. Кажется, прочесть алфавит в одну и в другую сторону одинаково просто, поскольку в нем содержится одинаковая информация, однако мы не можем этого сделать.

Помните номер своего страхового полиса? Если да, попробуйте назвать его задом наперед, не записывая предварительно на бумажке. А как насчет какого-нибудь коротенького детского стишка? Для компьютера это тривиальная задача, а вот нам с ней не справиться, разве что мы начнем заучивать этот обратный порядок букв заново. На этом основании можно сделать кое-какие важные выводы относительно организации человеческой памяти.

Конечно, мы легко справимся с этой задачей, если запишем последовательность, а затем прочтем ее в обратном направлении. В этом процессе мы используем некую технологию – письменность – для преодоления ограничений наших мыслительных способностей. Письменность – очень древнее изобретение человека, второе после разговорного языка. Вот почему мы придумываем орудия – чтобы восполнить собственные недостатки.

Из сказанного выше следует, что наши воспоминания организованы в определенном порядке и могут воспроизводиться именно в том порядке, в котором запоминались. Мы не можем напрямую воспроизвести сохраненную в памяти информацию в обратном порядке.

Нам так же трудно воспроизвести последовательность, начиная с середины. Если я заучиваю фортепианную пьесу, обычно я не могу начать с любого места. Есть несколько моментов, с которых я могу продолжать играть дальше, поскольку последовательность моих воспоминаний состоит из фрагментов. Однако если я пытаюсь начать с середины фрагмента, мне придется вернуться к нотам, чтобы включить память.

Далее попробуйте проделать следующий эксперимент: вспомните свою прогулку, совершенную день или несколько дней назад. Что вы помните?

Этот мысленный эксперимент лучше всего проводить, если вы ходили гулять совсем недавно – сегодня утром или вчера (это не обязательно должна быть прогулка, это может быть поездка на машине или любая другая деятельность, в процессе которой вы перемещались в пространстве).

Вполне вероятно, что вы мало что можете вспомнить. Кто был пятым встреченным вами человеком (считая не только знакомых)? Видели ли вы по дороге дубы? Почтовый ящик? Что вы увидели, когда первый раз завернули за угол? Если вы проходили мимо магазинов, что вы видели во второй витрине? Возможно, вам удастся ответить на некоторые из этих вопросов на основании нескольких элементов, которые сохранились в вашей памяти, но скорее всего вы вспомните мало подробностей, хотя все это происходило совсем недавно.

Если вы ходите гулять регулярно, попытайтесь вспомнить первую прогулку (или дорогу на работу) в прошлом месяце. Вероятнее всего, вы не сумеете припомнить никаких особых подробностей, но даже если сможете, то их будет еще меньше, чем подробностей утренней прогулки.

Позднее я обращусь к теме сознания и расскажу о том, что мы склонны приравнивать сознание к событийной памяти. Почему мы считаем, что пребываем в бессознательном состоянии, находясь под наркозом? В первую очередь, по той причине, что мы ничего не помним об этом периоде времени (хотя из данного правила есть удивительные и непонятные исключения). Можно ли сделать вывод, что бо́льшую часть времени на прогулке мы находились в бессознательном состоянии? Это вполне законный вопрос, учитывая, что мы не помним практически ничего о том, что видели или о чем думали.

Я, к примеру, могу вспомнить некоторые подробности своей сегодняшней утренней прогулки. Я помню, что думал об этой книге, но не могу сказать, что именно. Помню, что встретил женщину с детской коляской. Женщина мне показалась симпатичной, да и ребенок был очень мил. Я помню две свои мысли по этому поводу: 1) «Малыш очарователен, как мой младший внук» и 2) «Как этот ребенок воспринимает то, что видит вокруг себя?» Я не могу вспомнить то, как эти люди были одеты, или цвет их волос (моя жена скажет, что она не удивлена). Однако, хотя я не могу описать встреченную женщину, у меня почему-то есть ощущение, что я смог бы найти ее фотографию среди фотографий нескольких других женщин. Таким образом, даже если моя память сохранила что-то, касающееся этой женщины, я не могу визуально представить ни женщину, ни коляску, ни ребенка. В моей голове нет «фотографии» или «видео» с их изображением. Трудно сказать определенно, что именно сохранилось в памяти после этой встречи.

Могу сказать, что некоторое время назад во время прогулки я встречал и других женщин с детьми в колясках. Но в этом случае, мне кажется, я не смог бы даже узнать их на фотографии. Эти воспоминания теперь гораздо менее яркие, чем были непосредственно после встречи.

Теперь попытайтесь вспомнить людей, с которыми встречались всего один или два раза в жизни. Вы отчетливо их себе представляете?

Если вы художник или фотограф, возможно, ваша наблюдательность развита достаточно хорошо, но обычно люди не могут визуально представить себе или достаточно подробно описать тех, кого встречали лишь случайно, хотя и способны узнать их по фотографии.

Все это говорит о том, что в головном мозге не хранятся фото- или видеоизображения и звукозаписи. Наши воспоминания хранятся в виде последовательности образов. Невостребованные воспоминания постепенно стираются. Когда в полиции составляют портрет подозреваемого в совершении преступления, у свидетелей не спрашивают, какие брови были у злоумышленника. Им показывают серию изображений и просят выбрать наиболее похожий вариант. «Правильный» набор изображений вызывает в памяти свидетеля соответствующую картинку.

Теперь взгляните на лица людей, которых все вы хорошо знаете. Узнаёте кого-нибудь из них?

Рис.3 Эволюция разума, или Бесконечные возможности человеческого мозга, основанные на распознавании образов

Вы, безусловно, смогли их узнать, хотя фотографии частично скрыты или искажены. Это пример иллюстрирует важнейшую способность человеческого мозга: мы можем распознавать рисунок, даже если воспринимаем (видим, слышим, чувствуем) лишь его часть и даже если он в некоторой степени изменен. Наша способность к распознаванию образов, по-видимому, опирается на инвариантные фрагменты рисунка – характеристики, которые не изменяются в условиях реальных вариаций. Видимые искажения, свойственные карикатуре или некоторым видам живописи (например, импрессионизму), подчеркивают характеристики образа (человека или объекта), который мы узнаем даже при изменении других деталей. В настоящее время искусство опережает науку в определении способностей человеческого восприятия. Тот же механизм мы используем, когда узнаём мелодию всего по нескольким нотам.

Теперь взгляните на это изображение:

Рис.4 Эволюция разума, или Бесконечные возможности человеческого мозга, основанные на распознавании образов

Изображение это воспринимается неоднозначно: черный треугольник может обозначать как углубление, так и выступ. Вначале вы воспринимаете его либо тем, либо иным образом, но при определенном усилии можете переключиться на альтернативный вариант. Однако, если ваш мозг настроился на одно объяснение, может оказаться трудным взглянуть на вещи с другой точки зрения (это относится и к интеллектуальным проблемам). Интерпретация изображения вашим мозгом влияет на ваше восприятие: если вы считаете треугольник выступом, мозг интерпретирует серый участок как тень, и он не кажется таким темным, как когда вы воспринимаете треугольник в качестве углубления.

Таким образом, наш осознанный опыт восприятия изменяется в зависимости от интерпретации.

Подумайте, мы ведь видим то, что ожидаем…

Я уверен, что вы смогли закончить предложение.

Если бы я дописал последнее слово, вам бы понадобилось лишь скользнуть по нему взглядом, чтобы подтвердить, что вы именно этого и ожидали.

Таким образом, мы постоянно предсказываем будущее и составляем гипотезы о том, что произойдет. Это ожидание влияет на наше восприятие. На самом деле главная причина, почему у нас вообще есть мозг, состоит в необходимости предсказывать будущее.

Рассмотрим каждому из нас хорошо знакомый пример: время от времени по непонятной причине у нас в голове возникают воспоминания многолетней давности.

Часто это воспоминание о каком-то человеке или событии, о котором вы не думали уже долгое время. Очевидно, что-то стало импульсом, вызвавшим это воспоминание. Иногда ход ваших мыслей можно объяснить. Иногда вы можете восстановить последовательность мыслей, вызвавших это воспоминание, но не способны ее выразить. Часто импульс быстро пропадает, и вам кажется, что мысль пришла «ниоткуда». Ко мне такие случайные воспоминания часто приходят, когда я занят какими-то рутинными делами, например чищу зубы. Иногда мне удается найти связь: свалившаяся со щетки паста напоминает мне о краске, капавшей с кисточки на уроке рисования в школе. Иногда у меня бывает лишь смутное ощущение, что связь есть, а иногда я не нахожу никакого объяснения. Близкое по сути явление, которое также знакомо каждому, состоит в попытках вспомнить имя или слово. В таких случаях мы сами пытаемся подобрать те импульсы, которые могли бы вызвать в памяти необходимую информацию. Например: Кто играл королеву Падме в «Звездных войнах»? Дайте подумать, кажется, недавно она же снималась в какой-то драме о балерине… А, это был «Черный лебедь». Ну конечно, Натали Портман! Иногда мы прибегаем к специфической мнемонике. Например: Она скорее худая, чем толстая, ну да, Портман, Натали Портман![30] Некоторые из наших воспоминаний достаточно прочны, так что мы можем непосредственно от вопроса (например, кто играл королеву Падме?) перейти к ответу, но иногда приходится перебрать серию импульсов, пока мы не найдем тот, который сработает. Это в значительной степени напоминает поиск нужной ссылки в Интернете. Воспоминания на самом деле могут оказаться утерянными, как странички Интернета, к которым не ведут никакие ссылки (или мы не можем их найти).

Когда выполняете какое-нибудь привычное действие (натягиваете рубашку) – проследите за собой и подумайте, в какой степени вы каждый раз следуете одной и той же схеме. Мои личные наблюдения (как я уже говорил, я постоянно наблюдаю за самим собой) свидетельствуют, что человек обычно выполняет привычные действия в одном и том же порядке, хотя иногда требуется подключение дополнительных модулей. Например, почти все мои рубашки без запонок, но, когда попадается рубашка с запонками, приходится выполнять дополнительную серию движений.

Стадии всех процессов записаны в моей голове в иерархическом порядке. Прежде чем идти спать, я выполняю стандартную серию процедур. Сначала чищу зубы. Однако этот процесс, в свою очередь, тоже состоит из нескольких этапов, первый из которых заключается в том, чтобы выдавить пасту на щетку. Этот этап тоже подразумевает несколько организованных действий: найти пасту, отвернуть колпачок и т. д. Стадия поиска пасты тоже состоит из более мелких стадий – в первую очередь нужно открыть дверь в ванную комнату. Эта вложенность действий продолжается до мельчайших деталей, так что наш вечерний туалет состоит буквально из сотен маленьких движений. И, хотя мне трудно вспомнить подробности прогулки, состоявшейся всего несколько часов назад, для меня не составляет никакой проблемы назвать все многочисленные этапы подготовки ко сну, которых так много, что, пока я их выполняю, я могу думать совершенно о других вещах. Важно отметить, что в нашей голове этот план не хранится в виде одного длинного списка из сотен движений, но каждая рутинная процедура записана как сложная иерархическая цепь вложенных действий.

Тот же иерархический механизм задействован в нашей способности распознавать объекты и ситуации. Мы узнаём лица знакомых людей, а также узнаём на этих лицах глаза, нос, рот и т. д. – это иерархия образов, которую мы применяем как для восприятия, так и для действий. Иерархия позволяет нам использовать одни и те же образы. Например, нам не нужно заново изучать, что такое нос или рот, каждый раз, когда мы видим новое лицо.

В следующей главе мы соберем результаты наших мысленных экспериментов в единую теорию, описывающую механизмы работы новой коры. Я покажу, что эти эксперименты отражают важнейшие и общие принципы мышления, одинаковые для поиска зубной пасты и сочинения стихов.

Глава третья

Модель новой коры; теория мысленного распознавания образов

Головной мозг – это ткань. Сложно сплетенная ткань, не похожая ни на что другое во Вселенной, но так же состоящая из клеток, как любая другая ткань. Это, безусловно, высокоспециализированные клетки, но функционируют они по тем же законам, что и любые другие клетки. Можно определить, зарегистрировать и интерпретировать их электрические и химические сигналы, идентифицировать химические молекулы и составить карту нервных сплетений. Короче говоря, мозг можно изучать так же, как изучают почку.

Д. Х. Хьюбел[31]

Предположим, что есть машина, производящая мысли, чувства и ощущения; вообразим, что эта машина увеличилась, но сохранила те же пропорции, так что вы можете войти в нее, как на мельницу. Вы можете осмотреть ее изнутри, но что вы там увидите? Только детали, которые толкают и двигают друг друга, и ничего другого, что могло бы объяснить восприятие.

Готфрид Вильгельм Лейбниц, 1714

Иерархия образов

Я повторял описанные выше простые эксперименты и наблюдения тысячи раз в самых разных ситуациях. Выводы из этих наблюдений неизбежно ограничивают мое представление о том, как должен работать мозг – точно так же, как простые эксперименты XIX в. по анализу времени, пространства и массы сдерживали размышления молодого Эйнштейна об устройстве Вселенной. Далее я остановлюсь на некоторых наблюдениях из нейробиологии, стараясь избегать многих пока еще неизвестных подробностей.

Прежде всего, позвольте мне объяснить, почему в этом разделе я считаю нужным поговорить о неокортексе (что в переводе с латыни буквально означает «новая кора»). Мы знаем, что именно новая кора отвечает за нашу способность обрабатывать информацию и что функционирует она по иерархическому принципу. Животные, не имеющие новой коры (в основном не млекопитающие), в большинстве своем не способны понимать иерархические построения[32]. Понимание и использование иерархической природы реальности являются исключительной способностью млекопитающих и объясняются наличием у них этой новой в эволюционном плане структуры головного мозга. Новая кора отвечает за чувственное восприятие, распознавание видимых объектов и абстрактных понятий, контроль движений, размышления (от пространственной ориентации до рационального мышления) и речь, то есть за все то, что мы называем «разумом».

Новая кора человеческого мозга, его самый внешний слой, представляет собой тонкую, практически двумерную структуру (ее толщина составляет около 2,5 мм). У грызунов она гладкая и имеет толщину почтовой марки. Эволюционной инновацией у приматов стала сложная складчатость этой структуры, образующей на поверхности остального мозга глубокие морщины, складки и бороздки, увеличивающие площадь ее поверхности. Благодаря этой сложной складчатости новая кора составляет основную часть человеческого мозга – около 80 % по массе. Высокий лоб Homo sapiens позволяет дополнительно увеличить размер новой коры. В частности, лобная доля мозга отвечает за обработку абстрактной информации и формирование сложных понятий.

Эта тонкая структура мозга состоит из шести основных слоев – от слоя I (внешний) до слоя VI. Аксоны (выходные контакты), отходящие от нервных клеток на уровне слоев II и III, проецируются в другие участки новой коры. Аксоны, отходящие от слоев V и VI, вне новой коры связываются с таламусом, стволом мозга и спинным мозгом. Нейроны слоя IV принимают синаптические (входные) сигналы от нейронов, находящихся вне новой коры, особенно в таламусе. В разных отделах мозга число слоев коры может незначительно изменяться. В моторной коре слой IV очень тонкий, поскольку в этой зоне он практически не принимает сигналов от таламуса, ствола мозга или спинного мозга. Напротив, в затылочной доле (зоне новой коры, ответственной за зрение) слой IV имеет три дополнительных подслоя, поскольку в эту область приходит множество сигналов, в том числе от таламуса.

Важнейшая особенность новой коры – удивительная однородность ее основных структур. Впервые это заметил американский нейробиолог Вернон Маунткасл (1918–2015). В 1957 г. он открыл колончатую структуру новой коры. В 1978 г. он обнаружил закономерность, которая была так же важна для нейробиологии, как эксперименты Майкельсона и Морли в 1831 г. для физики. Он описал удивительно однородную организацию новой коры и высказал гипотезу, в соответствии с которой кора построена по единому принципу, воспроизводимому множество раз[33], а в качестве основного модуля этой структуры Маунткасл назвал кортикальную колонку. Изменение высоты некоторых слоев в различных отделах мозга объясняется лишь разным числом связей этих отделов с другими структурами.

Маунткасл предположил, что колонки состоят из мини-колонок, но эта гипотеза не получила поддержки, поскольку не было найдено никаких видимых границ подобных структур. Однако активные экспериментальные исследования показали, что, действительно, в нейронной ткани каждой колонки имеются повторяющиеся единицы. Я считаю, что основной структурной единицей новой коры являются распознающие модули. В отличие от мини-колонок Маунткасла, эти модули не разделены никакими физическими границами, поскольку расположены очень близко друг к другу и связаны между собой, так что кортикальная колонка – это просто агрегат большого числа таких модулей. Со временем распознающие модули могут скручиваться друг с другом, так что сложное соединение модулей, которое мы наблюдаем в новой коре, не определяется генетическим кодом, а формируется постепенно в зависимости от тех образов, которые нам приходится распознавать. Я подробнее остановлюсь на этом позднее; важно, чтобы вы поняли, как организована новая кора.

Прежде чем мы продолжим исследовать структуру новой коры, хочу заметить, что чрезвычайно важно осуществлять моделирование поведения сложных систем на правильно выбранном уровне. Хотя химия теоретически основана на физике и может быть выведена из законов физики, на практике сделать это невозможно, поэтому химия создала собственные законы и модели. Аналогичным образом из законов физики можно вывести законы термодинамики, но, если у нас имеется достаточное количество частиц, чтобы мы могли назвать их скопление газом, решение физических уравнений для взаимодействий всех частиц становится безнадежным делом, а вот законы термодинамики отлично работают. Точно так же биология создала свои собственные законы и модели. Единственная клетка поджелудочной железы чрезвычайно сложна, особенно если мы рассматриваем ее поведение на уровне молекул; значительно проще осуществить моделирование функций клеток поджелудочной железы в регуляции уровня инсулина и пищеварительных ферментов.

Тот же принцип применим к моделированию и изучению функций мозга. Безусловно, важной и необходимой задачей для проектирования мозга является создание моделей взаимодействий на межмолекулярном уровне, однако цель всего процесса главным образом заключается в уточнении модели, которая описывает, каким образом мозг перерабатывает информацию, превращая ее в знания.

Американский ученый Герберт А. Саймон (1916–2001), которого считают одним из отцов теории искусственного интеллекта, очень красочно выразился по поводу того, насколько важно выбрать правильный уровень абстракции для анализа сложных систем. В 1973 г. по поводу созданной им программы искусственного интеллекта EPAM (elementary perceiver and memorizer) Саймон писал следующее: «Представьте себе, что вы хотите понять имеющуюся у меня загадочную программу EPAM. Я могу дать вам две версии этой программы. Первая версия – это та, в которой программа была исходно написана, – со всеми составляющими ее компонентами и подпрограммами… Вторая – полностью трансформированная версия EPAM, переведенная на машинный язык… Я думаю, не стоит долго объяснять, какая версия представляет более краткое, значимое и понятное описание… Третью я вам предлагать не стану, поскольку это окажется даже не программа, а электромагнитные уравнения и граничные условия, которым компьютер как физическая система должен подчиняться. И это будет кульминация сокращения и непостижимости»[34].

В новой коре человека содержится около полумиллиона кортикальных колонок, каждая из которых составляет около 2 мм в высоту и 0,5 мм в ширину и содержит около 60 тыс. нейронов (таким образом, в сумме в новой коре содержится около 30 млрд нейронов). В общем, каждый распознающий модуль кортикальной колонки содержит около 100 нейронов, а всего в новой коре имеется порядка 300 млн распознающих модулей.

Рис.5 Эволюция разума, или Бесконечные возможности человеческого мозга, основанные на распознавании образов

Теперь мы обратимся к рассмотрению механизмов работы распознающих модулей, однако должен заметить, что, честно говоря, совершенно непонятно, с чего же следует начинать. В новой коре все происходит одновременно, так что в этих процессах нет ни начала, ни конца. Мне часто придется упоминать явления, которые я еще не объяснил, а только собираюсь объяснить, так что прошу вас запастись терпением.

Человек лишь в небольшой степени способен к логическим размышлениям, зато прекрасно умеет распознавать образы. Для логического мышления нам приходится использовать новую кору, которая и является большим распознающим модулем. Это далеко не идеальный механизм для осуществления логических преобразований, но другого у нас нет. Сравним, к примеру, как играют в шахматы человек и специальная компьютерная программа. В 1997 г. компьютер DeepBlue, обыгравший чемпиона мира среди людей Гарри Каспарова, был способен за секунду логически анализировать последствия 200 млн комбинаций на доске (то есть последовательностей ходов и ответных ходов). Сейчас на такое способны некоторые персональные компьютеры. Каспаров в ответ на вопрос, сколько комбинаций он может анализировать за секунду, ответил, что менее одной. Как же в таком случае он вообще мог сражаться против DeepBlue? Ответ заключается в исключительной способности человека распознавать образы. Однако эту способность нужно тренировать – вот почему не каждый из нас мастерски играет в шахматы.

Каспаров знал примерно 100 тыс. шахматных комбинаций. Это реальное число – по нашим расчетам, специалист в какой-либо сфере деятельности должен уметь оперировать примерно 100 тыс. «элементами» знаний. В пьесах Шекспира использовано около 100 тыс. предложений (в которых задействовано около 29 тыс. слов, но большинство из них использовано разными способами). Анализ медицинской экспертной системы, созданной для воспроизведения знаний обычного врача, показал, что врач оперирует примерно 100 тыс. понятий в своей области. Распознавание «элемента» знаний из такого хранилища информации является далеко не простой задачей, поскольку все элементы слегка изменяются при каждом новом обращении к ним.

Вооруженный этими знаниями, Каспаров смотрит на шахматную доску и сравнивает каждую конкретную комбинацию со всеми знакомыми ему 100 тыс. комбинаций, причем все 100 тыс. сравнений он производит одновременно. В этом вопросе наблюдается полный консенсус: все наши нейроны одновременно участвуют в обработке изображения. Это не означает, что все они одновременно возбуждаются (в такой ситуации мы, возможно, не могли бы удержаться на ногах), но выполнение их функции подразумевает возможность возбуждения.

Сколько образов может хранить новая кора? Здесь необходимо учесть явление избыточности. Например, лицо любимого человека хранится не в виде единого образа, а записано тысячи раз. Некоторые из этих повторов представляют собой изображения практически одного и того же лица, тогда как другие показывают его в разных ракурсах, при разном освещении, с разным выражением и т. д. Никакие из этих повторяющихся образов не хранятся в виде истинных рисунков (то есть в виде двумерного набора пикселов). Скорее, они хранятся в виде списков признаков, в которых составные элементы образа сами являются образами. Чуть позже мы подробнее поговорим о том, как устроена эта иерархия признаков.

Если принять, что база знаний специалиста в какой-либо области состоит из 100 тыс. «единиц» знания (то есть образов) при избыточности примерно 100:1, получается, что мозг хранит около 10 млн образов. Эти специфические знания основаны на более общих знаниях и дополняются более глубокими и узкоспециальными знаниями, так что общее число образов повышается до 30 или 50 млн. Однако наши «бытовые» знания, которые мы используем в каждодневной жизни, еще шире; знание «законов улицы» требует от нашей новой коры значительно больше, чем «книжное знание». Если учесть эти бытовые знания и упомянутый выше фактор избыточности, мы получим, что общее число образов, хранящихся в нашей новой коре, превышает 100 млн. Отметим, что фактор избыточности не постоянная величина – часто используемые образы могут повторяться тысячи раз, а новые явления имеют фактор избыточности менее десяти.

Как я расскажу позднее, наши действия и навыки также составляют образы и тоже хранятся в отделах коры, так что, по моим оценкам, общий объем информации в человеческой новой коре составляет несколько сотен миллионов образов. Эта приблизительная оценка вполне соответствует числу распознающих элементов коры, которое, как мы уже определили, составляет около 300 млн. Поэтому вполне резонно предположить, что функция каждого распознающего элемента новой коры состоит в обработке одной итерации образа (то есть одной копии среди множества повторяющихся копий образов). Наши оценки числа образов, которые может обрабатывать человеческий мозг (с учетом необходимой избыточности), и числа физических распознающих элементов привели нас к величинам одного порядка. Замечу, что, когда я говорю об «обработке» образа, я имею в виду все процессы, которые мы можем с ним (и его частями) проделать: изучить, предсказать, узнать и использовать (либо путем дальнейшего осмысления, либо путем применения образа физического перемещения).

Процессор, обрабатывающий 300 млн образов, кажется весьма серьезным аппаратом; и действительно, он позволил Homo sapiens создать устную и письменную речь, все наши многочисленные инструменты и творения. Одни изобретения вызывали к жизни другие, что привело к экспоненциальному росту информационного содержания технологий, который я описываю с помощью закона ускорения отдачи. Никакие другие существа не способны на такое. Как я уже говорил, ряд животных, включая шимпанзе, по-видимому, обладают рудиментарными способностями понимать и произносить слова, а также использовать примитивные орудия. У них, вообще говоря, тоже есть новая кора, однако их способности ограничиваются небольшим размером коры, особенно лобных долей. Размер нашей новой коры позволил нам создавать еще более мощные инструменты, включая те, которые теперь помогают нам изучать собственный разум. Когда-нибудь наш мозг вместе с созданными нами технологиями позволит сотворить искусственную новую кору, в которой будет не 300 млн процессоров, а значительно больше. Может быть, миллиард? Или триллион?

Структура образа

Теория мысленного распознавания образов, которую я хочу вам представить, основана на распознавании образов распознающими модулями новой коры. Эти образы (и модули) организованы иерархическим путем. Ниже я расскажу о том, как возникла эта идея, в том числе поведаю о собственных экспериментах 1980–1990-х гг. и о модели коры Джефа Хокинса и Дайлипа Джорджа, созданной в начале 2000-х гг.

Рис.6 Эволюция разума, или Бесконечные возможности человеческого мозга, основанные на распознавании образов

Каждый образ (распознаваемый одним из примерно 300 млн распознающих модулей новой коры) состоит из трех элементов. Первый – это входной сигнал из образов низшего порядка, формирующих основной образ. Нет необходимости в повторении описания каждого из этих образов низшего порядка для каждого образа более высокого порядка, в котором они содержатся. Например, многие образы слов содержат букву «А». Нет нужды повторять описание буквы «А» во всех этих образах слов – они используют одно и то же описание. Это можно сравнить со страничкой в Интернете: в Интернете есть одна страница с описанием буквы «А» (один образ), и все страницы для слов (образы слов), содержащих букву «А», связаны с этой страницей (с образом буквы «А»). Вместо ссылок новая кора использует реальные нервные связи. Аксон от модуля, распознающего букву «А», связан с множеством дендритов – по одному для каждого слова с буквой «А». Но не забывайте и об избыточности коры: для распознавания буквы «А» существует несколько модулей. Любой из них может посылать сигнал модулям, распознающим слова с буквой «А».

Второй элемент каждого образа – его имя. Если речь идет о звуковых образах, этот образ более высокого порядка – просто слово, например «яблоко» (apple). Хотя мы напрямую применяем новую кору для понимания и использования речи, большинство образов в коре не являются языковыми образами. «Имя» образа в новой коре – это просто аксон, выходящий из каждого модуля; возбуждение аксона означает распознавание соответствующего образа. Возбуждение аксона означает, что распознающий модуль «называет имя» образа: «Эй, ребята, я увидел слово “яблоко”!»

Рис.7 Эволюция разума, или Бесконечные возможности человеческого мозга, основанные на распознавании образов

Три повторяющихся (но слегка отличных друг от друга) образа «А» включаются в образы более высокого порядка, содержащие букву «А».

Третий и последний элемент образа – это набор образов более высокого порядка, в состав которых он входит. Для буквы «А» это все слова с буквой «А». Здесь вновь уместно сравнение с веб-страницей. Каждый распознанный образ более низкого порядка запускает распознавание образа более высокого порядка, содержащего первый образ. В новой коре эти связи осуществляются дендритами, соединяющимися с нейронами в каждом распознающем модуле коры. Помним, что каждый нейрон может получать сигналы от множества дендритов, но выдает единственный сигнал на аксон. Этот аксон, однако, может, в свою очередь, передавать сигнал множеству дендритов.

В качестве примера рассмотрим набор знаков, использующихся для изображения печатных букв. Здесь каждый уровень – это образ. Формы – это образы, буквы – образы, слова – тоже образы. Каждый образ характеризуется серией входных сигналов, процессом распознавания образа в модуле и выходным сигналом, поступающим к распознающему модулю более высокого порядка.

Из нижней левой точки к центру верхней линии:

Рис.8 Эволюция разума, или Бесконечные возможности человеческого мозга, основанные на распознавании образов

Из нижней правой точки к центру верхней линии:

Рис.9 Эволюция разума, или Бесконечные возможности человеческого мозга, основанные на распознавании образов

Горизонтальная перекладина:

Рис.10 Эволюция разума, или Бесконечные возможности человеческого мозга, основанные на распознавании образов

Левая вертикаль:

Рис.11 Эволюция разума, или Бесконечные возможности человеческого мозга, основанные на распознавании образов

Дуга в нижней области:

Рис.12 Эволюция разума, или Бесконечные возможности человеческого мозга, основанные на распознавании образов

Нижняя горизонталь:

Рис.13 Эволюция разума, или Бесконечные возможности человеческого мозга, основанные на распознавании образов

Верхняя горизонталь:

Рис.14 Эволюция разума, или Бесконечные возможности человеческого мозга, основанные на распознавании образов

Средняя горизонталь:

Рис.15 Эволюция разума, или Бесконечные возможности человеческого мозга, основанные на распознавании образов

Петля в верхней левой области:

Рис.16 Эволюция разума, или Бесконечные возможности человеческого мозга, основанные на распознавании образов

Перечисленные образы составляют образ более высокого порядка, относящийся к категории печатных букв (в новой коре, конечно, таких формальных категорий не существует).

Буква А:

Рис.17 Эволюция разума, или Бесконечные возможности человеческого мозга, основанные на распознавании образов

Два разных образа, составляющих букву «А» и два разных образа более высокого порядка (APPLE и PEAR), в состав которых входит «А».

Буква P:

Рис.18 Эволюция разума, или Бесконечные возможности человеческого мозга, основанные на распознавании образов

Образы, из которых складывается образ более высокого порядка – буква «P».

Буква L:

Рис.19 Эволюция разума, или Бесконечные возможности человеческого мозга, основанные на распознавании образов

Образы, из которых складывается образ более высокого порядка – буква «L».

Буква E:

Рис.20 Эволюция разума, или Бесконечные возможности человеческого мозга, основанные на распознавании образов

Образы, из которых складывается образ более высокого порядка – буква «E».

Эти образы букв соединяются в образ еще более высокого порядка, относящийся к категории слов (в нашем с вами языке – для новой коры это лишь образ определенного порядка): APPLE.

Рис.21 Эволюция разума, или Бесконечные возможности человеческого мозга, основанные на распознавании образов

В другой части коры имеет место аналогичная иерархия распознающих модулей, участвующих в обработке образов реальных объектов (а не печатных букв). Если вы смотрите на настоящее яблоко, модули низшего уровня находят округлые формы и образы цвета кожицы, в результате чего происходит возбуждение соответствующего аксона и подается знак: «Эй, ребята, я увидел настоящее яблоко!» Возбуждение аксонов распознающих модулей в слуховой коре, участвующих в определении частоты звуковых сигналов, в ответ на произнесенное кем-то слово «яблоко» даст знак: «Только что прозвучало слово “яблоко”!»

Опять же, помним об избыточности модулей – мы имеем не по одному распознающему модулю для каждого вида яблока (увиденного или услышанного слова «яблоко» и реального яблока). Скорее всего, происходит возбуждение сотен таких модулей, если не больше. Избыточность не только повышает вероятность успешного узнавания всех форм яблока, но и помогает распознавать варианты настоящих яблок. Существуют распознающие модули для узнавания самых разных видов яблок – всех сортов, цветов и форм.

Кроме того, не забываем о том, что описанная выше иерархия является иерархией понятий. Распознающие элементы на самом деле не выстраиваются каким-либо иерархическим образом относительно друг друга; новая кора тонкая и по высоте равна лишь одному распознающему элементу. Концептуальная иерархия создается за счет взаимодействий между отдельными распознающими элементами.

Важным элементом теории мысленного распознавания образов является описание процесса распознавания в каждом распознающем модуле. В модель заложен параметр «веса» входного сигнала каждого дендрита; этот параметр определяет важность данного сигнала для распознавания. Модули характеризуются пороговым значением возбуждения (преодоление этого значения говорит о том, что сигнал успешно узнается соответствующим распознающим модулем). Для возбуждения распознающего модуля не обязательно нужны все входные сигналы. Модуль может возбуждаться, например, при отсутствии входного сигнала с малым весом, но при отсутствии важного сигнала возбуждение вряд ли возможно. Возбуждение распознающего модуля обычно означает следующее: «Образ, за узнавание которого я отвечаю, скорее всего, присутствует».

Однако успешное распознавание модулем соответствующего образа заключается не только в подсчете входных сигналов (и в учете параметра их значимости). Важна также величина сигнала. Каждый входной сигнал, кроме того, описывается параметром, указывающим ожидаемую величину сигнала, и параметром, учитывающим вариабельность этой величины. В качестве примера рассмотрим распознающий модуль, ответственный за узнавание в речи слова steep (произносится «стиип» – «крутой», «высокий»). Слово состоит из четырех звуков: [s], [t] [E] и [p]. Звук [t] относится к так называемым зубным согласным; это означает, что звук производится воздухом, нарушающим контакт между языком и верхними зубами. Звук [t] практически невозможно произносить медленно. Глухой звук [p] относится к «взрывным согласным»; он образуется при открытии блокированного голосового тракта (перекрытого губами в случае [p]). Это тоже быстрый звук. Гласный звук [E] образуется за счет резонанса голосовых связок при открытом рте. Он относится к долгим гласным звукам, то есть длится гораздо дольше, чем согласные [t] и [p], однако его длительность может изменяться в широких пределах. Звук [s] относится к свистящим согласным; он возникает при прохождении воздуха через щель между сжатыми зубами. Его длительность обычно меньше, чем у долгих гласных звуков, таких как [E], но тоже может изменяться (звук [s] можно произнести быстро, а можно протянуть).

В нашей работе по распознаванию речи мы установили, что для распознавания звуковых образов этот тип информации должен быть закодирован. Например, слова steep и step (произносится «стэп» – «шаг», «этап») достаточно похожи. Хотя звуки [e] в слове step и [E] в слове steep звучат немного по-разному (имеют разные резонансные частоты), нельзя достоверно различить эти два слова лишь на этом основании. Гораздо надежнее основываться на длительности звучания гласных в этих двух словах: [e] в слове step звучит короче, чем [E] в слове steep.

Эту информацию можно закодировать с помощью двух параметров – ожидаемой величины (в данном случае длительности) и степени ее вариабельности. В нашем примере звуки [t] и [p] в слове steep характеризуются очень малой ожидаемой длительностью и малой вариабельностью (это означает, что мы не ожидаем услышать долгих звуков [t] и [p]). Звук [s] характеризуется малой ожидаемой длительностью, но большей вариабельностью, поскольку этот звук можно протянуть. Наконец, звук [E] имеет большую ожидаемую длительность и высокую степень вариабельности.

В этом примере величина – это длительность, но длительность – лишь одна из нескольких возможных характеристик величины сигнала. В нашей работе по распознаванию знаков мы обнаружили, что для распознавания печатных букв важна соответствующая пространственная информация (например, ожидается, что точка над i будет значительно меньше палочки). На более высоком понятийном уровне новая кора имеет дело с самыми разными совокупностями информации, такими как уровень притягательности, иронии, удовольствия, расстройства, и множеством других. Мы можем найти сходство между еще более различающимися совокупностями, чем Дарвин, который связал размер геологических разломов с различиями между видами организмов.

Источником данных параметров для головного мозга является собственный опыт мозга. Когда мы родились, мы ничего не знали о фонемах (звуковых единицах языка), кроме того, разные языки очень сильно различаются по фонетическим характеристикам. Это означает, что многочисленные примеры образа записываются в виде параметров для каждого распознающего модуля (поскольку ожидаемое распределение величин входных сигналов определяется в результате множества экспозиций). В некоторых программах искусственного интеллекта такие параметры кодируются экспертами (например, лингвисты могут назвать ожидаемую длительность различных фонем). В ходе наших исследований мы поняли, что лучше заставить программу самостоятельно определить параметры на основе тренировочных данных (примерно так, как это делает мозг). Иногда мы использовали смешанный подход, то есть снабжали систему человеческой интуицией (для начальных установок параметров), а затем заставляли ее уточнить эти оценки путем обучения на реальных речевых примерах.

Что же делает распознающий модуль? Он вычисляет вероятность (основанную на предыдущем опыте) того, что тот образ, за распознавание которого он отвечает, действительно представлен активными входными сигналами. Каждый поступающий на модуль сигнал активен в том случае, если возбужден соответствующий распознающий модуль более низкого порядка (это означает, что произошло распознавание образа более низкого порядка). Каждый входной сигнал также кодирует наблюдаемую величину сигнала (в подходящем измерении – в единицах времени, каких-то физических величин или иных параметров), так что эти величины сравниваются модулем с соответствующими величинами предыдущих сигналов для расчета вероятности того, что это «правильный» образ.

Как мозг (и система искусственного интеллекта) рассчитывает общую вероятность присутствия образа (за распознавание которого отвечает соответствующий модуль) на основании: 1) входных сигналов (определенной величины), 2) предыдущих параметров величины (ожидаемая величина и ее вариабельность) каждого сигнала и 3) значимости каждого сигнала? Для определения этих параметров и их использования для изучения иерархии образов в 1980-х и 1990-х гг. я и некоторые другие ученые предложили математический метод, называемый методом скрытых моделей Маркова. Мы применили этот подход для распознавания и понимания человеческой речи. Я опишу его в седьмой главе.

В примере с распознаванием слов, идущем от образов низшего порядка к образам высшего порядка, мы видим, как строится иерархия информационного потока от отдельных элементов букв к целым буквам, а затем к словам. Далее процесс распознавания поднимается до уровня фраз и более сложных речевых конструкций. Если мы поднимемся выше еще на несколько десятков уровней, мы дойдем до таких концептуальных образов, как ирония или зависть. Хотя все распознающие модули функционируют одновременно, продвижение по этой иерархической лестнице должно занимать определенное время. Переход с одного уровня на другой занимает от сотых до десятых долей секунды. Эксперименты показывают, что узнавание такого образа средней сложности, каким является человеческое лицо, происходит за десятые доли секунды. Если образ сильно изменен, процесс распознавания может длиться целую секунду. Если бы мозг функционировал последовательно (как обычный компьютер) и распознавал все образы в иерархическом порядке, он должен был бы обрабатывать каждый образ низшего уровня и лишь затем переходить к образам следующих уровней. В таком случае он должен был бы совершать миллионы циклов распознавания при переходе от одного уровня к другому. Именно это происходит, когда мы моделируем данный процесс на компьютере. Не будем забывать, однако, что компьютеры функционируют в миллионы раз быстрее биологических систем.

Очень важно обратить внимание на то, что поток информации не только поднимается по иерархической лестнице, но и опускается по ней. Этот нисходящий поток информации чрезвычайно важен. Например, если мы читаем слева направо и уже увидели и узнали буквы A, P, P и L, модуль, ответственный за распознавание слова apple, предскажет, что, скорее всего, в следующей позиции окажется буква E. Он отправит сигнал вниз модулю, ответственному за распознавание буквы E, и сообщит: «будь внимателен, вероятно, очень скоро возникнет образ буквы E». Модуль, распознающий букву E, скорректирует пороговые параметры в соответствии с высокой вероятностью появления буквы E. И если на месте следующей буквы возникает образ, напоминающий E, но искаженный таким образом, что «в нормальных условиях» он не был бы воспринят как E, теперь распознающий модуль узнает в нем E, поскольку таковы были его ожидания.

Таким образом, новая кора предсказывает события. Необходимость предсказания будущего – одна из главных причин появления у нас новой коры. На высшем понятийном уровне мы постоянно осуществляем предсказания – кто сейчас войдет в дверь, что именно скажет этот человек в следующий момент, что мы увидим за углом, какими будут результаты наших действий и т. д. Эти предсказания непрерывно осуществляются в новой коре на всех уровнях иерархии. Мы часто путаем людей, предметы и слова из-за слишком низкого порогового значения для подтверждения ожидаемого образа.

Кроме положительных сигналов, существуют также отрицательные (ингибирующие) сигналы, указывающие на сниженную вероятность появления того или иного образа. Эти сигналы могут поступать с более низкого уровня иерархии (например, если я вижу у человека в очереди усы, понижается вероятность того, что это моя жена) или с более высокого уровня (например, я знаю, что моя жена отправилась в путешествие, поэтому человек в очереди – не она). Когда распознающий модуль получает ингибирующий сигнал, он повышает порог распознавания, но возбуждение все еще возможно (так что, если человек в очереди – действительно моя жена, я все-таки смогу ее узнать).

Природа данных, поступающих в распознающие модули новой коры

Давайте более подробно поговорим о том, как кодируются образы. Если образ – это лицо человека, данные о нем представляются как минимум в двух измерениях. Но мы не можем сказать, что первой подается информация, скажем, о глазах, потом о носе и т. д. То же самое относится и к восприятию звука. Музыкальная информация также имеет как минимум два измерения. Пьесу может исполнять не один, а несколько инструментов или голосов. Кроме того, одна нота, исполненная на сложном инструменте, таком как фортепьяно, содержит несколько частот. Голос человека одновременно раскладывается на множество составляющих с разной энергией и частотой. Так что звуковой образ в каждый конкретный момент времени может быть сложным, плюс растягиваться во времени. Тактильные сигналы тоже двумерные, поскольку кожа – двумерный чувствительный орган, и, опять-таки, возможно изменение этих сигналов в третьем, временно́м, измерении.

Таким образом, кажется очевидным, что образы передаются на распознающие модули новой коры в виде двумерных или трехмерных сигналов. Однако структура новой коры такова, что входные сигналы не могут иметь больше одного измерения. Наши исследования в области создания искусственных систем распознавания образов (речевых и зрительных) показывают, что мы можем представлять (и действительно представляем) двумерные и трехмерные явления в виде одномерных списков. О том, как это происходит, я расскажу в седьмой главе, а теперь мы просто должны принять, что входной сигнал на каждый распознающий модуль представляет собой одномерный список, даже если сам образ не является одномерным.

Здесь я должен обратить ваше внимание на тот факт, что образы, которые мы научились распознавать (например, образ конкретной собаки или «собаки» вообще, музыкальную ноту или музыкальную пьесу), организованы в соответствии с тем же самым механизмом, что и наши воспоминания. Наши воспоминания на самом деле представляют собой организованные в виде списков образы (и каждый пункт в каждом списке соответствует отдельному образу в иерархии новой коры), которые мы выучили и распознали под действием соответствующего стимула. Воспоминания хранятся в новой коре, чтобы быть узнанными.

Единственное исключение из этого правила относится к низшему понятийному уровню, на котором входные сигналы образа несут специфическую сенсорную информацию (например, изображение, поступающее от зрительного нерва). Однако даже этот образ низшего уровня в значительной мере трансформируется в более простые образы к моменту его поступления в кору головного мозга. Списки образов, составляющих воспоминание, организованы в хронологическом порядке, и мы можем «вспомнить наши воспоминания» только в этом порядке, вот почему нам бывает трудно обратить нашу память вспять.

Воспоминание возникает в ответ на какую-либо мысль или другое воспоминание (что одно и то же). Действие этого механизма запуска воспоминания можно пронаблюдать на примере восприятия образа. Если мы различили буквы A, P, P и L, образ слова APPLE предсказывает, что мы сейчас увидим букву E, и запускает образ E, который теперь является ожидаемым. Таким образом, наша новая кора «думает», что видит букву E, еще до того, как мы ее увидели на самом деле. Если такое конкретное взаимодействие в коре привлекло наше внимание, мы будем думать о букве E до того, как увидим ее, и даже если ее не увидим. Аналогичный механизм запускает воспоминания. Обычно существует целая цепочка подобных связей. Даже если нам кажется, что мы понимаем, какие воспоминания (то есть образы) вызвали в памяти старые воспоминания, следует понять, что воспоминания (образы) не имеют языковых или визуальных ярлыков. Вот почему иногда кажется, что старые воспоминания возникают внезапно. Возможно, они хранились, не активируясь, годами и были запущены по тому же механизму, как страничка в Интернете активируется по ссылке. И, подобно страничке в Интернете, которая может остаться «сиротой», если больше нет других страниц, дающих на нее ссылку, то же может происходить и с нашими воспоминаниями.

Наши мысли активируются направленным или ненаправленным образом в соответствии с описанными выше кортикальными связями. При ненаправленной активации эти связи действуют самостоятельно, то есть мы не пытаемся направить их в какую-то определенную сторону. Например, по такому принципу осуществляются некоторые виды медитации (в частности, практикуемая мной трансцендентальная медитация). Так же устроены сны.

При направленном способе мышления мы пытаемся пойти более упорядоченным путем, вызывая воспоминание (например, какую-то историю) или решая проблему. Однако и в одном, и в другом случае нам приходится пробираться сквозь списки образов, хранящихся в нашей новой коре. Таким образом, общий ход нашей мысли – весьма разупорядоченный процесс, ярко отраженный Джеймсом Джойсом в его манере «потока сознания».

Когда мы мыслим, используя наши воспоминания (истории или образы) – касаются ли они встреченной на прогулке молодой мамы с ребенком в коляске или первого знакомства с собственной женой, – эти воспоминания состоят из последовательностей образов. Поскольку образы не помечены словами, звуками или картинками, при попытке вспомнить какое-то событие нам приходится восстанавливать изображения в голове, поскольку никаких реальных изображений не существует.

Если бы мы захотели «прочесть» чьи-то мысли и точно описать, что же происходит в новой коре, было бы чрезвычайно сложно интерпретировать воспоминания этого человека – вне зависимости от того, были бы это хранящиеся в коре образы, ожидающие того момента, когда их вызовут в качестве воспоминаний, или те, которые в данный момент активно обрабатываются в виде текущих мыслей. Мы бы «увидели» одновременную активацию миллионов распознающих модулей. Через сотую долю секунды мы бы обнаружили, что активирован другой набор примерно такого же числа модулей. Каждый такой образ был бы списком других образов, а каждый из тех – списком третьих и так далее до самых примитивных образов на самом нижнем уровне. Было бы чрезвычайно сложно определить, что означают образы высоких порядков, если не скопировать всю информацию на каждом уровне новой коры. Таким образом, каждый образ в коре имеет какое-то значение исключительно в свете всей информации, находящейся ниже него на иерархической лестнице. Более того, другие образы того же уровня и более высоких уровней тоже важны для интерпретации конкретного образа, поскольку обеспечивают контекст для его интерпретации. Поэтому истинное чтение мыслей требовало бы не только поиска активированных аксонов в голове человека, но и анализа всей новой коры со всеми воспоминаниями, что помогло бы интерпретировать активацию аксонов.

Когда речь идет о нас самих, мы «знаем», что означают наши мысли или воспоминания, но они не существуют в виде легко объяснимых мыслей или наборов изображений. Если мы хотим поделиться ими с другими людьми, нам нужно облечь их в речевую форму. Эту задачу тоже выполняет новая кора с помощью распознающих модулей, натренированных на образах, которыми мы пользуемся для речевого общения. Язык сам по себе обладает строгой иерархией и эволюционировал таким образом, чтобы использовать иерархическую природу новой коры, которая, в свою очередь, отражает иерархическую природу реальности. Врожденная способность человека познавать иерархическую структуру языка, о которой писал Ноам Хомский[35], отражает структуру новой коры. В статье 2002 г. Хомский называет рекурсию уникальной особенностью человеческой речи[36]. Согласно Хомскому, рекурсия – это способность соединить мелкие элементы в более крупный элемент, а затем использовать этот более крупный элемент в качестве составной части еще одной структуры, и так до бесконечности. Действуя по такому принципу, мы можем выстраивать сложные структуры предложений, фраз и абзацев из ограниченного набора слов. Хотя Хомский в этой статье не говорил о структуре мозга, описанная им функция – именно то, что делает новая кора.

Низшие виды млекопитающих активно используют новую кору в своей каждодневной жизни. Люди приобрели дополнительные способности благодаря значительному увеличению размера коры в связи с формированием устного и письменного языка. Одни люди владеют этими способностями лучше, другие хуже. Если мы вынуждены пересказать какую-то историю много раз подряд, мы начнем заучивать фразы в виде набора отдельных предложений. Но даже в этом случае наши воспоминания являются не прямой последовательностью слов, а скорее языковыми структурами, которые мы должны переводить в специфические фразы при каждом пересказе. Вот почему всякий раз мы пересказываем историю чуточку иначе (если только не заучиваем точную последовательность слов как единый образ).

При описании специфических мыслительных процессов нельзя забывать об избыточности коры. Как я уже говорил, важные элементы нашей жизни, вне зависимости от того, относятся ли они к категории ощущений, речи или воспоминаний, записаны в нашей голове не по одному разу. Каждый важный образ на каждом уровне повторяется множество раз. В некоторых случаях это простые повторы, а иногда – те же образы, но в другом ракурсе. Именно поэтому мы можем узнать знакомое лицо в разной ориентации и при разной освещенности. Избыточность характерна для каждой ступени иерархической лестницы, что позволяет распознавать различные вариации образов и понятий.

Итак, если бы мы захотели изучить процессы в нашей новой коре, например, в тот момент, когда смотрим на любимого человека, мы бы обнаружили множество возбужденных аксонов распознающих модулей всех уровней – от модулей, распознающих самые простые чувственные образы, до многих других, распознающих изображение близкого человека. Мы бы также обнаружили возбуждение многих других клеток, реагирующих на различные аспекты ситуации: движения человека, его слова и т. д. Таким образом, картина гораздо шире, чем просто упорядоченное перемещение по иерархической лестнице.

Рис.22 Эволюция разума, или Бесконечные возможности человеческого мозга, основанные на распознавании образов

Компьютерная симуляция одновременного возбуждения множества распознающих модулей новой коры.

Но общий механизм иерархического сопряжения распознающих модулей, при котором каждый более высокий концептуальный уровень отвечает за более абстрактное и интегрированное понятие, все же справедлив. Еще активнее осуществляется передача информации в обратном направлении, поскольку активированные распознающие модули каждого уровня посылают предсказательные сигналы нижестоящим модулям, сообщая о приближающемся событии. Кажущееся богатство человеческого опыта объясняется тем, что все сотни миллионов распознающих модулей нашей новой коры одновременно обрабатывают поступающие к ним сигналы.

В пятой главе мы поговорим о том, как тактильная, зрительная, звуковая и другая информация, полученная с помощью наших органов чувств, передается в новую кору. Эти исходные сигналы обрабатываются отделами коры, специально предназначенными для восприятия соответствующих импульсов (хотя функциональность различных областей мозга чрезвычайно пластична, что связано с универсальностью механизмов действия новой коры). Понятийная иерархия продолжается и за пределами наивысших понятий в каждой сенсорной зоне новой коры. В ассоциативных зонах коры происходит интеграция сигналов от различных чувствительных органов. Когда человек слышит что-то, напоминающее голос его жены, и видит что-то, что может говорить о ее присутствии, он не прибегает к сложным логическим умозаключениям, а на основании сочетания этих чувственных образов тотчас понимает, что жена где-то рядом. Он интегрирует все сенсорные и перцептивные доказательства – возможно, даже запах духов – в виде единого многоуровневого ощущения.

На уровне выше ассоциативных зон коры мы можем воспринимать, запоминать и осмысливать еще более сложные абстрактные понятия. На высшем понятийном уровне мы воспринимаем такие образы, как «это хорошо», «она привлекательна», «это забавно» и т. д. Наша память сохраняет эти абстрактные образы наравне с другими. Например, мы можем вспомнить, что говорили с какой-то женщиной, она сказала что-то забавное и мы смеялись, хотя не можем вспомнить, в чем именно заключалась шутка. Память сохранила наше ощущение смешного, но не содержание разговора.

В предыдущей главе я обратил внимание на то, что часто нам удается распознать образ, даже если мы не в состоянии его описать. Например, мне кажется, я смог бы выбрать из набора фотографий разных женщин фотографию той женщины с коляской, которую встретил на прогулке, хотя и не могу ее как следует себе представить или описать. В данном случае моя память о ней представляет собой список некоторых образов высокого уровня иерархии. Эти образы не имеют никаких речевых или зрительных пометок и не выражаются пикселами, поэтому я могу думать о ней, но не могу ее описать. Однако, если мне показать фотографии, мысленная обработка визуальной картинки приведет к узнаванию тех образов высокого уровня иерархии, которые были зарегистрированы при первой встрече. Так я смогу найти совпадение и выбрать ее фотографию среди других.

Даже если я встретил эту женщину на прогулке всего один раз, вполне возможно, что в моей новой коре сохранилось несколько копий ее образа. Однако, если я не думаю о ней какое-то время, соответствующие распознающие модули займутся обработкой других образов. Вот почему со временем воспоминания стираются: избыточность сокращается, и в какой-то момент некоторые воспоминания исчезают. Тот факт, что я написал об этой женщине в книге, скорее всего, позволит мне сохранить более устойчивое воспоминание о ней.

Самоассоциация и инвариантность

В первой главе я уже писал о том, что нам удается распознать образ, даже если он представлен не целиком или в искаженном виде. Первая способность, называемая самоассоциацией, заключается в умении ассоциировать образ и его часть. Структура каждого распознающего модуля позволяет реализовать эту функцию.

В процессе распознавания каждый сигнал поднимается от распознающего модуля более низкого уровня к модулю более высокого уровня, и эта связь имеет определенный «вес», указывающий на важность этого конкретного элемента в общем образе. Более важные элементы имеют больший вес при распознавании образа. Таким образом, бородка Линкольна, бачки Пресли и знаменитый высунутый язык Эйнштейна, по-видимому, имеют большой вес в тех образах, с которыми у нас ассоциируются эти знаменитости. Распознающие модули рассчитывают фактор вероятности, учитывающий параметр значимости элемента. Таким образом, общая вероятность распознавания снижается, если один или несколько элементов отсутствуют, но порог узнавания все же может быть преодолен. Как я уже говорил, расчет общей вероятности присутствия образа сложнее, чем расчет просто взвешенной суммы, в которой величина параметров тоже учитывается.

Если распознающий модуль получил сигнал от модуля более высокого уровня об «ожидании» образа, пороговое значение понижается (то есть его легче достичь). В альтернативном варианте такой сигнал может просто прибавляться к остальным входным сигналам, компенсируя недостающий элемент. Это происходит на всех уровнях, так что такой образ, как лицо, находящийся на несколько уровней выше базового, может быть распознан даже при отсутствии нескольких элементов.

Способность распознавать трансформированные образы называется инвариантностью и реализуется четырьмя способами. Во-первых, важные превращения образа происходят до того, как сигналы попадают в новую кору. О передаче сигнала от кожи, глаз и ушей мы поговорим в разделе «Сенсорное восприятие».

Второй способ основан на избыточности информации, хранящейся в новой коре. Особенно если речь идет о важных или распространенных вещах, мы многократно встречаемся с разными вариантами и ракурсами одного и того же образа. Поэтому в новой коре независимо хранится и обрабатывается множество вариантов таких образов.

Третий и самый мощный способ заключается в способности объединять два списка. В одном может содержаться набор трансформаций, которые способны происходить с определенной категорией образов. Новая кора применит этот список возможных трансформаций к другому образу. Именно так мы понимаем речевые приемы типа метафор и сравнений.

Например, мы постепенно узнаём, что некоторые фонемы в разговорной речи могут выпадать (например, «кода» вместо «когда»). Если затем мы слышим другое слово (например, «всегда»), то узнаём его, даже если в нем отсутствует одна из фонем («вседа»), поскольку уже знакомы с явлением выпадения некоторых фонем. Другой пример. Мы знаем, что какой-то актер любит подчеркивать (увеличивать) размеры части лица (например, носа). Это позволяет нам узнать знакомое лицо, с которым проделан такой же трюк, даже если раньше с этим лицом подобные модификации не производились. Некоторые варианты актерского грима подчеркивают те самые черты, которые распознаются распознающими модулями новой коры. На этом же строится прием карикатуры.

Четвертый метод основан на величине параметров и позволяет одному модулю кодировать множество примеров образа. Например, мы много раз слышали слово steep. Модуль, ответственный за распознавание этого слова в речи, может кодировать множество примеров его произношения с разной длительностью [E]. Если все модули, распознающие слова с [E], обладают этим общим свойством, такая вариабельность должна быть зарегистрирована в самом образе [E]. Однако разные слова с этим звуком (а также со многими другими фонемами) могут различаться по параметру ожидаемой вариабельности. Например, слово peak (читается «пик») не содержит фонемы [E], как в слове steep.

Обучение

Не сами ли мы создаем себе преемников в земном господстве, ежедневно совершенствуя их красоту и утонченность, ежедневно обучая их новым навыкам и постоянно снабжая новыми способностями саморегулирования и автоматизма, которые будут лучше любого интеллекта?

Сэмюэл Батлер[37]

Главная работа мозга заключается в изменении самого себя.

Марвин Минский[38]. Общество разума. 1986

До сих пор мы говорили о том, как мы распознаём (сенсорно-перцептивными методами) образы и вызываем в памяти последовательности образов (наши воспоминания о вещах, людях или событиях). Однако, когда мы родились, ничего этого в нашей новой коре не было. При формировании мозга новая кора девственно чиста. Она обладает способностью учиться и, следовательно, создавать связи между распознающими модулями, но все эти связи появляются только с опытом.

Процесс обучения начинается еще до нашего рождения – одновременно с биологическими процессами в развивающемся мозге. У месячного зародыша уже есть головной мозг, хотя он пока еще напоминает мозг рептилии, поскольку в процессе внутриутробного развития зародыш в ускоренном темпе проходит все этапы эволюции. К третьему триместру беременности мозг плода – уже очевидно человеческий мозг с человеческой новой корой. В этот период плод набирается определенного опыта, и его новая кора обучается. Он слышит звуки, особенно сердцебиение матери, кстати, это одна из возможных причин, объясняющих ритмичность музыки во всех человеческих культурах. Музыка является составной частью культуры всех известных на сегодня человеческих цивилизаций, чего нельзя сказать о других видах искусства, например о живописи. Кроме того, музыкальные ритмы сравнимы с ритмом нашего сердца. Конечно, музыкальные ритмы сильно различаются, иначе было бы неинтересно, но и ритмы сердца тоже различаются. Между прочим, абсолютно регулярное биение сердца является симптомом заболевания. Через 26 недель после зачатия глаза плода начинают открываться, а через 28 недель – практически постоянно открыты. Внутри матки мало интересного, но новая кора плода начинает распознавать образы света и темноты.

Таким образом, опыт новорожденного ребенка весьма ограничен. Новая кора может учиться и у старого мозга (мы поговорим об этом в четвертой главе), но, в общем, ребенку предстоит многое узнать, начиная от распознавания самых примитивных звуков и форм и заканчивая метафорами и сарказмом.

Обучение играет важнейшую роль в формировании человеческого разума. Если бы мы смогли создать идеальную модель человеческой новой коры (что и планируется сделать в рамках проекта Blue Brain) и всех других отделов мозга, которые нужны для его функционирования (таких как гиппокамп и таламус), такой мозг мало на что был бы способен – как и мозг новорожденного ребенка (за исключением того, чтобы делать этого ребенка милым, поскольку это важнейшее условие выживания).

Обучение и распознавание происходят одновременно. Мы начинаем обучаться сразу, и как только мы изучили образ, мы сразу же начинаем его узнавать. Новая кора постоянно пытается определить смысл поступающих в нее сигналов. Если какой-то иерархический уровень не справляется со своей задачей и не может полностью идентифицировать образ, сигналы направляются на уровень более высокого порядка. Если же распознавание не происходит ни на одном из уровней, образ воспринимается как новый. Отнесение образа к категории новых образов не обязательно означает, что новыми являются все его элементы. Если мы смотрим на картину какого-то художника и видим на ней кошачью морду со слоновьим хоботом, мы узнаем все элементы, но понимаем, что этот комбинированный образ является новым, и запоминаем его. На более высоких понятийных уровнях иерархии новой коры, воспринимающих контекст (например, что данная картина является плодом творчества конкретного художника и что мы пришли на новую выставку его работ), будет зарегистрирован необычный комбинированный образ слонокота, а все детали контекста сохранятся в виде дополнительных воспоминаний.

Новые вспоминания вроде морды слонокота записываются в доступном распознающем модуле. В этом процессе задействован гиппокамп, и о том, как все происходит на самом деле, мы поговорим в следующей главе. В рамках обсуждаемой модели новой коры достаточно сказать, что неопознанные образы сохраняются в виде новых образов и связаны с составляющими их образами более низкого уровня. В частности, морда слонокота записывается несколькими способами: регистрируется новое расположение черт, а также имя художника, ситуация, возможно, наше воспоминание о том, как мы смеялись, впервые увидев картину.

Успешно распознанные воспоминания также могут сформировать новый образ, позволяющий дополнительно увеличить избыточность информации. Если же образы распознаны недостаточно хорошо, они, скорее всего, сохраняются как варианты распознанного образа в новом ракурсе.

Каким же методом в целом можно определить, какие образы сохраняются? На языке математики проблема формулируется так: как оптимальным образом представить входные сигналы, которые уже встречались ранее, чтобы не превышать доступной емкости новой коры? Некоторая избыточность необходима, но было бы нерационально заполнять все отпущенное для хранения информации пространство (то есть всю новую кору) повторяющимися образами, поскольку в таком случае сокращается разнообразие запоминаемых образов. Например, образ звука [и] мы встречали бесконечное число раз. Это простой образ звуковой частоты, который, несомненно, представлен в коре с очень большой избыточностью. Мы можем заполнить всю кору повторами образа звука [и], однако полезная избыточность имеет пределы, которые в случае такого распространенного образа, конечно же, были достигнуты.

Подобная математическая проблема оптимизации решается с помощью так называемого линейного программирования, позволяющего наилучшим образом использовать ограниченные ресурсы (в нашем случае – ограниченное число распознающих модулей) для представления всех примеров, на которых отрабатывалась модель. Метод линейного программирования был разработан для систем с одноразмерными входными параметрами, и это еще одна причина, по которой она оптимально подходит для описания линейной последовательности входных сигналов. Мы можем использовать этот математический подход для создания компьютерных программ, и хотя реальный мозг ограничен имеющимися физическими связями, которые он распределяет между распознающими модулями, метод тем не менее очень похожий.

Важным результатом подобной оптимизации является то, что постоянно встречающиеся образы распознаются, но не приводят к возникновению стойких воспоминаний. На утренней прогулке я пережил множество впечатлений, распознаваемых на всех иерархических уровнях, – от простых видимых углов и теней до более сложных объектов, таких как фонарные столбы, почтовые ящики, люди, животные и растения. Скорее всего, ни один из них не был уникален, и распознанные мной образы уже давно достигли оптимального уровня избыточности. В результате у меня не осталось практически никаких воспоминаний об этой прогулке. Те немногие детали, которые я запомнил, по-видимому, были вытеснены записанными поверх них новыми образами, зарегистрированными мозгом во время следующих прогулок, а эту конкретную прогулку я запомнил лишь по той причине, что написал о ней в книге.

Один важный аспект касательно функционирования нашей новой коры и попыток ее моделирования заключается в трудности одновременного постижения образов, относящихся сразу ко многим понятийным уровням. Вообще говоря, мы можем одновременно осваивать один, максимум два уровня. Если процесс обучения проходит стабильно, мы можем переходить на следующий уровень. Мы можем продолжать более тонкую настройку нижних уровней, но сфокусированы на следующем более высоком уровне абстракции. Это справедливо как в самом начале жизни, когда новорожденный ребенок осваивает основные формы и предметы, так и впоследствии, когда мы осваиваем новые материи – один уровень сложности за раз. То же самое можно сказать и о компьютерном моделировании новой коры. Если машине представлять материал в порядке увеличения абстрактности – за один раз один уровень, машины способны обучаться точно так же, как обучается человек (хотя пока не воспринимают такого множества понятийных уровней).

Выходные сигналы от каких-то распознающих модулей могут идти обратно к образам более низкого уровня или возвращаться к тем же самым образам, что объясняет мощную рекурсивную способность человеческого мозга. Отдельный элемент образа может быть точкой принятия решений для другого образа. Это особенно полезно для списков, в состав которых входят действия: например, нужно взять новый тюбик зубной пасты, если закончился старый. Такие условные зависимости существуют на всех уровнях. Каждый, кто пытался создать компьютерную программу, знает, что условные зависимости – обязательный элемент для описания последовательности действий.

Язык мысли

Сны являются предохранительными клапанами перегруженного мозга.

Зигмунд Фрейд. Толкование сновидений. 1911

Головной мозг: мы думаем, что это аппарат, с помощью которого мы думаем.

Амброз Бирс[39]. Словарь Сатаны

Чтобы суммировать все то, что мы узнали о функционировании новой коры, вернитесь, пожалуйста, к диаграмме «Распознающий модуль новой коры» в начале данной главы (см. рис. 8).

А. Дендриты входят в модуль, распознающий конкретный образ. Даже если образы кажутся двумерными или трехмерными, они представляются в виде одномерных последовательностей сигналов. Чтобы произошло распознавание, образ должен быть представлен в виде такой последовательности. Каждый дендрит связывается с одним или несколькими аксонами распознающих модулей более низкого понятийного уровня, распознавших более простые образы, являющиеся частью данного образа. Для каждого входного сигнала может существовать несколько модулей более низкого уровня, способных генерировать сигналы. Необходимое для распознавания образа пороговое значение вероятности может быть достигнуто даже в том случае, если получены не все входные сигналы. Модуль рассчитывает вероятность присутствия образа, за распознавание которого он отвечает. Этот расчет основан на параметрах «значимости» и «величины» сигналов (см. ниже).

Обратите внимание, что одни дендриты передают сигналы в модуль, а другие – из модуля. Если все дендриты, входящие в распознающий модуль, сигнализируют о том, что распознаны все образы более низкого уровня, за исключением одного или двух, распознающий модуль отправит нисходящие сигналы в модули, ответственные за распознавание этих оставшихся неузнанными образов, с указанием высокой вероятности того, что образ скоро будет распознан и что эти модули более низкого порядка должны быть к этому готовы.

Б. Когда распознающий модуль узнаёт соответствующий образ (на основании активации всех или большинства входных дендритов), активируется выходной аксон этого распознающего модуля. Этот аксон, в свою очередь, может сообщаться со всей сетью дендритов, ведущих ко многим распознающим модулям более высокого порядка, для которых данный образ является входным сигналом. Сигнал и его величина учитываются распознающими модулями следующего уровня.

В. Если распознающий модуль более высокого уровня получает положительные сигналы ото всех или от большинства составляющих образов, за исключением сигнала от данного конкретного распознающего модуля, распознающий модуль более высокого уровня может послать нисходящий сигнал этому модулю, указывая на большую вероятность «ожидания» соответствующего образа. Этот сигнал заставляет распознающий модуль понизить пороговые параметры, в результате чего он с большей вероятностью передает по своему аксону положительный сигнал (что означает, что соответствующий образ распознан), даже если некоторые из входных сигналов отсутствуют или сомнительны.

Г. Ингибирующие сигналы снизу понижают вероятность распознавания модулем соответствующего образа. Это может происходить в результате распознавания на более низком уровне образов, несовместимых с образом, за который отвечает данный распознающий модуль (например, распознавание усов снижает вероятность того, что увиденное мной лицо принадлежит «моей жене»).

Д. Ингибирующие сигналы сверху тоже могут снижать вероятность распознавания образа соответствующим модулем. Это может происходить при распознавании образа более высокого порядка сложности, который несовместим с образом, распознанным данным модулем.

Е. Каждому сигналу соответствует ранее определенный набор параметров, таких как значимость, ожидаемая величина и ожидаемая вариабельность. Распознающий модуль рассчитывает общую вероятность присутствия образа на основании значений всех этих параметров для входных сигналов. Оптимальный математический метод решения данной задачи называется методом скрытых моделей Маркова. Если такие модели организованы иерархическим образом (как в новой коре или в математических моделях, воспроизводящих ее функции), мы называем их иерархическими скрытыми моделями Маркова.

Распознавание корой одних образов запускает распознавание следующих. Частично распознанные образы посылают нисходящие сигналы, полностью распознанные образы – восходящие сигналы. Эти распознанные новой корой образы являются языком мышления. Как и разговорный язык, язык мышления имеет иерархическую структуру, но не является «языком» в обычном понимании. Поначалу наши мысли не выражены словами, однако, поскольку речь тоже формируется в новой коре в виде иерархических образов, у нас бывают и мысли, основанные на языковых образах. Однако по большей части мысли выражаются неязыковыми образами.

Как я уже отмечал ранее, даже если бы мы умели регистрировать активацию образов в новой коре живого человека, мы все равно не смогли бы определить значение этих образов, если бы не имели доступа к полной иерархической системе вышестоящих и нижестоящих образов. Это сильно затрудняет доступ к мыслительному процессу другого человека. Достаточно сложно понять содержание наших собственных мыслей, а для понимания мыслей другого человека требуется овладеть его новой корой. Конечно же, пока нам это недоступно. Пока нам приходится использовать способность другого человека выражать свои мысли с помощью речи (а также других средств, включая жесты). Учитывая недостаточную способность людей справляться с этой задачей, нет ничего удивительного в том, что мы зачастую плохо понимаем друг друга.

У нас два способа мышления. При ненаправленном способе мышления мысли подталкивают друг друга нелогичным образом. Иногда, когда мы заняты чем-то отвлеченным, например сгребаем опавшие листья или просто идем по улице, у нас неожиданно возникают воспоминания о том, что мы делали несколько лет или десятилетий назад. Мы не можем немедленно восстановить в памяти те события, не прибегая к множеству других воспоминаний, которые помогают нам воссоздать более слаженную картину. Если нам удается воссоздать визуальное изображение давно забытой сцены, это происходит в настоящий момент, поскольку память не хранит визуальные образы или изображения. Как я уже говорил, не всегда очевидно, какие стимулы вызывают у нас в голове появление подобных мыслей. Последовательность мыслей, вызвавших воспоминание, может быть немедленно забыта. Но если даже нам удастся ее восстановить, это окажется нелинейная, кружная последовательность ассоциаций.

Второй способ – направленное мышление, которое мы используем для решения задач или формулировки логичного ответа. Например, так мы готовимся кому-то что-то сказать или формулируем в уме фразу, которую собираемся написать (например, в книге о разуме). Когда мы обдумываем подобную проблему, мы расчленяем ее на иерархические составляющие. Например, чтобы написать книгу, нужно написать отдельные главы. Каждая глава строится из разделов, разделы состоят из параграфов, параграфы – из предложений, в которых сформулированы идеи. Каждая идея построена из нескольких элементов в определенной конфигурации. Все элементы идеи и все связи между элементами тоже должны быть произнесены. Кроме того, наша новая кора действует по определенным правилам. Если мы выполняем письменную работу, нужно постараться избегать ненужных повторений, обеспечить читателю возможность следить за ходом изложения, использовать грамматические и стилистические правила и т. д. Следовательно, писатель должен создать в своей голове образ читателя, и этот образ также является иерархическим. При направленном мышлении мы продвигаемся по спискам новой коры, каждый из которых, в свою очередь, состоит из подсписков, а те – из еще более простых наблюдений. Помним также, что элементы списков могут содержать условные зависимости, так что наши мысли и действия зависят от оценок, сделанных в ходе мыслительного процесса.

Кроме того, каждая направленная мысль запускает иерархический путь ненаправленного мышления. Происходит постоянный наплыв воспоминаний, связанных как с нашим чувственным опытом, так и с нашими попытками направленного мышления. Наш мыслительный опыт сложен и запутан и состоит из наплывов образов, изменяющихся сотни раз в секунду.

Язык снов

Сны – пример ненаправленных мыслей. В них есть некий смысл, поскольку одни мысли запускают другие в соответствии с реальными связями между образами, хранящимися в новой коре. Неосмысленные элементы снов мы пытаемся зафиксировать с помощью нашей способности к конфабуляции (фантазии). Как я расскажу в девятой главе, больные с расщепленным мозгом (при поражении мозолистого тела, связывающего между собой полушария мозга) прибегают к конфабуляциям (с помощью левого полушария, контролирующего речевой центр) для объяснения того, что делает с полученными сигналами правое полушарие, к которому у левого полушария нет доступа. Мы постоянно прибегаем к конфабуляциям для объяснения исхода различных событий. Хотите яркий пример – просто прослушайте дневные комментарии по поводу состояния финансовых рынков. Вне зависимости от того, как изменяется ситуация на рынках, всегда можно найти причины этих изменений. И примеров подобных комментариев можно привести множество. Если бы комментаторы действительно понимали ситуацию, они не тратили бы время на составление подобных комментариев.

Конечно же, за конфабуляции тоже отвечает новая кора; они возникают в тех случаях, когда мы встречаемся с некоторыми трудностями при пересказе каких-то историй или объяснении каких-то фактов. Мы заполняем свой рассказ недостающими или забытыми подробностями, и он становится более осмысленным. Вот почему истории в устах разных рассказчиков, возможно, имеющих разные намерения, изменяются со временем. Однако с появлением письменного языка у нас появилась возможность фиксировать окончательную версию истории и предотвращать подобные вариации.

Истинное содержание сна в том виде, в каком мы его запоминаем, опять-таки представляет собой последовательность образов. Образы составляют основу истории, а мы дополняем ее конфабуляциями, ограниченными существующими образами. Эта фантазия и есть та версия сна, которую мы можем пересказать или вспомнить. Пересказывая сон, мы запускаем каскад образов, дополняющих наш сон в том виде, в каком мы увидели его изначально.

В этом заключается одно из ключевых различий между нашими мыслями во сне и при бодрствовании. В процессе жизни мы узнаём, что существуют действия и даже мысли, недопустимые в реальном мире. Например, мы узнаём, что не можем немедленно осуществить свои желания. Закон запрещает вытаскивать деньги из кассы в магазине или вступать в связь с любым человеком, который просто показался физически привлекательным. Мы узнаём, что какие-то мысли недопустимы ввиду культурных ограничений. Когда мы приобретаем профессиональные навыки, мы учимся мыслить таким способом, который признаётся и вознаграждается в нашей профессии, и привыкаем избегать того образа мыслей, что может нарушать нормы и методы профессии. Многие из этих табу имеют смысл, поскольку поддерживают социальный порядок и способствуют прогрессу. Но они могут и тормозить прогресс, усиливая непродуктивный консерватизм. Именно такой консерватизм преодолел Эйнштейн, когда в своих мысленных экспериментах попытался прокатиться на световом луче.

Культурные правила закрепляются в новой коре с помощью старого мозга, особенно миндалевидной железы. Каждая наша мысль запускает другие мысли, и некоторые из них связаны с определенной опасностью. Например, мы узнаём, что нарушение культурных норм даже в нашей частной жизни, может привести к остракизму, и новая кора понимает, что это опасно для нашего благополучия. Если у нас рождается подобная мысль, начинает работать миндалевидная железа, вызывая страх, и мысль прерывается.

Однако во сне табу ослаблены, и нам часто снится нечто запрещенное в культурном, сексуальном или профессиональном плане. Как будто наш мозг понимает, что во сне мы не являемся реальными действующими лицами. Об этом писал Фрейд, который также отмечал, что мы прячем опасные мысли, по крайней мере, когда пытаемся их вспомнить, так что проснувшийся мозг продолжает быть защищенным.

Ослабление профессиональных табу может быть полезным для творческого решения проблем. Каждый вечер перед тем, как идти спать, я думаю о какой-либо специфической задаче. Это запускает последовательность мыслей, которая продолжается во сне. Во сне я могу обдумывать – видеть во сне – решение задачи, не ограничивая себя теми профессиональными табу, что действуют днем. Утром между сном и пробуждением я могу вспомнить эти мысли; такое состояние иногда называют «осознанными сновидениями»[40].

Всем известно, что Фрейд писал о возможности понять психологию человека путем интерпретации его снов. О различных аспектах этой теории существует обширная литература, но основное положение о возможности изучения самих себя путем анализа собственных мыслей вполне осмысленно. Наши сны создаются в новой коре, поэтому отражают ее содержимое и имеющиеся в ней связи. Ослабление мыслительных запретов, действующих при бодрствовании, тоже полезно для анализа содержимого коры, к которому в противном случае мы не имели бы прямого доступа. Резонно предположить также, что образы, формирующие наши сны, важны для нас и поэтому являются ключом к пониманию наших скрытых страхов и желаний.

Суть модели

Как я уже говорил ранее, в 1980–1990-х гг. я руководил группой исследователей, пытавшихся применить метод иерархических скрытых моделей Маркова для распознавания и понимания человеческой речи. Эта работа предшествовала появлению широко распространенных сегодня коммерческих систем, распознающих и понимающих нашу речь (автомобильных навигационных систем, Сири в айфонах и многих других). Созданная нами технология строилась практически по тем же принципам, что реализуются при мысленном распознавании образов. Она также была основана на иерархии образов, при которой каждый более высокий уровень отличался от нижестоящего уровня большей абстрактностью. Например, в системе распознавания речи основные образы звуковой частоты формировали нижние уровни, за ними следовали фонемы, затем слова и фразы (часто распознававшиеся так, как будто были словами). Некоторые системы распознавания речи могут понимать речевые команды и в таком случае включают в себя еще более высокие иерархические уровни, содержащие такие структуры, как именные и глагольные группы. Каждый распознающий модуль умеет распознавать линейную последовательность образов с нижестоящего понятийного уровня. Каждый входной сигнал характеризуется значимостью, величиной и вариабельностью величины. Существуют также и нисходящие сигналы, указывающие на ожидание образа низшего уровня. Подробнее я расскажу об этих исследованиях в седьмой главе.

В 2003 и 2004 гг. создатели карманного персонального компьютера Джеф Хокинс и Дайлип Джордж сформировали иерархическую модель коры, названную временной иерархической памятью. В соавторстве с писательницей Сандрой Блейксли Хокинс описал эту модель в книге «Об интеллекте» (On Intelligence). Хокинс доказывает универсальность алгоритма действия коры и ее иерархической организации в виде списков. Между моделью Хокинса и моделью, которую предлагаю вам я в своей книге, есть несколько существенных различий. Как следует из названия модели, Хокинс настаивает на временно́й (основанной на времени) природе списков. Другими словами, списки составляются всегда в одном и том же направлении – вперед во времени. Наличие временно́го направления у элементов двумерных образов, таких как печатная буква «А», он объясняет движением глаз. Он объясняет, что мы визуализируем изображения при помощи саккад – очень быстрых непроизвольных движений глаз. Таким образом, информация поступает в новую кору не в виде двумерных наборов данных, а скорее в виде списков организованных во времени элементов. Это правда, что наши глаза совершают очень быстрые движения, однако они не всегда видят элементы образов (таких как буква «А») в последовательном временно́м порядке. Например, глаза не обязательно сначала регистрируют верхний угол буквы «А», а затем ее нижнюю часть. Кроме того, мы способны распознать зрительный образ, видимый лишь на протяжении нескольких десятых миллисекунды, а за это время саккадные движения глаз просто не успевают его просканировать. Верно, что распознающий модуль новой коры сохраняет образ в виде списка и что список этот хранится в соответствии с определенным порядком, только порядок этот не обязательно временно́й. Он действительно может быть временны́м, но также может быть пространственным или понятийным, как я объяснял выше.

Но самое главное различие между моделями заключается в наборе параметров, с помощью которых я характеризую каждый сигнал, входящий в распознающий модуль, в частности параметров величины и ее вариабельности. В 1980-х гг. мы пытались распознавать человеческую речь без учета информации подобного рода. Тогда лингвисты уверяли нас, что информация о длительности сигнала не играет решающей роли. Такой подход используется в словарях, в которых произношение каждого слова передается в виде последовательности фонем. Например, слово steep записывается как последовательность звуков [s], [t], [E] и [p] без указания ожидаемой длительности каждой фонемы. В результате, если созданная нами программа, способная распознавать фонемы, встречает в речи эту специфическую последовательность четырех фонем, она сможет распознать слово. Созданная по такому принципу программа работала, но недостаточно хорошо, чтобы справляться с большим набором слов, распознавать речь нескольких говорящих или слова, произнесенные без пауз. Качество программы выросло в значительной степени, когда мы с помощью иерархических скрытых моделей Маркова ввели для каждого входного сигнала параметр распределения величины.

Глава четвертая

Биологическая новая кора

Поскольку дело серьезное, вам понадобится череп для вашего мозга, пластиковый футляр для расчески и бумажник для денег.

Джордж Костанца, персонаж американского телесериала «Сайнфилд», 1998

Теперь мы впервые наблюдаем за работой мозга в глобальном плане с такой ясностью, что сможем найти общие программы его удивительных способностей.

Дж. Тейлор, Б. Горовиц, К. Фристон[41]

Работу мозга над полученной информацией можно в определенной степени сравнить с работой скульптора над каменной глыбой. В том смысле, что статуя всегда находилась внутри камня. Однако кроме нее в камне хранились еще тысячи других, и только благодаря скульптору из него была извлечена именно эта. Так же и мир каждого из нас, как бы по-разному мы его ни воспринимали, погружен в изначальный хаос ощущений, который всем нам дает одинаковую материю для размышлений. Если захотим, мы можем мысленно повернуть время вспять к той черной и единой бесконечности пространства и движущихся и роящихся атомов, какую наука называет единственным реальным миром. Но все-таки мир, который мы воспринимаем и в котором живем, такой, какой наши предки и мы сами постепенно высекали из этого первозданного пространства, просто отделяя определенные фрагменты. Другой скульптор – другая статуя из того же камня! Другой разум – другой мир из того же самого монотонного и невыразительного хаоса! Мой мир – лишь один из похожих вкрапленных миров, столь же реальных для тех, кто умеет абстрагироваться. Сколь другим, должно быть, является мир в сознании муравья, каракатицы или краба!

Уильям Джемс[42]

Является ли разум главной целью или лишь одной из целей биологической эволюции? Стивен Пинкер[43] пишет: «Мы рассматриваем свой мозг в качестве вершины эволюции[44]… но это [мнение] неоправданно… поскольку естественный отбор не имеет никакого отношения к развитию интеллекта. Этот процесс определяется различием в выживаемости и воспроизводстве организмов в специфических условиях окружающей среды. Со временем организмы приобретают черты, позволяющие им адаптироваться к жизни и воспроизводству в данных конкретных условиях; ничто, кроме их успешного процветания здесь и сейчас, не движет их развитием ни в каком направлении». Далее Пинкер заключает: «Жизнь похожа на густой и ветвистый куст, а не на линейку или лестницу, и живые организмы располагаются на концах ветвей, а не у их основания».

В отношении человеческого мозга он задается вопросом, насколько «преимущества превышают затраты». К затратам он относит «большой объем мозга. Таз женщины едва вмещает в себя голову ребенка. Такое компромиссное строение является причиной гибели множества женщин в момент деторождения и объясняет раскачивающуюся походку женщин, из-за которой по биомеханическим причинам женщины перемещаются менее эффективно, чем мужчины. Кроме того, болтающаяся на шее тяжелая голова повышает вероятность смертельных повреждений при таких несчастных случаях, как падения». Он продолжает список недостатков, среди которых большой расход энергии мозгом, медленные реакции и медленное обучение.

В принципе, все эти утверждения точны (хотя многие знакомые мне женщины ходят гораздо легче, чем я), однако Пинкеру не хватает обобщений. Это верно, что биологическая эволюция не имеет специфического направления. Скорее она ищет пути среди «густых и ветвистых кустов» природы. Так же верно, что эволюционные изменения не обязательно происходят в направлении повышения интеллекта – они идут по всем направлениям. Можно привести множество примеров успешных организмов, которые практически не изменились за миллионы лет (скажем, аллигаторы появились 200 млн лет назад, а многие микроорганизмы – еще раньше). Однако в процессе последовательного развития мириад эволюционных ветвей одно из направлений действительно ведет к повышению интеллекта. И именно этот факт является предметом нашей дискуссии.

Рис.23 Эволюция разума, или Бесконечные возможности человеческого мозга, основанные на распознавании образов

Схема расположения ключевых отделов мозга человека.

Рис.24 Эволюция разума, или Бесконечные возможности человеческого мозга, основанные на распознавании образов

Новая кора некоторых млекопитающих

Предположим, у нас есть банка с синим газом. Когда мы открываем крышку, к молекулам газа не поступает никакого сигнала типа «эй, ребята, крышка открыта, путь свободен!» Молекулы просто продолжают делать то же, что обычно, то есть движутся во всех направлениях без какого-либо предпочтения. Но при этом те из них, которые находятся в верхней части банки, действительно выходят наружу, и со временем большинство молекул покинет банку. Однажды биологическая эволюция создала механизм иерархического обучения, и он оказался чрезвычайно полезным для реализации одной из ее задач – выживания видов. Преимущество обладания новой корой становится совершенно очевидным в тех ситуациях, когда быстро меняющиеся обстоятельства благоприятствуют быстрому обучению. Самые разные виды организмов – и растения, и животные – учатся адаптироваться к изменяющимся условиям, однако за неимением новой коры им приходится использовать процесс генетической эволюции. Для обучения новым стратегиям поведения (или другим адаптационным стратегиям в случае растений) организмам, не имеющим новой коры, требуются тысячи лет (множество поколений). Выдающимся преимуществом организмов с новой корой является возможность обучения на протяжении нескольких дней. Если вид попадает в ситуацию, характеризующуюся драматическими изменениями внешних условий и один из представителей вида изобретает, открывает или просто случайно обнаруживает (все эти три метода являются вариантами инноваций) путь адаптации к этим изменениям, другие представители вида замечают, усваивают и копируют этот метод, который в результате быстро, как вирус, распространяется во всей популяции. Мел-палеогеновое вымирание, произошедшее около 65 млн лет назад, стало причиной исчезновения многих видов организмов, которые не имели новой коры и не смогли достаточно быстро адаптироваться к резким изменениям окружающей среды. Это был поворотный момент в развитии млекопитающих, занявших освободившиеся экологические ниши. Так биологическая эволюция «обнаружила», что способность новой коры к иерархическому обучению настолько ценное приобретение, что данная область головного мозга продолжала увеличиваться и теперь составляет основную часть мозга Homo sapiens.

Открытия в нейробиологии подтвердили ключевую роль иерархических способностей новой коры, а также представили доказательства теории мысленного распознавания образов (ТРО). Эти доказательства складываются из множества наблюдений и анализов, часть которых я здесь представлю. Канадский психолог Дональд Хебб (1904–1985) первым предпринял попытку идентифицировать неврологические основы процесса обучения. В 1949 г. он описал механизм физиологического изменения нейронов в зависимости от пережитого опыта, что может быть основой обучаемости и пластичности головного мозга. Он писал: «Предположим, что сохранение или повторение реверберационной активности способствует длительным клеточным изменениям… Если аксон клетки А находится достаточно близко, чтобы возбуждать клетку В, и возбуждает ее непрерывно или многократно, происходит некий рост или определенные метаболические изменения в одной или в обеих клетках, в результате чего возрастает эффективность возбуждения клеткой A

1 Эмили Дикинсон (1830–1886) – американская поэтесса. Стихотворение в пер. А. Гаврилова. Здесь и далее прим. автора и переводчика.
2 Вот одно предложение из романа Габриэля Гарсиа Маркеса «Сто лет одиночества». Аурелиано Второй поначалу не заметил этот кошачий вокализ, но на следующее утро после завтрака почувствовал, что его уши сверлит какое-то жужжание, более переливчатое и пискливое, чем дробь дождя, а это, оказывается, Фернанда бродила по дому, громко причитая – для того, мол, ее воспитывали, как королеву, чтобы стать ей прислугой в сумасшедшем доме, жить с мужем – лодырем, безбожником, развратником, который только и знает, что валяется на кровати брюхом кверху и ждет не дождется манны небесной, а она работает-надрывается, везет на себе хозяйство, которое на глазах рушится, где столько всего надо сделать, столько на своем горбу вывезти, столько дыр залатать каждый Божий день с утра и до вечера, что, как ляжет она в постель, так в глазах рябит и мутится, и никто ведь потом не скажет: доброе утро, Фернанда, хорошо ли ты отдохнула, Фернанда, никто не спросит, хотя бы из вежливости, почему, мол, ты со сна такая бледная, с черными кругами под глазами, хотя, конечно, она и не ждет таких слов от этой семьи, где в общем-то всегда всем она была в тягость, чуть ли не ноги об нее вытирали, как на пугало огородное на нее глядели, по углам шушукались и злословили, называя ее ханжой, называя ее лицемеркой, называя ее хитрой бестией, и даже Амаранта – царствие ей небесное – не постеснялась громко сказать, что она, Фернанда, из тех, кто посты соблюдает не для духа, а для брюха – Господи, что за выражение, – а она все это покорно сносила по воле Божьей, но больше терпеть не будет, после того как этот мерзавец Хосе Аркадио Второй сказал, что семья стала гибнуть из-за того, что впустила в дом самодурку, – только послушать! – своевольную самодурку, прости, Господи, чуть ли не изуверку из породы тех гнусных изуверов, которых правительство посылает убивать рабочих, и – скажите на милость – он при этом имел в виду не кого-нибудь, а ее, крестницу герцога Альбы, даму такого знатного происхождения, что жены президентов зеленели от зависти, дочь такого древнего рода, что имеет право подписываться одиннадцатью испанскими фамилиями в ряд, и вообще она единственная смертная в этом нечестивом городишке, которая не опростоволосится, если надо накрыть стол на шестнадцать персон, хотя бы потом этот забулдыга, ее муж, и говорил, корчась от смеха, что столько ложек и вилок, ножей и чайных ложечек нормальным людям не требуется, разве что сороконожкам, а ведь она тут одна-единственная, кто во сне может ответить, когда положено белое вино подавать, и с какой стороны, и в какой бокал наливать, а когда – красное, и с какой стороны, и в какой бокал, не то что эта недоучка Амаранта, царствие ей небесное, которая думала, что белое вино пьют днем, а красное вечером, и она, Фернанда, единственная на всем побережье может похвастаться тем, что пользуется ночью не чем иным, как золотым горшком, хотя полковник Аурелиано Буэндия, царствие ему небесное, имел наглость спросить, ехидный франкмасон, уж не за то ли ей такая привилегия, что из нее не говно, а хризантемы лезут, подумать только, так и сказал, а Рената, ее родная дочь, которая не постеснялась подглядеть, как она в спальне по-большому делает, поддакивает, что горшок и вправду из золота и весь в гербах, но внутри – говно как говно, дерьмо человечье, да еще и похуже, потому как это – дерьмо изуверское – подумайте, родная-то дочь! – вот почему и знает она, Фернанда, цену истинную членам этой семьи, но в любом случае имеет право ожидать от мужа большего уважения, ибо, худо-бедно, он ей муж, Богом посланный, сам ее взявший в дом, законный насильник, который по своей и Божьей воле возложил на себя ответственность за то, что лишил ее родительского крова, где жила она без забот и хлопот, плела венки погребальные ради собственного удовольствия, ибо ее крестный отец прислал письмо за собственной подписью и скрепленное сургучной печатью своего перстня, дабы предупредить, что ручки его крестницы не предназначены для дел мира сего, разве только для игры на клавикордах, тем не менее ее муж-болван увез ее из дому, невзирая на все предупреждения и предостережения, и бросил в этот адский котел, где от жары задохнуться впору, и, не дождавшись конца Великого поста, уже отправился из дому со своими бродячими сундуками и со своим дурацким аккордеоном прелюбодействовать с потаскухой, у которой достаточно посмотреть на задищу – ладно, слово уже сказано, – достаточно посмотреть, как она вертит своим кобыльим крупом, чтобы узнать, кто она такая: полная противоположность ей, Фернанде, которая всегда остается дамой – во дворце или в свинарнике, за столом или в постели, прирожденной дамой, почитающей Господа своего, послушной его законам и покорной его предначертаниям, и с которой, конечно, нельзя вытворять всякие гнусные штучки, привычные для той, другой, готовой на все мерзости, как французские шлюхи, да она похуже и этих, ведь, если подумать, они все же имеют совесть вешать красный фонарик на двери, а подобные гадости, будьте уверены, не проделаешь с единственной возлюбленной дочерью доньи Ренаты Арготе и дона Фернандо дель Карпио, и прежде всего этого гранда, этого, без сомнения, святого человека, истинного христианина, кавалера ордена Гроба Господня, из тех, кто Божьей милостью не подвержен тлену могильному и чья кожа сохраняет свежесть и лоск атласного платья невесты, а глаза – живость и чистоту изумрудов… (Перевод с испанского М. Былинкиной.)
3 Рассказ многократно переводился и на русский язык; см. например, перевод Р. Рыбкина в сборнике «Последнее путешествие корабля-призрака» (М.: Пресс Лтд, 1994).
4 Почтовая служба фирмы «Рассел, Мэйджорс энд Уодделл», которая использовала перекладных лошадей и индейских пони.
5 Более подробно этот аргумент обсуждается в книге «Сингулярность уже близка»: глава 6, раздел «[The Impact…] on the Intelligent Destiny of the Cosmos: Why We Are Probably Alone in the Universe»; Ray Kurzweil, The Singularity Is Near, 2005, Viking.
6 Американская телевизионная викторина.
7 Speech Interpretation and Recognition Interface (Siri) – персональный помощник и вопросно-ответная система, разработанная компанией Apple.
8 James D. Watson, Discovering the Brain, National Academy Press, 1992.
9 Sebastian Seung, Connectome, How the Brain’s Wiring Makes Us Who We Are, Houghton Mifflin Harcourt, 2012; в русском переводе: Сеунг С. Коннектом: Как мозг делает нас тем, что мы есть. М.: Бином. Лаборатория знаний, 2014.
10 Множество Мандельброта, Zoom-видео: http://www.youtube.com/watch?v=gEw8xpb1aRA и http://www.youtube.com/watch?v=G_GBwuYuOOs
11 Беррес Фредерик Скиннер (1904–1990) – выдающийся американский психолог и писатель.
12 Ральф Уолдо Эмерсон (1803–1882) – американский писатель, поэт, философ и общественный деятель, один из виднейших американских мыслителей.
13 «Путешествие натуралиста вокруг света на корабле “Бигль”» (1839); первый русский перевод осуществлен в 1871 г. Е. Бекетовой.
14 Дарвин Ч. Происхождение видов путем естественного отбора, или Сохранение благоприятных рас в борьбе за жизнь (здесь и далее цитаты приводятся в соответствии с русским переводом шестого издания книги; СПб.: Наука, 1991).
15 Charles Darwin, The Origin of Species, P. F. Collier & Son, 1909, 185/95–96.
16 Charles Darwin, On the Origin of Species, 751. Peckham’s Variorum edition. Morse Peckham (ed.) (1959), The Origin of Species By Charles Darwin: A Variorum Text (Philadelphia).
17 Dahm R., Discovering DNA: Friedrich Miescher and the early years of nucleic acid research. Hum. Genet., 2008,122 (6): 565–81.
18 Николай Константинович Кольцов – выдающийся русский биолог, основатель русской советской школы экспериментальной биологии, автор идеи матричного синтеза хромосом; в 1920 г. был арестован по делу так называемого Тактического центра и приговорен к расстрелу, но освобожден по ходатайству М. Горького; скончался от инфаркта после снятия с должности директора им же созданного Института экспериментальной биологии (теперь Институт биологии развития РАН) и допросов по делу Н. И. Вавилова.
19 Valery N. Soyfer, The consequences of political dictatorship for Russian science. Nature Reviews Genetics, 2001, 2 (9): 723–729.
20 Watson J. D. and Crick F.H.C. A Structure for Deoxyribose Nucleic Acid. Nature, 1953, 171 (4356): 737–738; http://www.nature.com/nature/dna50/watsoncrick.pdf. Double Helix: 50 Years of DNA, Nature Archives, http://www.nature.com/nature/dna50/archive.html.
21 Франклин умерла в 1958 г., а Нобелевскую премию за открытие ДНК вручали в 1962 г. Существуют разные мнения относительно того, получила бы ее Франклин или нет, если бы была жива.
22 Альберт Эйнштейн, «К электродинамике движущихся тел», 1905. В этой статье была сформулирована Специальная теория относительности. См. Lindsay, Robert Bruce; Margenau, Henry (1981). Foundations of physics. Ox Bow Press. p. 330.
23 См. https://ru.wikipedia.org/wiki/Радиометр_Крукса.
24 Заметим, что часть импульса фотонов передается молекулам воздуха (поскольку в колбе находится разреженный воздух, а не абсолютный вакуум), а затем от нагретых молекул воздуха – к лопастям.
25 Альберт Эйнштейн, «Зависит ли инерция тела от содержащейся в нем энергии?» В этой статье была представлена знаменитая формула Эйнштейна E = mc2.
26 Письма Альберта Эйнштейна президенту Франклину Делано Рузвельту, см. http://hypertextbook.com/eworld/einstein.shtml.
27 Мариан Даймонд – профессор анатомии из Калифорнийского университета в Беркли; участвовала в анализе головного мозга А. Эйнштейна.
28 Хоум-ран – удар в бейсболе.
29 Жоэль Хейвманн – журналистка, автор книги о болезни Паркинсона A Life Shaken: My Encounter with Parkinson’s Disease.
30 Английское слово portly (тучный, толстый) созвучно фамилии Портман.
31 Дэвид Хантер Хьюбел (1926–2013) – канадско-американский нейрофизиолог, лауреат Нобелевской премии по физиологии и медицине за 1981 г. «За открытия, касающиеся принципов переработки информации в нейронных структурах».
32 Считается, что некоторые не относящиеся к млекопитающим животные, такие как вороны, попугаи и осьминоги, тоже в определенной степени способны размышлять, однако эта их способность неразвита и недостаточна для того, чтобы создавать орудия. У этих животных произошла адаптация других отделов мозга, осуществляющих некоторые этапы иерархического мышления, но для неограниченного иерархического мышления, на какое способен человек, нужна новая кора.
33 Mountcastle, V. B. (1978), An Organizing Principle for Cerebral Function: The Unit Model and the Distributed System, in Gerald M. Edelman and Vernon B. Mountcastle, The Mindful Brain, MIT Press, 1982.
34 Herbert A. Simon, The Organization of Complex Systems. Hierarchy Theory, The Challenge of Complex Systems, Edited by Howard H. Pattee, George Braziller, Inc., New York, 1973; http://blog.santafe.edu/wp-content/uploads/2009/03/simon1973.pdf.
35 Ноам Хомский (Наум Чомски; род. в 1928) – американский лингвист, публицист, политолог и философ; автор классификации языков, называемой иерархией Хомского.
36 Marc D. Hauser, Noam Chomsky and W. Tecumseh Fitch. The Faculty of Language: What Is It, Who Has It, and How Did It Evolve? Science. November, 2002, Volume 298, 1569–1579; www.wjh.harvard.edu/~mnkylab/publications/languagespeech/Hauser,Chomsky,Fitch.pdf.
37 Сэмюэл Батлер (1835–1902) – английский писатель, художник и переводчик.
38 Марвин Ли Минский (род. в 1927) – американский ученый в области искусственного интеллекта, один из основателей лаборатории искусственного интеллекта в Массачусетском технологическом институте.
39 Амброз Бирс (1842–1913/1914) – американский писатель и журналист, составитель сатирического сборника афоризмов «Словарь Сатаны».
40 Ниже представлен фрагмент книги Рэя Курцвейла и Терри Гроссмана «Transcend, Nine Steps to Living Well Forever», Rodale, 2009, в котором подробнее описана данная техника. Я придумал способ решать задачи во сне. Я несколько десятилетий отрабатывал этот метод и обнаружил некоторые детали, которые позволяют ему функционировать лучше. Начинаю я с того, что перед тем, как идти спать, формулирую для себя интересующую меня проблему. Это может быть проблема любого рода: математическая задача, элементы моих разработок, деловые вопросы и даже отношения с людьми. Я думаю об этом несколько минут, но не пытаюсь искать решение. Это только прервет творческий процесс поиска. Я пытаюсь обдумывать. Что мне действительно известно? В какой форме должен быть ответ? А потом я иду спать. Эта процедура заставляет мое подсознание работать в заданном направлении. Терри: Зигмунд Фрейд писал, что, когда мы видим сны, многие сенсорные центры в нашем мозге расслабляются, поэтому во сне мы можем видеть вещи, в реальности являющиеся социальными, культурными и даже сексуальными табу. Нам могут сниться таинственные вещи, о которых мы не можем позволить себе думать днем. Это одна из причин странности снов. Рэй: Существуют также профессиональные ограничения, мешающие творческому движению мысли, многие из которых сформировались еще в процессе обучения, такие блоки как: «проблему обработки сигнала нельзя решить этим способом» или «лингвистика не допускает использования этих правил». Данные постулаты во сне тоже ослабевают, а потому я могу думать о новых путях решения проблемы, не будучи ограничен «дневными рамками». Терри: Кроме того, когда мы спим, отключается часть нашего мозга, ответственная за оценку разумности наших идей. Это еще одна причина, почему во сне с нами происходят таинственные и фантастические вещи. Если слон проходит через стену, мы не удивляемся, а просто отмечаем про себя: «О’кей, слон проходит через стену, ничего особенного». Если я просыпаюсь среди ночи, я часто обнаруживаю, что обдумывал стоящую передо мной проблему в очень странном и нестандартном ракурсе. Рэй: Следующий этап наступает утром, на границе между сном и бодрствованием. Эту фазу сна часто называют осознанными сновидениями. В этом состоянии я по-прежнему сохраняю ощущения и образы из моего сна, но теперь уже пользуюсь рациональным мышлением. Я, например, понимаю, что лежу в постели, и могу сформулировать рациональную мысль о том, что у меня много дел и поэтому мне лучше бы встать. Но это было бы ошибкой. Если я могу, я остаюсь в постели и сохраняю состояние осознанных сновидений, поскольку именно в нем состоит суть творческого метода решения проблем. Кстати, если звонит будильник, метод не работает. Читатель: Звучит прекрасно. Рэй: Так и есть. Я по-прежнему имею доступ к снам о тех проблемах, на которые настроил себя накануне. Но при этом нахожусь в сознании и способен рационально мыслить, чтобы оценить новые творческие идеи, пришедшие мне на ум ночью. Я могу определить, какие из них осмыслены. Примерно через 20 минут я начинаю видеть свою проблему по-другому. Этот метод помог мне сделать несколько изобретений (и потратить остаток дня на написание патентных заявок), спланировать материал для книг и выработать полезные идеи для решения самых разных проблем. Если мне нужно принять важное решение, я всегда прибегаю к этому способу рассуждений и весьма доверяю принятым решениям. Важнейший момент здесь – дать развиваться вашей мысли, не судить ее преждевременно и не думать о том, хорошо ли работает метод. Этот метод противоположен методу ментальной дисциплины. Подумайте о проблеме, но затем во сне позвольте идеям захватить вас. А утром вновь включите разум и пересмотрите пришедшие вам во сне странные идеи. Для меня лично это бесценный метод использования творческого начала из моих снов. Читатель: Отлично, такие трудоголики, как мы, теперь могут работать и во сне. Однако я не уверен, что моей жене это понравится. Рэй: А вы можете считать, что теперь ваши сны делают за вас вашу работу.
41 J. G. Taylor, B. Horwitz, K. J. Friston, Neural modeling and functional brain imaging: an overview, Neural Networks, Volume 13, Nov. 2000, 829–846.
42 Уильям Джемс (или Джеймс; 1842–1910) – американский философ и психолог, один из основателей прагматизма.
43 Стивен Пинкер – канадско-американский ученый, психолог, популяризатор науки.
44 Steven Pinker, How the Mind Works, Norton Press, 1997, 152–153.
Читать далее