Алексей Потапов рассказывает о переосмыслении своих религиозных убеждений, объясняет, почему человек — не венец эволюции, считает, что в фундаментальном научном плане в области искусственного интеллекта далеко не все в порядке. Новый герой в постоянной рубрике T&P.

Где учился математико-механический факультет СПбГУ, аспирантура ГОИ имени Вавилова, докторантура СПБГУ ИТМО.

Что изучает Компьютерное зрение, машинное обучение и искусственный интеллект (в частности сильный или универсальный искусственный интеллект).

Особые приметы Увлечения — игра го, единоборства, научная фантастика, иностранные языки.

Изучение проблем мышления, его происхождения и возможности искусственного воспроизведения сказывается и на мировоззрении. Хотя я был воспитан как атеист, но изучение этих проблем сместило мое мировоззрение от чистого атеизма в сторону пантеизма — концепции того, что природа, или Вселенная, и есть бог. Но бог представляется не как личность, а говоря упрощенно как некая глобальная сила, которая управляет мирозданием, его развитием. Наверное, такой взгляд достаточно распространен среди ученых, и он немногим отличается от обычного атеизма. Однако рассмотрение вопросов эволюции показывает, что возникновение мышления не чисто случайно и не предопределено каким-то высшим разумом, но при этом закономерно. И вот наличие этой закономерности заставляет рассматривать мышление как обязательный элемент физической картины мира. Если мышление в каком-то виде присутствует как базовый элемент физической картины мира, то это уже не укладывается в рамки примитивного атеизма, где «бог» полностью заменяется простыми физическими законами. Однако к религии все это имеет весьма косвенное отношение.

«Рассмотрение вопросов эволюции показывает, что возникновение мышления не случайно и не предопределено каким-то высшим разумом, но при этом закономерно. Наличие этой закономерности заставляет рассматривать мышление как обязательный элемент физической картины мира»

Связь между исследованиями естественного и искусственного интеллекта довольно интересна. С одной стороны, естественный интеллект — единственный имеющийся «прототип» для разработчиков искусственного интеллекта, и интуитивно может показаться, что изучение этого прототипа должно предшествовать и служить основой для создания его искусственного аналога. Но, с другой стороны, математические методы нередко опережают результаты исследования мозга и служат основой для их интерпретации. Особенно показательны в этом плане теория алгоритмов и теория информации. Ведь до разработки этих математических теорий работа мозга в принципе не описывалась в терминах алгоритмов и информации. В лучшем случае, делались попытки поиска законов работы мозга сродни физическим. Сейчас же просто невозможно представить, как можно описывать естественный интеллект, если не через алгоритмы, информацию или некоторые другие математические понятия.

Это не означает, что именно названные понятия лучше всего подходят для такого описания. К примеру, есть попытки описания работы мозга в терминах теории динамических систем. Но это тоже математическая теория, которая разрабатывалась не нейрофизиологами или психологами. Иными словами, пока не хватает математического языка для правильной интерпретации работы мышления, сами по себе исследования естественного интеллекта не позволят нам до конца понять принципы его работы, хотя и могут послужить основой для ценных идей. Наиболее глубокие работы в области искусственного интеллекта как раз и формируют подходящий язык. Они отталкиваются далеко не только от данных о работе мозга, но и от математического анализа тех задач, которые должен решать интеллекта. Почему же математика оказывается обязательной основой для изучения мышления? Ответ прост: математика — это язык науки, выработанный для повышения ее эффективности, а сама наука — один из наиболее впечатляющих продуктов мыслительной деятельности людей.

Нередко возникает вопрос, не безопасно ли создавать искусственный интеллект? Однако художественные фильмы о порабощающих человечество машинах с искусственным интеллектом крайне далеки от реальности. Если у нас период удвоения генома составлял сотни миллионов лет, то период удвоения емкости компьютерной памяти или частоты процессоров составляет единицы лет. И следующий метасистемный переход с возникновением сверхразума произойдет достаточно быстро. Такой сверхразум очень скоро станет гораздо выше человеческого, просто несоизмеримым с ним. И смысла воевать, порабощать людей у него не будет. Соперничество, о котором обычно говорится в художественной литературе или фильмах, может возникать, только когда стороны более или менее равны. А такого, скорее всего, не будет.

«Если у нас период удвоения генома составлял сотни миллионов лет, то период удвоения емкости компьютерной памяти или частоты процессоров составляет единицы лет. И следующий метасистемный переход с возникновением сверхразума произойдет достаточно быстро»

Но зачем создавать искусственный интеллект? Существует концепция технологической сингулярности, которая показывает, что происходит непрерывный рост сложности кибернетических систем. То есть сначала были замкнутые кибернетические системы (скажем, отдельные атомы, молекулы), потом возникли репликаторы ДНК, которые накапливают в себе больше информации, затем появилась нервная система, язык, письменность, книгопечатание, компьютеры, интернет. Емкость таких кибернетических систем все время возрастает, и темпы роста тоже возрастают. Если построить эту кривую и продолжить ее, оказывается, что она уходит в бесконечность за конечное время. Будет ли выполняться эта тенденция в дальнейшем или нет — это весьма дискуссионный вопрос, но то, что нет никаких причин считать человека венцом эволюции — факт.

Есть разные так называемые сингулярные технологии, подразумевающие возможность возникновения сущности, которая будет находиться на новом уровне по сравнению с человеческим интеллектом. Такой процесс, судя по всему, неизбежен. Поэтому заниматься ИИ надо не для того, чтобы просто его создать, а для того, чтобы направить процесс создания в нужное русло. Сейчас все большее количество исследователей, которые занимаются сильным (или, точнее, универсальным, способным решать самые разные задачи) искусственным интеллектом, озабочены тем, чтобы он в итоге оказался дружественным. Скоро даже будет первая международная конференция по проблемам безопасного искусственного интеллекта. Кстати, только недавно к созданию сильного искусственного интеллекта начали возвращаться настоящие ученые, и тема стала закрепляться как официальная. Еще недавно среди людей, которые занимались созданием мыслящей машины, были, в основном, фрики от науки, некомпетентные ученые.

Тем не менее до сих пор по большей части те специалисты, которые занимаются искусственным интеллектом, сторонятся таких задач, предпочитают заниматься частными вопросами искусственного интеллекта, то есть, тем, что называется слабым или узкоспециализированным ИИ, который ко всему этому имеет весьма отдаленное отношение. Например, шахматная программа, которая обыгрывает чемпиона мира, — это именно специализированный интеллект, она не обладает никаким самосознанием и у нее, естественно, не возникнет амбиций по захвату миру. Создание беспилотного автомобиля –тоже узкоспециализированная задача, как и создание бытового робота. Это могут быть и фундаментальные, но частные задачи, например, как лучше классифицировать некие образы по каким-то признакам.

Я тоже много лет занимаюсь такими вопросами. К примеру, участвовал в разработке системы зрения робота-пылесоса — одного из тех, которые сейчас существуют на международном рынке. Это было достаточно сложно, но, с другой стороны, мы здесь не являлись первопроходцами, поэтому мы знали, что решение может быть достигнуто. Наша задача заключалась в том, чтобы оно оказалось патентно чистым и было не хуже, чем у конкурентов. Мы занимались этим два года и создали новые методы компьютерного зрения, использованные в бытовом роботе. Еще недавно подобные идеи представлялись фантастикой, но нельзя сказать, что это хоть немного приблизило создание искусственного интеллекта.

У компьютерных наук (информатики и искусственного интеллекта) и фундаментальной науки, той же астрономии, несколько разный исследовательский дух. В компьютерных науках очень много статей, выступлений на конференциях, которые в общем-то особо не несут новой информации — просто люди чуть-чуть по своему решили проблему, которую когда-то где-то уже решили. Если кто-то разработал систему распознавания ряда объектов одним способом, а какая-то корпорация не хочет покупать патент, потому что это слишком дорого, она придумывает свой способ, который может быть не сильно лучше или вообще не лучше существующего, но он другой и не попадает под этот патент. Есть огромное количество работ, которые никому не интересны именно по этой причине. И лишь немногие работы действительно значимы. Но нередко ученые и разработчики не полностью описывают в статьях свои достижения, потому что это ноу-хау. В других науках есть более консолидированное совместное действие ученых, которые вместе толкают вперед развитие в данной научной отрасли.

«До сих пор системы компьютерного зрения практически не делают обучаемыми. И людям приходится зачастую вручную, с нуля создавать под каждую специализированную задачу новую систему, хотя, казалось бы, хорошее решение должно заключаться в том, чтобы компьютер сам научился разбираться с той или иной задачей. Такая ситуация показывает, что в фундаментальном научном плане в данной области далеко не все в порядке»

Технологический прогресс в компьютерном зрении сейчас, в основном, связан не столько с развитием научных методов, сколько с совершенствованием аппаратной базы. Конечно, математические методы тоже совершенствуются, но в целом уникальных, прорывных идей не было с 70-80-х годов, и это меня не очень устраивает. Люди концентрируются на технологиях, которые раньше нельзя было воплотить из-за недостаточного качества дешевой оптики или быстродействия процессоров. Но нужно понимать: проблему того, чтобы научить машину видеть нельзя в полной мере решить без того, чтобы научить машину мыслить. Мы уже не можем сделать по-настоящему интересные вещи, связанные с распознаванием произвольных объектов, интерпретацией сцен, без рассмотрения проблемы в комплексе с другими технологиями искусственного интеллекта. До сих пор системы компьютерного зрения практически не делают обучаемыми. И людям приходится зачастую вручную, с нуля создавать под каждую специализированную задачу новую систему, хотя, казалось бы, хорошее решение должно заключаться в том, чтобы компьютер сам научился разбираться с той или иной задачей. Такая ситуация показывает, что в фундаментальном научном плане в данной области далеко не все в порядке. Именно поэтому я не ограничиваюсь созданием конкретных технических систем или решением частных задач компьютерного зрения и машинного обучения, а пытаюсь также заниматься и проблемами универсального искусственного интеллекта, для чего с единомышленниками даже организовал отдельный проект, названный Aideus.

Хотя атмосфера научного поиска здесь не столь чиста, но есть и свои плюсы, один из которых — в гарантированной возможности зарабатывать деньги благодаря решению прикладных задач, что в настоящее время является немаловажным фактором для закрепления молодежи в науке. В астрономии, например, приемлемую зарплату можно получить разве что благодаря научным грантам. При этом участие в конкурсах и грантах отнимает много сил, увеличивает количество бюрократической работы, что в свою очередь снижает эффективность научной. А в нашей сфере, кстати, можно не только выполнять коммерческие заказы, но и заниматься разработкой собственной продукции. У меня есть знакомые, которые организовывали свои стартапы, пытались выпускать собственную продукцию. И в то же время, если хочешь заниматься наукой, ты можешь это делать.

© Игорь Симкин. Промышленный робот-манипулятор.

© Игорь Симкин. Промышленный робот-манипулятор.

Мне очень нравится, что проблемы искусственного интеллекта, компьютерного зрения, машинного обучения позволяют работать более «автономно». Опять же, в астрономии для проверки своих идей требуется очень сложное оборудование. Приходится ждать по полгода, чтобы тебе дали время на телескопе, и ты смог выполнить какое-то наблюдение для проверки своей идеи. Это не только в России. Чем более хороший телескоп требуется, тем больше на него очередь и сложнее вообще получить на нем время. Соответственно темпы выдвижения и проверки гипотез в таких науках ниже. Отчасти поэтому я перестал заниматься астрономией и перешел ту область, где в большей степени все зависит от самого человека.

Нам, кроме собственного мозга и обычного компьютера, толком ничего больше не надо. Только изредка возникают задачи (при желании их можно избегать), когда требуется специфическая техника. Например, может быть нужен робот с большим числом степеней свободы, и его бывает трудно достать, поскольку он продается только вузам или стоит очень дорого. Степень свободы — это ось, вокруг которой может производиться движение. Если у робота одна степень свободы, он, грубо говоря, сможет двигать руку только вверх и вниз. Две степени свободы — вверх, вниз, вправо, влево. Три — добавляется, к примеру, вращение руки вокруг своей оси. Или бывает нужна стереокамера, если мы хотим решать задачу стереозрения (которое есть у человека) для компьютера, или всенаправленная камера, которая смотрит сразу на 360 градусов. Но на самом деле это бывает редко, иногда даже возникают проблемы: по гранту столько-то денег необходимо потратить на зарплату, а столько-то — обязательно на покупку оборудования, и мы с трудом можем придумать, какое же оборудование нам закупить.

«Проблему того, чтобы научить машину видеть нельзя в полной мере решить без того, чтобы научить машину мыслить. Мы уже не можем сделать по-настоящему интересные вещи, связанные с распознаванием произвольных объектов, интерпретацией сцен, без рассмотрения проблемы в комплексе с другими технологиями искусственного интеллекта»

Именно благодаря этому над своими диссертациями я мог работать дома по вечерам, что и делал с удовольствием. Свою первую монографию «Распознавание образов и машинное восприятие» я писал параллельно с учебой в аспирантуре, и туда вошло то, что не вместилось в кандидатскую. Этот материал и стал основой докторской, благодаря чему, хотя я и не спешил с ее защитой, мне удалось это сделать в 28 лет. Так получилось потому, что я был увлечен проблемой, много над ней думал, пытаясь взглянуть на нее в более широком контексте, и в конце концов пришел к в общем-то известной, но не применявшейся к моей задаче весьма продуктивной идее.

«Искусственный интеллект и универсальное мышление» — книга молодого ученого Алексея Потапова

В кандидатской я использовал эту идею для решения задачи сопоставления изображений, а дальше продолжил развивать саму идею в рамках проблемы универсального машинного обучения. Базовая идея — принцип минимальной длины описания, который устанавливает то, как выбирать наилучшую модель или гипотезу, объясняющую наблюдательные данные. В науке иногда используется правило бритвы Оккама: не следует плодить сущности сверх необходимого, а также не надо объяснять посредством большего нечто, что можно объяснить посредством меньшего. По сути, принцип минимальной длины описания, гласящий, что для лучшей модели достигается компромисс между ее точностью и сложностью, является теоретико-информационной формализацией бритвы Оккама. В связи с этим он может иметь и общенаучное значение, но все же гораздо важнее для автоматического выбора моделей в разных методах машинного обучения, компьютерного зрения и так далее.

В аспирантуре я сначала работал не только над этой темой — еще писал диссертацию по астрономии, но в конечном итоге остановился на проблематике компьютерного зрения и искусственного интеллекта. Здесь у меня не было четко выраженного научного руководителя, под управлением которого я бы решал сугубо научные задачи. Но было два человека, которые определяли круг решаемых практических задач и отчасти — подходы к их решению, и которые давали полезные советы в научно-методическом плане. Но при этом у меня оставалась свобода творчества в научном поиске. Мне кажется, что это было весьма удачно, потому что нередко аспиранты защищают тот материал, который они наработали под жестким контролем руководителя, и в таких ситуациях диссертация получается хорошей, но молодой ученый после этого не готов к самостоятельным исследованиям. Противоположная ситуация, при которой над аспирантом не осуществляется никакого руководства, тоже обычно ни к чему хорошему не приходит.

Сейчас я сам стал научным руководителем, общаюсь со студентами по поводу их курсовых, дипломных работ, кандидатских диссертаций. Это явный плюс преподавания — доступ к будущим научно-техническим кадрам. Правда, студенты редко могут сразу выступать в качестве помощников в решении серьезных научных или прикладных задач. Чаще приходится ставить перед ними вопросы, которые в большей степени имеют учебное значение.

Честно говоря, отчасти я разочаровался в преподавании, поскольку немного студентов проявляет действительно глубокий интерес к приобретению знаний и науке. Но, к счастью, такие студенты все же есть, и, кроме того, преподавание имеет дополнительные плюсы. Шутка о преподавателе, который говорит: «Даже я уже разобрался, а вы все никак не можете», — вполне справедлива. Преподавание нового предмета — это хороший повод углубить и расширить свои знания о нем.

Отчасти для того же я недавно написал книгу «Искусственный интеллект и универсальное мышление», которую можно отнести к почти научно-популярным. Хотелось систематизировать имеющиеся у меня знания в данной области и попытаться выразить их на максимально простом языке, потому что, как говорил Эйнштейн, если вы не можете объяснить что-то шестилетнему ребенку, значит, вы этого не понимаете. Я старался, чтобы она была понятна даже школьникам, по крайней мере, некоторым из них. Я надеюсь, что благодаря этому к нам пойдет больше талантливых абитуриентов, которые потом станут для меня коллегами и единомышленниками.