Какую часть математических доказательств можно поручить компьютеру? Какие существуют виды интерактивных систем поиска математических доказательств? В чем заключается теорема о четырех красках? И как она была доказана? Математик Лев Беклемишев о теории множеств, интерактивных системах и проблеме о четырех красок.
Может ли компьютер помочь математику доказывать теоремы? Ответ, разумеется, да, но в какой степени и в каких частях? Есть разные точки зрения на этот предмет. Традиционно компьютер помогает математику в символьных вычислениях, решении уравнений, численных экспериментах и так далее. Однако можно ли компьютер использовать более существенным образом, а именно полностью поручить ему весь процесс доказательства математического результата?
1. Проблема использования компьютеров в математике
Необходимо вспомнить достижения логики начала ХХ века, которые говорят о том, что, с одной стороны, математические доказательства могут быть полностью сведены к преобразованиям конечных последовательностей символов в рамках некоторых формальных систем, таких как теория множеств. То есть известен конечный набор аксиом и правил, по которым можно вывести в принципе любое доказуемое математическое утверждение. Однако, с другой стороны, не существует алгоритма, который позволяет по данному высказыванию в какой-то конкретной формальной системе узнать, доказуемо оно или нет. Единственное, что может делать компьютер, — это постепенно в результате процесса вычисления порождать всё новые высказывания, выводимые в данной формальной системе, и этот процесс потенциально никогда не заканчивается. Так как мы не можем заранее знать, встретится или нет в этом перечислении интересующий нас результат, мы не можем рассчитывать и на построение его формального доказательства за конечное время.
Несмотря на эти теоретические соображения, которые вроде бы означают, что с автоматическим доказательством теорем раз и навсегда должно быть покончено и дело надо поручить творчески работающим ученым, те же самые ученые понимают, что некоторые рутинные части их повседневной работы очень хотелось бы отдать компьютеру. Но вот то, как это сделать, представляет собой значительную техническую проблему, которая связана не только с развитием математики и исследованиями логических теорий, но также и с развитием определенных компьютерных технологий.
Приблизительно лет пятнадцать-двадцать назад развитие компьютерных технологий достигло такого уровня, когда стало возможно всерьез надеяться на создание систем, которые действительно могли бы помочь работе математика при построении и проверке математических доказательств, то есть фактически взять на себя часть его интеллектуальной работы. На данный момент эта область очень быстро развивается, и существует больше десятка различных систем, предназначенных для автоматического и полуавтоматического, то есть интерактивного, доказательства теорем. Для этих систем появилось специфическое название «прувер».
2. Виды пруверов
Системы делятся на два класса: автоматические, которые ищут доказательства совершенно независимо от человека, и интерактивные, которые взаимодействуют с человеком; он помогает компьютеру находить эти доказательства. И именно такие интерактивные системы наиболее перспективны для формализации реальных математических доказательств. И даже среди таких интерактивных систем существует довольно большая конкуренция. В настоящее время наиболее известны несколько: одна из них — это система Coq, разрабатываемая во Франции, есть конкурирующие с ней системы HOL, NuPRL и другие.
Интересно, что на основе этих систем были уже получены полностью формализованные доказательства целого ряда знаменитых математических результатов. Среди них, например, теорема Жордана о кривых, или доказательство закона распределения простых чисел, теорема Геделя о неполноте и самая знаменитая, пожалуй, — это формализация теоремы о четырех красках.
3. Теорема о четырех красках
Что такое теорема о четырех красках? Она долгое время была недоказанной математической гипотезой и состояла в том, что каждую карту на плоскости можно раскрасить правильным образом в четыре цвета. "Правильным образом" — это означает, что разные страны на этой карте, если они имеют общий участок границы, должны быть покрашены в разные цвета. Если исключить некоторые патологические ситуации, то хорошие карты на плоскости в соответствии с этой теоремой о четырех красках всегда можно раскрасить в четыре цвета.
История этой задачи довольно интересная. Высказал эту гипотезу впервые один любитель математики по фамилии Гутри в ХIХ веке. Через 10 лет было предложено два доказательства этого результата, в которых быстро нашли ошибки. И с тех пор эта задача приобрела статус очень известной математической гипотезы, которая оставалась недоказанной в течение более ста лет.
Первое доказательство этой гипотезы было получено с помощью компьютеров уже в ХХ веке американскими учеными Аппелем и Хакеном. Аппель и Хакен свели доказательство этого результата к перебору значительного числа случаев. В первом варианте этот перебор превышал тысячу случаев, и нужно было проверить для этой тысячи конфигураций некоторые свойства. Эту проверку они осуществили с помощью компьютерной программы.
Само сведение к тысяче случаев было далеко не тривиальным и в общем занимало несколько сотен страниц, то есть это был очень сложный математический результат, сопровождаемый еще сложным перебором. И при уровне развития компьютерной техники в те времена надеяться на то, что все в этом переборе правильно, было нельзя. Не все признавали эту теорему доказанной, и оставалось только верить компьютеру, что он не ошибся.
В дальнейшем выяснилось, что в их сведении были пропущены некоторые случаи и не все было чисто в этом доказательстве. Исправленный вариант Аппель и Хакен опубликовали уже в 90-е годы. Вслед за этим другие ученые, также известные специалисты по теории графов, упростили их доказательство и свели эту задачу к перебору значительно меньшего числа случаев. Тем не менее перебор превышал несколько сотен случаев и без помощи компьютера добиться решения этой проблемы не удавалось.
И по-прежнему, поскольку компьютер участвовал в этом процессе, у математиков не было доверия к полученному решению. После этого за дело взялись специалисты по формальной математике, потому что было понятно, что здесь как раз тот случай, когда построение полностью формализованного и проверенного (как говорят в таких случаях, «верифицированного») доказательства теоремы может спасти положение и убедить всех в ее корректности. А такую верификацию можно также было сделать только с помощью компьютера.
Эта работа заняла несколько лет, группа французских ученых под руководством Жоржа Гонтье завершила ее в 2004 году, и с помощью одной из таких систем интерактивного поиска вывода, системы Coq, они на этот раз формально доказали гипотезу о четырех красках. При этом им пришлось верифицировать как содержательную часть доказательства, сведение к перебору, так и формально доказать корректность алгоритма той программы, которая осуществляла перебор. В этом было принципиальное отличие их работы от предыдущих доказательств этой теоремы: компьютерное вычисление было снабжено компьютерным же доказательством его корректности. Конечно, это был успех, потому что формальные верифицированные математические доказательства имеют гораздо большую надежность, чем любое сколько-нибудь объемное доказательство, полученное человеком. Таким образом, теорему о четырех красках, при всей ее громоздкости, можно считать на данный момент одним из наиболее тщательно проверенных и надежно установленных математических результатов.
4. Принцип де Брейна
Этот случай, конечно, стал очень известен, о нем публиковали в газете New York Times, но насколько надежными в принципе могут быть компьютерные доказательства? И вообще, где гарантия того, что какие-то логические построения и выводы, которые получает компьютер, более надежны, чем обычные компьютерные программы, в которых, как известно, часто встречаются ошибки? Всякий, кто пользовался персональным компьютером, наверняка имел возможность в этом убедиться на собственном опыте.
Для систем компьютерного доказательства, конечно, критично иметь высокую надежность. Абсолютной надежности тем не менее не гарантирует ни один прувер, а относительную, но очень хорошую надежность гарантирует архитектура этих систем. Дело в том, что в идеале такая компьютерная система должна соответствовать так называемому принципу де Брейна, названному в честь голландского специалиста по информатике. Этот принцип состоит в следующем: система состоит из двух частей, из маленького и просто описываемого ядра, которое называется логическим ядром и которое представляет собой примерно то же самое, что и формальная система. Логическое ядро задается набором правил, по которым генерируются формальные доказательства. Это логическое ядро может быть снабжено верификатором, то есть модулем, который проверяет, соответствует ли данный формальный текст этим логическим правилам. Поскольку логических правил мало и ядро маленькое, то такой верификатор не занимает много места и сравнительно прост. Более того, каждый человек может при желании написать свой собственный верификатор, который проверит, верно построенное формальное доказательство или нет.
А помимо этого логического ядра имеется большой модуль, который не обязан быть таким уж простым, а может быть сколь угодно сложным. Это система, которая облегчает взаимодействие человека с ядром или с компьютером. И надежность получаемых доказательств не зависит от того, насколько большая или надежная эта дополнительная часть. В худшем случае, если в дополнительной части не все в порядке, у пользователя просто не получится построить часть доказательств, но все построенные будут корректными с точки зрения ядра.
К сожалению, принцип де Брейна в реально существующих системах выдерживается не всегда, не все пруверы могут явно сгенерировать полностью формальный текст доказательства. Встречаются непрозрачные тактики поиска вывода, но тем не менее, по большому счету, эти системы дают лучшую гарантию надежности, чем любые другие методы, в том числе традиционное «ручное» доказательство теорем.
5. Перспективы
В настоящее время технология формализации математических доказательств вышла за пределы собственно математики. Разумеется, главные надежды связаны с применением этой технологии не столько к математическим доказательствам, сколько к задачам верификации и повышения надежности программ. Методы формализации особенно перспективны в тех областях, где критично иметь очень высокую гарантию надежности софта, например в космосе или ядерной энергетике. Пока что стоимость в терминах затрат времени и человеческого труда при использовании данной технологии все-таки очень высока. Но при существующих темпах развития этой отрасли есть надежда, что издержки продолжат быстро снижаться и в перспективе эта технология составит конкуренцию другим современным методам.
Лев Беклемишев — доктор физико-математических наук, член-корреспондент РАН, главный научный сотрудник Математического института им. В.А. Стеклова РАН, профессор факультета математика ВШЭ.
В чем заключается аксиоматический метод? Как развивалось понятие аксиомы? Кем был разработан аксиоматический метод? Какое место он занимает в математике? И какой критике подвергается этот метод? Математик Лев Беклемишев о неевклидовой геометрии, системе аксиом Гильберта и смысле в математике.
Вычислимая функция f:N→N называется доказуемо рекурсивной в данной формальной теории T, если существует алгоритм её вычисления такой, что в T можно доказать утверждение «для любого x существует y такой, что f(x)=y». В математической логике такие функции изучаются по двум причинам. Во-первых, для данной программы нас часто интересует доказательство её корректности, в частности вопрос о том, завершает ли она работу при любых исходных данных. С другой стороны, варьируя функцию f мы можем ставить для теории T сколь угодно сложные (вплоть до невыполнимости) задачи на доказательство. Тем самым, доказуемо рекурсивные функции могут быть использованы для изучения различных формальных теорий. Такой подход приводит к наиболее впечатляющим на сегодняшний день примерам недоказуемых комбинаторных утверждений. Мы начнем с понятия машины Тьюринга и вычислимой функции. Разберемся, как формальная арифметика может говорить о вычислениях. Поймем, что для любых разумных систем аксиом T их запас доказуемо рекурсивных функций никак не может исчерпывать все вычислимые всюду определенные функции. Отсюда выведем первую теорему Гёделя о неполноте.
Принцип исключенного третьего говорит, что любое утверждение либо истинно, либо ложно. В этом курсе мы откажемся от принципа исключенного третьего. Мы не сможем ни доказывать от противного, ни перебирать случаи. Зато все наши доказательства будут в каком-то смысле конструктивны: доказательство существования объекта всегда можно будет превратить в компьютерную программу, которая строит этот объект. На практике конструктивные доказательства полезнее неконструктивных. Я расскажу о некоторых утверждениях конструктивной математики и о её связи с компьютерными системами доказательств.
Разные варианты выбора неопределяемых понятий. Система аксиом Тарского (по-видимому, самая простая из известных). Роль аксиом непрерывности с точки зрения различия логики первого и второго порядков. Модели и синтаксические интерпретации формальных теорий. Несколько классических интерпретаций, в том числе взаимная интерпретируемость гиперболической и евклидовой геометрии, элементарной геометрии Тарского и элементарной теории поля вещественных чисел, интерпретация теории поля вещественных чисел в арифметике натуральных чисел. Теоремы Тарского о полноте аксиоматики и о существовании алгоритма, распознающего истинность утверждений элементарной геометрии.
Классическая логика высказываний исходит из предположения о том, что любые высказывания либо истинны, либо ложны. Логика доказуемости отражает более глубокую картину мира, осознанную после теорем Гёделя о неполноте: истинность высказывания, вообще говоря, не равносильна его доказуемости. Можно ли — и если да, то как — говорить на уровне логики о доказуемости или недоказуемости высказываний, наряду с их истинностью или ложностью? Программа: Логика высказываний и её модели. Модальная логика, модели Крипке. Логика Гёделя-Лёба GL. Теорема о полноте логики GL по Крипке на конечных деревьях. Формальная арифметика Пеано. Гёделева нумерация. Теорема о неподвижной точке. Формулы доказуемости и непротиворечивости. Теоремы Гёделя, Россера и Лёба. Доказуемость как модальность: арифметическая интерпретация логики GL. Замкнутые модальные формулы, последовательность Тьюринга, локальная рефлексия. Существование и единственность модально определимых неподвижных точек (теорема де Йонга).
В докладе рассмотрены два класса объектов, имеющих различную природу, но неожиданным образом аналогичные по своим свойствам. С одной стороны, так называемые алгебры доказуемости, возникающие при изучении свойств формальной доказуемости в арифметических теориях. С другой стороны, топологические пространства, наделённые одной или несколькими разреженными топологиями, то есть такими, что любое непустое подмножество X имеет хотя бы одну изолированную точку.
«Качественная» теория алгоритмов (не касающаяся понятия сложности вычислений) может быть построена на интуитивном представлении о том, что такое алгоритм. Такого представления, при некотором его уточнении, оказывается достаточно для того, чтобы доказать первые базовые теоремы теории алгоритмов. В лекции будет приведено указанное уточнение, определено понятие вычислимости и понятие породимости («выводимости в формальной системе»), доказано несколько теорем, другие теоремы — предложены в качестве задач. Будут приведены и примеры т.н. «уточнения понятия алгоритма». Для понимания лекции желательно умение читать по-русски, знание латинского алфавита и представление о натуральном ряде.
Знаменитая Теорема Гёделя о неполноте имеет две версии — синтаксическую (объявленную и доказанную самим Гёделем) и семантическую (чаще всего фигурирующую в популярных рассуждениях о великой Теореме). Семантическая версия утверждает, что какую бы систему формальных доказательств ни придумать, в языке найдутся истинные утверждения, не доказуемые в рамках предложенной системы. Таким образом, семантическая версия исходит из того, что некоторые выражения языка выражают осмысленные утверждения, являющиеся истинными или ложными. Синтаксическая версия не опирается на то, что какие бы то ни было выражения языка имеют какой-то смысл, она смотрит на выражения как на синтаксические конструкции, то есть как на цепочки символов, организованные по определённым правилам.
Попытки дать математические определения понятий формального доказательства, истинности, формализованной деятельности по инструкции привели к построению математической логики и теории алгоритмов — области математики, результаты которой сформировали и продолжают формировать основы информатики и влиять на практическое использование цифровых технологий. Важнейшие результаты данной области, наряду с указанными определениями — это результаты о невозможности, в свою очередь тесно связанные с результатами об универсальности и диагональными конструкциями.
Документальный фильм режиссера Е. Гордиенко по сценарию А. Липкова «Николай Лобачевский» из цикла «Великие имена России» рассказывает о жизни и творчестве великого русского ученого Н.И. Лобачевского (1792–1856), работы которого положили начало новому направлению в математике — неевклидовой геометрии. Гостелерадио СССР, 1983 г.