Слишком закручено, чтобы решить

Часть II: как доказать неразрешимость уравнений пятой степени, гуляя по петлям

Это вторая часть. В первой мы доказали теорему Абеля-Руффини алгебраически: симметрию корней сделали группой, а неразрешимость свели к простоте группы . Здесь мы попытаемся доказать ту же теорему, но геометрически, через движение корней по комплексной плоскости. Это доказательство принадлежит Владимиру Арнольду, в нем он не использует ни теории Галуа, ни даже понятия группы Галуа, и при этом, в некотором отношении, его доказательство оказывается сильнее. Знакомство с первой частью полезно, но не обязательно, вторая часть самодостаточна.

Пролог. Ожившие корни

В первой части под одним из комментариев возникла интересная дискуссия. Речь шла о фразе: не существует многочлена с рациональными коэффициентами, который различал бы и . Читатель резонно возразил: а как же ? Ведь , а , мы видим, что значения разные, а следовательно корни различены.

Выражаю благодарность автору комментария, так как началом этой части отлично послужит ответ на этот вопрос.
Различие здесь означает не принятие разных значений, а отделение одного корня от другого некоторым условием с рациональными коэффициентами. А этого сделать нельзя, так как для любого многочлена с рациональными коэффициентами выполнено $f(-i) = \overline{f(i)}$ , поэтому если , то и . Отображение $i \mapsto -i$ переставляет корни, не нарушая ни одного рационального соотношения.

Приступим к танцам на осях. До сих пор и были двумя застывшими точками. А что, если заставить их двигаться? Возьмём их как корни уравнения и начнём менять свободный член, для удобства рассмотрим и поведём от куда-нибудь и обратно. Корни $\pm\sqrt{-c}$ поползут по плоскости. И тут обнаружится кое-что удивительное: можно провести по замкнутому пути и вернуть в исходную точку так, что корни поменяются местами.

Геометрический смысл их неразличимости таков, что корни не просто симметричны статически, их можно физически переставить непрерывным движением коэффициентов.

Наконец-то нам не нужно будет тонуть в абстрактных алгебраических структурах, чтобы объяснять себе различные являения. Далее я буду стараться визуализировать некоторые утверждения для чуть более полного понимания ситуации.

Вся вторая часть про то, как из такого танца корней вырастает доказательство неразрешимости.

План у нас такой. Сначала в главах 1-3 мы рассмотрим три важных факта о том, как петли коэффициентов переставляют корни. Затем в главе 4 введём один хитрый тип петли вдоль которой радикальная формула возвращается к исходному значению, а корни переставляются. И в главе 5 увидим, что для пятой степени таких петель столько и они так запутаны, что никакая конечная формула из радикалов нам не поможет.

Начнём с факта, который мешает существованию формулы на самом базовом уровне, а именно с того, что корень — это, вообще-то, не совсем функция.

Глава 1. Корень — это не функция

Симптом +-

Вспомним школьную формулу для :

$x = \frac{-b \pm \sqrt{b^2 - 4ac}}{2a}.$

Знак $\pm$ обычно воспринимают как небольшое неудобство. Ну, два корня, давайте просто припишем плюс-минус. Но за этим стоит содержательная проблема. Функцией называют правило, которое каждому входу сопоставляет ровно одно значение. Формула выше этому не подчиняется, так как одному набору коэффициентов она сопоставляет два корня. Значит, перед нами не функция, а двузначное соответствие.

Может быть, это поправимо? Договоримся брать только арифметический корень со знаком . Но и это нас не спасает, потому что сама операция $\sqrt{\cdot}$ над комплексными числами тоже не функция. Давайте покажем это.

Многозначность квадратного корня

Запишем комплексное число в показательной форме: $z = re^{i\varphi}$ , где $r = |z| \ge 0$ — модуль, а $\varphi$ — аргумент. Тогда

$\sqrt{z} = \sqrt{r}e^{i\varphi/2}.$

С модулем $\sqrt r$ все хорошо — это обычный положительный корень. Вся проблема в фазе $e^{i\varphi/2}$ , корень делит аргумент пополам. К чему это приводит?

Проведём по окружности вокруг нуля, модуль держим постоянным, а аргумент $\varphi$ увеличиваем от до $2\pi$ . Точка $z = re^{i\varphi}$ опишет полный круг и вернётся на место, ведь $re^{i\cdot 2\pi} = re^{i\cdot 0}$ . Аргумент вернулся. А что тут с корнем? Подставим $\varphi = 2\pi:$

$\sqrt{z} = \sqrt{r} e^{i \cdot 2\pi / 2} = \sqrt{r} e^{i\pi} = -\sqrt{r}$ .

Корень сменил знак! Чтобы корень вернулся к исходному значению, нужно обвести его вокруг нуля дважды: при $\varphi = 4\pi$ получаем $e^{i \cdot 4\pi/2} = e^{2\pi i} = 1$ .

Корень вращается вдвое медленнее аргумента. Пока делает полный оборот вокруг нуля, $\sqrt z$ успевает лишь на полоборота и оказывается на противоположной стороне. Поэтому один обход нуля меняет $+\sqrt z$ на $-\sqrt z$ , переставляя значения корней.

Когда ползёт по окружности, корень обязан непрерывно за ним следовать. На полпути, где $\varphi = \pi$ и корень равен $\sqrt r e^{i\pi/2} = i\sqrt r$ , тут он уже как бы свернул на мнимую ось ровно посередине между $+\sqrt r$ и $-\sqrt r$ .

Забавно, что даже тривиальный случай с $\sqrt 1$ приводит к необычным результатам. Казалось бы, $\sqrt 1 = 1$ . Но давайте рассмотрим путь $z(t) = e^{2\pi i t}$ , возьмем от до : он выходит из , обходит ноль и возвращается в . Как ни определяй корень вдоль этого пути непрерывно, в конце получится $e^{\pi i} = -1$ . Начали с $\sqrt 1 = 1$ , а закончили $\sqrt 1 = -1$ . Выбрать значение корня раз и навсегда невозможно, пока мы разрешаем аргументу гулять по плоскости.

Ветвь и точка ветвления

Когда мы ограничиваемся небольшой областью, не содержащей нуля, и выбираем там одно из двух значений корня согласованно и непрерывно (например, то, для которого $\sqrt 1 = +1$ ), мы получаем настоящую однозначную функцию на этой области. Такой выбор одного значения многозначной операции называется её ветвью. Слово удачное, можно представить дерево значений, где мы выбираем одну ветку, по которой движемся непрерывно. Вдали от нуля ветви $+\sqrt z$ и $-\sqrt z$ живут раздельно и каждая однозначна.

Но стоит области охватить ноль, как согласованной ветви на ней нет, ведь обойдя ноль, мы переходим с ветви $+\sqrt z$ на ветвь $-\sqrt z$ . Точка, вокруг которой обход переводит одну ветвь в другую и в которой, что то же самое, значения функции сливаются, называется точкой ветвления. Для $\sqrt z$ точка ветвления единственна, это ноль.

Перестановка значений происходит при обходе точки ветвления, точки, где значения сливаются. Места слияния в некотором смысле управляют перестановками.

Корень многочлена как многозначная функция коэффициентов

Возьмём приведённый многочлен степени ,

$P(x) = x^n + a_{n-1}x^{n-1} + \dots + a_1 x + a_0,$

и будем смотреть на его корни как на функции коэффициентов $a = (a_0, \dots, a_{n-1}).$ У многочлена корней , $\dots, x_n(a)$ , то есть корень — это -значная функция от , как $\sqrt z$ был двузначной функцией от .

Пока коэффициенты таковы, что все корней различны, корни ведут себя предсказуемо: малый сдвиг чуть сдвигает их, и они не путаются. (Это гарантирует теорема о неявной функции). В этой ситуации корней распадаются на однозначных непрерывных ветвей, как $\sqrt z$ распадался на $+\sqrt z$ и $-\sqrt z$ вдали от нуля.

Теперь встает логичный вопрос: где ветви могут перепутаться? Там, где корни сливаются, а точнее там, где у многочлена появляется кратный корень. Это и есть точки ветвления нашей -значной функции. Им будет посвящена глава 3.

Формулы-функции не существует

Из многозначности вытекает утверждение, которое объясняет, зачем формуле вообще нужны радикалы.

Утверждение. Не существует непрерывной функции $\Phi: \mathbb{C}^n \to \mathbb{C}$ , которая каждому набору коэффициентов сопоставляла бы один из корней соответствующего многочлена.

Идею доказательства мы по сути уже проговорили. Будь такая непрерывная $\Phi$ , то, проведя коэффициенты по замкнутому пути, мы вернули бы и её к исходному значению, так как непрерывная функция, аргумент которой вернулся на место, возвращается к себе. Но мы видели на $\sqrt z$ , что бывают замкнутые пути коэффициентов, переставляющие корни. Вдоль такого пути $\Phi$ обязана была бы перейти от одного корня к другому, то есть не вернуться к себе. Получили противоречие. Значит непрерывной функции-формулы нет.

Теперь понятна стратегия всего доказательства. Радикал становится некоторой многозначностью очень специального сорта, так как $\sqrt[n]{\cdot}$ переставляет свои значений циклически, умножением на корень из единицы. Главный вопрос будет такой: достаточно ли послойной циклической многозначности радикалов, чтобы воспроизвести все перестановки корней, которые порождаются обходами? Нетрудно догадаться, что для степеней до четвёртой ответ — да. Для пятой, как мы покажем, перестановки корней устроены так, что никакая конечная комбинация циклических радикальных многозначностей нам не поможет.

Чтобы провести доказательство, нужно научиться работать с обходами и порождаемыми ими перестановками. Этим займемся в главе 2.

Глава 2. Петли и перестановки

Загадочные петли и где они обитают

Имеет смысл прояснить, а по чему вообще гуляют коэффициенты. Каждый набор $a = (a_0, \dots, a_{n-1})$ — это точка пространства $\mathbb{C}^n$ и одновременно один многочлен . Выколем из $\mathbb{C}^n$ множество тех наборов, при которых корни сливаются; обозначим его $\Sigma$ и подробно разберём чуть позже. Оставшееся пространство $B = \mathbb{C}^n \setminus \Sigma$ — это наборы коэффициентов с различными корнями. По нему мы и будем водить коэффициенты.

Путь в — это непрерывное движение $\gamma: [0,1] \to B$ , то есть закон , по которому коэффициенты меняются со временем от до . Петля же — это путь, который возвращается в исходную точку: $\gamma(0) = \gamma(1)$ . Пока что имеет смысл запомнить значение слова петля буквально как замкнутый путь коэффициентов.

Аналитическое продолжение корней

Зафиксируем стартовый набор и один из его корней. Когда коэффициенты поползут по пути $\gamma$ , этот корень обязан непрерывно двигаться вместе с ними.

Лемма о поднятии пути или об аналитическом продолжении корня. Пусть $\gamma: [0,1] \to B$ — путь, и — один из корней многочлена $P_{\gamma(0)}$ . Тогда существует единственная непрерывная функция $\tilde\gamma: [0,1] \to \mathbb{C}$ такая, что $\tilde\gamma(t)$ при каждом — корень многочлена $P_{\gamma(t)}$ , и $\tilde\gamma(0) = x_i$ .

Смысл достаточно прост: выбрав в начале, за каким из корней следить, мы однозначно прослеживаем его вдоль всего пути. Почему такая слежка однозначна? Вне $\Sigma$ корни различны, между ними всегда есть зазор, и непрерывно ползущий корень не может перескочить на соседний, ведь для этого пришлось бы либо нарушить непрерывность, либо столкнуться с другим корнем. Так зазор между корнями обеспечивает единственность.

Перестановка, порождённая петлёй

Применим аналитическое продолжение к петле. Пусть $\gamma$ — петля, коэффициенты которой вышли из и вернулись в . Прослеживая корень , в конце мы приходим к некоторому корню $\tilde\gamma(1)$ . Так как коэффициенты вернулись на место, многочлен в конце тот же, что в начале, и $\tilde\gamma(1)$ — это снова один из тех же n корней, но не обязательно тот, с которого начали.

Получаем отображение множества корней в себя:

$\mu_\gamma : {x_1, \dots, x_n} \to {x_1, \dots, x_n}.$

Оно биективно, то есть это перестановка корней. Назовём её перестановкой, порождённой петлёй $\gamma$ .

Явления, при котором обход замкнутого пути возвращает набор объектов на место, но переставляет их между собой, называется монодромией. Слово греческое: μόνος — «один», δρόμος — «бег», «пробег»; буквально «однократный обход». Оно прижилось в XIX веке, когда изучали поведение многозначных функций при одном обходе вокруг особой точки. Для нас же монодромией будет называться закон, по которому петля коэффициентов переставляет корни.

Простейший пример уже знаком. Для корни сливаются в единственной точке . Петля, обходящая её, меняет $+\sqrt{-c}$ и $-\sqrt{-c}$ , выходит, что $\mu_\gamma = (1 2)$ — транспозиция.

Как мять петли?

У перестановки $\mu_\gamma$ есть очень важное свойство: она зависит не от формы петли, а только от того, как петля огибает выколотые точки $\Sigma$ .

При малой деформации петли пути корней сдвигаются совсем немного. Но перестановка — это объект дискретный, а дискретная величина не может меняться понемногу. Скачок же возможен только если петля при деформации пересечёт $\Sigma$ , перескочив через выколотую точку, а это запрещено. Значит при любой деформации, не задевающей $\Sigma$ , перестановка остаётся прежней.

Две петли называются гомотопными, если одну можно непрерывно продеформировать в другую, не отрывая концов от и не задевая $\Sigma$ (слово гомотопия — от греч. «одинаковое место»: петли «одного расположения» относительно дырок). Класс взаимно гомотопных петель называется гомотопическим классом. Множество всех гомотопических классов петель в точке , с операцией прохождения одной петли, а затем другой, образует группу, которую называют фундаментальной группой пространства и обозначают $\pi_1(B, a_*)$ . Фундаментальной она называется, потому что она фиксирует фундаментальный топологический факт того, как в пространстве устроены дырки и обходы вокруг них.

Аксиоматику фундаментальной группы мы строить не будем, нам хватит следующего вывода:

Перестановка корней зависит только от гомотопического класса петли. Поэтому соответствие между классом петли и перестановкой корректно и согласовано с композицией. Пройти подряд две петли — значит применить подряд две перестановки. Множество всех перестановок, порождаемых петлями, образует подгруппу $G \subseteq S_n$ . Её называют группой монодромии многочлена.

Группа монодромии — геометрический аналог группы Галуа из первой части. Дальнейшая стратегия теперь формулируется следующим образом: нужно понять, какие перестановки лежат в .

Соберем доказательство по кусочкам

Факт I. Пусть $x_1, \dots, x_n$ — это различные комплексные числа, а отвечает многочлену $(x - x_1)\cdots(x - x_n)$ . Тогда для любой перестановки $\sigma \in S_n$ существует петля в , основанная в и порождающая ровно $\sigma$ . Иными словами, группа монодромии многочлена в общем виде — это вся .

Доказательство настолько же красивое, насколько оно простое. Вместо того чтобы двигать коэффициенты и смотреть на корни, поступим наоборот, будем двигать корни и смотреть, как движутся коэффициенты.

Корни $x_1, \dots, x_n$ — это точки на комплексной плоскости. Коэффициенты выражаются через них формулами Виета (как элементарные симметрические многочлены): $a_{n-1} = -\sum x_i$ , и так далее. Значит любое движение корней автоматически задаёт движение коэффициентов.

Возьмём нужную перестановку $\sigma$ и подвигаем корни по плоскости так, чтобы в конце каждый корень занял место корня $x_{\sigma(i)}$ , причём пусть корни движутся по непересекающимся траекториям и нигде не сталкиваются. Такие траектории всегда существуют, так как комплексная плоскость двумерна, а конечный набор движущихся точек в размерности не меньше двух всегда можно развести так, чтобы их пути не пересекались, в отличие от прямой, где точки неминуемо сталкивались бы. Тогда:

Корни всё время различны, а значит коэффициенты всё время остаются в , не попадая в $\Sigma$ .
В конце набор корней тот же ${x_1, \dots, x_n}$ , лишь переставленный. Коэффициенты — это симметрические функции корней, они не различают порядок, поэтому возвращаются к исходным значениям, значит движение коэффициентов оказалось петлей.
А перестановка, которую эта петля порождает — это $\sigma$ по построению.

Любая перестановка достижима. $\blacksquare$

Это рассуждение стоит прочувствовать, потому что оно объясняет, почему у многочлена в общем виде монодромия максимальна. Корни стали независимыми точками, которые можно тасовать как угодно, не сталкивая; коэффициенты же, будучи симметричными комбинациями, перестановки не замечают и возвращаются на место. Свобода тасовать корни и есть полная симметрия . (В первой части возникала оттого, что между корнями общего многочлена нет соотношений сверх симметрических; здесь то же отсутствие соотношений проявляется как свобода независимо двигать корни).

Немного истории

Идею следить за корнями уравнения при движении коэффициентов по комплексной плоскости ввёл Виктор Пюизё в 1850 году: он первым систематически связал обходы вокруг особых точек с перестановками значений алгебраической функции. Годом позже Бернхард Риман в диссертации 1851 года придумал римановы поверхности, как способ расклеить многозначную функцию в однозначную, заставив её жить на многолистной поверхности, склеенной так, что обход точки ветвления переводит с листа на лист. Для $\sqrt z$ это двулистная поверхность, на которой петля вокруг нуля перебрасывает между листами.

Понятие фундаментальной группы появилось у Анри Пуанкаре в 1895 году в работе Analysis Situs, которая положила начало топологии. Любопытно, что Пуанкаре пришёл к ней именно из задач о многозначных функциях и интегралах. Вышло так, что классы петель образовали группу, видящую дырки пространства. Аппарат, которым мы пользуемся, родился ровно для изучения явления монодромий.

Приём двигать корни и наблюдать за коэффициентами в элементарной форме принадлежит Владимиру Арнольду (лекции 1963–64 годов для школьников, записанные его учеником В. Б. Алексеевым). Арнольд намеренно обходился без тяжёлого аппарата, показывая, что неразрешимость пятой степени доступна без теории Галуа — на одной геометрии петель.

Глава 3. Дискриминант, и почему вокруг него все вращается

Что за множество мы выкалывали

В главе 2 мы выкалывали из пространства коэффициентов множество $\Sigma$ , наборы с кратным корнем, и водили петли по дополнению. Пора понять, что это за множество. Окажется, что $\Sigma$ — это наш старый школьный знакомый, повзрослевший до геометрического объекта.

Все знают дискриминант квадратного трёхчлена :

$\Delta = b^2 - 4ac$ ,

и правило: если $\Delta = 0$ , то корни сливаются, если $\Delta \ne 0$ , то у нас есть два различных корня. Пришло время обобщить это. Дискриминант обращается в ноль ровно тогда, когда корни сливаются. Само слово дискриминант происходит от латинского discriminare — «различать», «разделять»: он различает случаи, когда корни разные и когда корни слиплись.

Откуда берётся формула

Вспомним школьные годы. Выведем . Пусть — наши корни; они сливаются тогда и только тогда, когда , то есть когда . Выразим эту величину через коэффициенты по формулам Виета :

$(x_1 - x_2)^2 = (x_1 + x_2)^2 - 4x_1 x_2 = \frac{b^2}{a^2} - \frac{4c}{a} = \frac{b^2 - 4ac}{a^2}.$

Вот и $\Delta$ . С точностью до множителя дискриминант есть квадрат разности корней. Условие слияния превращается в $\Delta = 0$ .

Дискриминант любой степени

Снова обобщим. Для многочлена степени с корнями $x_1, \dots, x_n$ положим

$\Delta = \prod_{i < j} (x_i - x_j)^2$ .

Берём все пары корней, каждую разность возводим в квадрат. Нужное нам свойство видно по формуле

$\Delta = 0 \iff \text{хотя бы одна разность } x_i - x_j = 0 \iff \text{есть кратный корень.}$

Произведение зануляется ровно тогда, когда хотя бы один множитель ноль, то есть когда два корня совпали.

Заметим, что $\Delta$ — это симметрическая функция корней ( $\Delta$ не меняется при их перестановке), поэтому по основной теореме о симметрических многочленах она выражается как многочлен от коэффициентов:

$\Delta = \Delta(a_0, a_1, \dots, a_{n-1}).$

Меня этот факт будораждит. Хотя $\Delta$ определён через сами корни, которые мы и не умеем выразить формулой, но как функция коэффициентов он совершенно явный многочлен. Например, для прямое вычисление даёт $\Delta = -4p^3 - 27q^2$ — явный многочлен от .

Дискриминантная гиперповерхность

Займемся геометрией. Множество коэффициентов, при которых $\Delta$ обнуляется,

$\Sigma = \{a \in \mathbb{C}^n : \Delta(a) = 0\},$

и есть место, где корни сливаются. Её называют дискриминантной гиперповерхностью.

Слово гиперповерхность тут неслучайно. В комплексном пространстве коэффициентов одно уравнение задает объект комплексной коразмерности 1 (что соответствует вещественной коразмерности 2). Приведу аналогию: это не стена, разрезающая комнату напополам, а тонкая струна, натянутая посреди нее. Пространство не распадается на отдельные куски, но в нем появляется «ось», вокруг которой теперь можно бесконечно крутить замкнутые петли. Множество вне этой струны и есть наше пространство для петель.

Простейший случай можно нарисовать. Для дискриминант $\Delta = a_1^2 - 4a_0$ , и уравнение $\Sigma$ есть — парабола в плоскости коэффициентов . На ней корни сливаются, вне неё — два различных. Петля в плоскости, обходящая параболу, и порождает транспозицию двух корней.

Попытка визуализации дискриминантной гиперповерхности

Почему дискриминант вообще появляется

Мы выяснили, что корень — это многозначная функция коэффициентов. Многозначная функция переставляет свои значения при обходе точек ветвления, точек, где значения сливаются. Значения функции взятия корня сливаются там, где сливаются корни. Корни сливаются когда $\Delta = 0$ , то есть на $\Sigma$ . Иначе говоря:

Дискриминантная гиперповерхность $\Sigma$ — это множество точек ветвления функции взятия корня. Монодромия — это обход точек ветвления; точки ветвления — это $\Sigma$ ; значит петли обходят именно $\Sigma$ . Без дискриминанта обходить было бы нечего и никакой монодромии бы не возникло.

Обход дискриминанта

Множество $\Sigma$ неоднородно. В некоторой точке, назовем ее гладкой точкой дискриминанта, происходит вырождение: ровно два корня сливаются в один двойной, а остальные остаются различными. Почему именно два? Потому что условие двойного корня — это одно совпадение , дающее коразмерность 1, то есть саму гиперповерхность $\Sigma$ . А условие тройного корня , это уже два независимых совпадения, тут выходит коразмерность 2, то есть некоторое подмножество внутри $\Sigma$ . Гладких точек несравнимо больше, чем особых, и в каждой сливаются ровно два корня.

Вокруг такой точки поведение нам уже известно. Около двойного корня многочлен по двум опасным корням ведёт себя как квадратный трёхчлен с малым дискриминантом: если ввести локальный параметр , измеряющий отход от $\Sigma$ , то два сливающихся корня ведут себя как

$x_\pm(t) \approx x_* \pm \sqrt{t}.$

Это наш давний знакомый $\sqrt{\cdot}$ из главы 1, как бы вживлённый в одну координату. Обход вокруг нуля меняет знак $\sqrt t$ , переставляя $x_+ \leftrightarrow x_-$ , а остальные корня при малой петле почти не движутся и возвращаются на места.

Факт II. Малый обход гладкой точки дискриминанта , то есть точки, где сливаются ровно два корня, порождает транспозицию этих двух корней, оставляя остальные на месте.

Как дискриминант видит скрытую структуру

Наблюдение, которые свяжет нас с первой частью заключается в том, что форма дискриминанта кодирует симметрию корней.

Для корни $\pm\sqrt2, \pm\sqrt3$ организованы в пары, и дискриминант наследует от них эту структуру. Петли вокруг разных компонент $\Sigma$ дают перестановки, которые эти пары как бы уважают, так как обмен происходит внутри пары или пары обмениваются целиком. Итоговая группа монодромии оказывается меньше. Этот феномен можно сравнить с тем, что мы встречали в первой части, где у этого многочлена была группа Клейна .

У , напротив, дискриминант — это неприводимая гиперповерхность общего положения, без всякой структуры, где петли дают все транспозиции.

Если мы имеем дело с неприводимым дискриминантом общего положения, то нам доступны все транспозиции, то есть это группа . А если у нас разложимый, особо устроенный дискриминант, то перестановки ограничены и подгруппа меньше . Выходит, что дискриминант — это геометрический носитель скрытой симметрии корней, речь о которой шла всю первую часть.

Историческая справка

Термин «дискриминант» в современном смысле ввёл Джеймс Джозеф Сильвестр в 1851 году, также он подарил математике также слова «матрица» и «инвариант».

Теория дискриминантов расцвела в XIX веке внутри теории инвариантов — изучения выражений от коэффициентов, не меняющихся при заменах переменных. Геометрический взгляд на $\Sigma$ как на гиперповерхность с особенностями — это уже достижение теории особенностей XX века. Арнольд, в частности, обнаружил, что особенности дискриминанта кодируются теми же диаграммами, что и простые группы Ли. Современным продолжением являются дискриминанты систем уравнений и их связь с многогранниками Ньютона.

Глава 4. Безобидные петли

Что прощает радикал?

Сейчас у нас есть два факта: петлёй можно вызвать любую перестановку и обход дискриминанта даёт транспозицию. Было бы логично изобрести инструмент, который объединяет между собой перестановки корней и возможности радикалов. Таким инструментом будет особый вид петли, называемый коммутатором. Чтобы понять, зачем он, спросим: вдоль каких петель радикал возвращается к исходному значению?

Поясним вопрос. Представим, что корень удалось бы выразить формулой с радикалами, например, в некоторой формуле где-то стоит $\sqrt[m]{g(a)}$ , где — это какое-то выражение от коэффициентов. Когда коэффициенты идут по петле $\gamma$ , величина тоже описывает какой-то замкнутый путь. И тут возникает та же дихотомия, что в главе 1 для $\sqrt z$ :

если путь обходит ноль, то радикал $\sqrt[m]{g}$ не возвращается к исходному значению (вспомните: $\sqrt z$ менял знак при обходе нуля);
если путь не обходит ноль (его можно стянуть, как петлю, не зацепившую дырку), то радикал возвращается к исходному значению.

Иными словами, радикал возвращается к себе вдоль тех петель, вдоль которых его подкоренное выражение не накручивается вокруг нуля. Нам нужны петли, вдоль которых радикальная формула возвращается к себе, но корни всё же переставляются. Тогда возникнет зазор: формула вдоль петли вернётся к исходному значению, а корень — нет, значит, формула не может равняться корню. Осталось такие петли построить. В этом нам поможет коммутатор.

Определение коммутатора

Определение. Пусть $\gamma_1$ и $\gamma_2$ — две петли, основанные в одной точке. Их коммутатором называется петля $[\gamma_1, \gamma_2] = \gamma_1, \gamma_2, \gamma_1^{-1}, \gamma_2^{-1}$ , то есть путь такой: прошли $\gamma_1$ , затем $\gamma_2$ , затем $\gamma_1$ в обратную сторону, затем $\gamma_2$ в обратную сторону.

Две стороны коммутатора

Ценность коммутатора в том, что вдоль него радикальная формула возвращается к исходному значению, но перестановка корней получается нетривиальной. Разберём оба свойства.

Свойство первое: вдоль коммутатора радикал возвращается к исходному значению. Возьмём подкоренное выражение . Пока коэффициенты идут по коммутатору $[\gamma_1, \gamma_2],$ число оборотов вокруг нуля складывается из вкладов четырёх кусков: $\gamma_1, \gamma_2, \gamma_1^{-1}, \gamma_2^{-1}.$ Но $\gamma_1^{-1}$ — это $\gamma_1$ задом наперёд, она накручивает столько же оборотов, что и $\gamma_1$ , но с обратным знаком; то же у пары $\gamma_2, \gamma_2^{-1}$ . В сумме обороты сокращаются: вдоль коммутатора совершает ноль чистых оборотов вокруг нуля. Значит, радикал $\sqrt[m]{g}$ возвращается к исходному значению. (Если говорить более строго, то образ коммутаторной петли под любой комбинацией радикалов и непрерывных функций снова является замкнутой петлёй.)

Свойство второе: перестановка корней вдоль коммутатора нетривиальна. Перестановку корней коммутатор петель порождает по тому же закону, по которому устроен сам: если $\gamma_1$ порождает перестановку $\sigma_1$ , а $\gamma_2$ — перестановку $\sigma_2$ , то $[\gamma_1, \gamma_2]$ порождает коммутатор перестановок

$[\sigma_1, \sigma_2] = \sigma_1 \sigma_2 \sigma_1^{-1} \sigma_2^{-1}.$ А коммутатор двух перестановок вполне может быть нетривиальным. Далее возьмём , $\sigma_1 = (1\,2\,3)$ и $\sigma_2 = (1\,2)$ . По Факту I обе реализуются петлями. Прямое вычисление даёт

$[\sigma_1, \sigma_2] = (1\,2\,3)(1\,2)(1\,3\,2)(1\,2) = (1\,2\,3),$ нетривиальный 3-цикл, не оставляющий на месте ни один корень.

Одного слоя радикалов мало

Сформулируем то, что уже доказали, на примере кубического уравнения.

Следствие. Не существует формулы для корня кубического уравнения, составленной из коэффициентов, непрерывных функций и радикалов без вложенности (то есть таких, под которыми нет других радикалов).

Действительно, вдоль любого коммутатора петель такая формула возвращается к исходному значению. А корень, как мы видели, вдоль подходящего коммутатора переставляется. Формула возвращается, корень — нет, значит равенства быть не может.

Можно возразить. Но ведь кубическое уравнение разрешимо! Ведь формула Кардано существует! Тут противоречий не возникает: в формуле Кардано радикалы вложены (под кубическим корнем стоит квадратный). Одного уровня радикалов недостаточно, нужна вложенность. Это то, что в первой части соответствовало двухступенчатой цепочке группы $S_3 \supset A_3 \supset \{e\}$ : два этажа радикалов были двумя шагами цепочки.

Такое рассуждение добавляет конкретики расплывчатой нехватки радикалов. Теперь мы понимаем: нужна вложенность определённой глубины. Осталось понять, на какой глубине возникнут проблемы.

Глава 5. Почему пятой степени не хватает никакого числа радикалов

Вложенность радикалов и кратные коммутаторы

В главе 4 мы установили: вдоль одного коммутатора петель радикал глубины 1 возвращается к исходному значению. Разовьём это на вложенные радикалы.

Пусть формула имеет радикалы, вложенные на глубину k, то есть под радикалом стоит выражение, само содержащее радикал, и так k раз. Нетрудно заметить, что тогда рассуждение главы 4 итерируется:

радикалы глубины 1 возвращаются к себе вдоль коммутаторов петель;
радикалы глубины 2 возвращаются к себе вдоль коммутаторов коммутаторов (внутренний радикал замыкается вдоль внутреннего коммутатора, внешний — вдоль внешнего);
радикалы глубины k возвращаются к себе вдоль k-кратных коммутаторов, то есть выражений вида $[\dots[[\gamma_1, \gamma_2], [\gamma_3, \gamma_4]]\dots]$ с k уровнями вложенных скобок.

Формула с радикалами глубины k возвращается к исходному значению вдоль любого k-кратного коммутатора петель. Если при этом найдётся k-кратный коммутатор, переставляющий корни, то формула глубины k не может равняться корню. Вопрос неразрешимости свёлся к своеобразной комбинаторике, а точнее к вопросу: схлопываются ли кратные коммутаторы перестановок до тождественной, или нет?

Степень 4

Посмотрим на разрешимый случай четвёртой степени. Здесь группа всех перестановок — . Будем брать коммутаторы и смотреть, что остаётся.

Коммутаторы пар перестановок из дают не все перестановки, а только чётные, то есть знакопеременную группу
Коммутаторы перестановок из дают группу Клейна .
Коммутаторы перестановок из дают только тождественную перестановку: коммутативна, и все её коммутаторы тривиальны.

Цепочка обрывается на тождественной перестановке за три шага:

$S_4 \to A_4 \to V_4 \to \{e\}.$

Значит, трёхкратные коммутаторы перестановок все тривиальны. По нашему соответствию формула с радикалами глубины 3 способна угнаться за корнями, и действительно, общее уравнение четвёртой степени решается формулой с радикалами, вложенными на три уровня.

Степень 5. Наконец-то

Апофеоз. Возьмём и проделаем то же.

Коммутаторы пар перестановок из дают ровно 60 перестановок — знакопеременную группу .
Берём коммутаторы этих 60 перестановок и получаем те же самые 60. Группа не уменьшается.
Берём коммутаторы снова и снова получаем те же 60. И так сколько угодно раз.

Цепочка застревает:

$S_5 \to A_5 \to A_5 \to A_5 \to \cdots$

Тут имеет смысл привести конкретный пример.

Возьмем две простые четные перестановки из $A_{5}$ (каждая двигает всего 3 элемента из 5):

, она сдвигает по кругу первый, второй и третий элементы.
, она сдвигает по кругу первый, четвертый и пятый элементы.

Если мы посчитаем их коммутатор $[g, h] = g \cdot h \cdot g^{-1} \cdot h^{-1}$ , то произойдет вот что: взаимное переплетение этих двух локальных движений породит длинный цикл $(1\,4\,2\,3\,5)$ , который перемешивает вообще все 5 элементов.

Пятёрные циклы лежат в , а совпадает со своим коммутантом, поэтому пятёрный цикл, например $(1\,4\,2\,3\,5)$ , достижим как коммутатор любой кратности. По Факту I он реализуется петлёй, а по построению — кратным коммутатором петель сколь угодно большой глубины. А значит:

Какой бы конечной глубины k ни была радикальная формула, существует k-кратный коммутатор петель, переставляющий корни (например, дающий цикл $(1\,4\,2\,3\,5)$ , как в данном случае). Вдоль этой петли формула возвращается к исходному значению, а корни — нет. Из этого мы можем сделать вывод, что никакая конечная формула из радикалов не может выражать корень общего уравнения пятой степени.

Поздравляю, мы снова доказали теорему Абеля-Руффини, но другим способом.

То, что коммутаторы дают снова , на алгебраическом языке записывается как . Это то самое равенство, которое мы доказывали в первой части, опираясь на простоту . Правда тогда оно было следствием того, что не имеет нормальных подгрупп.

Доказательство сильнее, чем у Галуа

Стоит отметить, в чём геометрическое доказательство превосходит алгебраическое. В рассуждении мы нигде не использовали, что разрешёнными операциями являются именно радикалы. Мы пользовались лишь тем, что вдоль коммутаторной петли операция возвращается к исходному значению. Но тем же свойством обладает любая непрерывная однозначная функция: вдоль стянутой петли она возвращается к себе. Поэтому доказательство запрещает не только радикалы, но и любые непрерывные функции — синус, экспоненту, что угодно.

Корень общего уравнения пятой степени нельзя выразить никакой конечной формулой, составленной из коэффициентов, арифметических операций, радикалов и любых непрерывных функций.

К сожалению, Теория Галуа этого не даёт: она работает именно с радикалами и алгебраическими операциями. Используя геометрический подход мы получаем факт глубже, потому что опираемся не на алгебраическую природу операций, а на их топологическое поведение вдоль петель.

Историческая справка

Это доказательство Владимир Игоревич Арнольд изложил в 1963–64 годах в цикле лекций для победителей московских математических олимпиад, для старшеклассников, без всякой теории Галуа. Запись лекций сделал его ученик В. Б. Алексеев; она вышла книгой «Теорема Абеля в задачах и решениях», которую Арнольд снабдил предисловием, заметив, что Алексеев кое-где алгебраизировал исходный, чисто геометрический курс. Арнольд любил повторять, что доказательство неразрешимости должно быть наглядным, а не формальным, и эта работа является образцом такого подхода. Благодаря этому, мы получили результат, доступный школьнику, по крайней мере по мнению Арнольда, при условии что школьник готов немного потанцевать вокруг петель.

Строгую версию для математиков позже дал Хенрик Жолондек (2000), связав фундаментальную группу пространства многочленов без кратных корней с группой кос и её отображением в . А идейным наследником геометрического подхода стала топологическая теория Галуа Аскольда Хованского, в рамках которой ведутся работы и сегодня. О них я хочу рассказать в следующей части.

Список источников

[1] V. I. Arnold, V. B. Alekseev. Abel’s Theorem in Problems and Solutions. Kluwer Academic Publishers, 2004.

[2] L. Goldmakher. Arnold’s Elementary Proof of the Insolvability of the Quintic. URL: https://web.williams.edu/Mathematics/lg5/394/ArnoldQuintic.pdf

[3] H. Żołądek. The Topological Proof of Abel–Ruffini Theorem. Topological Methods in Nonlinear Analysis, 16 (2000), 253–265.

[4] P. Ramond. The Abel–Ruffini Theorem: Complex but Not Complicated. arXiv:2011.05162.

[5] V. Puiseux. Recherches sur les fonctions algébriques. J. Math. Pures Appl., 15 (1850).

[6] B. Riemann. Grundlagen für eine allgemeine Theorie der Functionen einer veränderlichen complexen Grösse. Inauguraldissertation, Göttingen, 1851.

[7] H. Poincaré. Analysis Situs. Journal de l’École Polytechnique, 1895.

[8] J. J. Sylvester. Работы по теории инвариантов и термин «дискриминант», 1851.

[9] I. M. Gelfand, M. M. Kapranov, A. V. Zelevinsky. Discriminants, Resultants and Multidimensional Determinants. Birkhäuser, 1994.

[10] A. Khovanskii. Topological Galois Theory. Springer Monographs in Mathematics, 2014.

ссылка на оригинал статьи https://habr.com/ru/articles/1055326/