Численная проверка abc-гипотезы (да, той самой)

Привет habr.

На ~~geektimes~~ habr было уже несколько статей про abc-гипотезу (например в 2013 и в 2018 годах). Сама история про теорему, которую сначала много лет не могут доказать, а потом столько же лет не могут проверить, безусловно заслуживает как минимум, художественного фильма. Но в тени этой чудесной истории, сама теорема рассматривается черезчур поверхностно, хотя она не менее интересна. Уже хотя бы тем, что abc-гипотеза — одна из немногих нерешенных проблем современной науки, постановку задачи которой сможет понять даже пятиклассник. Если же эта гипотеза действительно верна, то из нее легко следует доказательство других важных теорем, например доказательство теоремы Ферма.

Не претендуя на лавры Мотидзуки, я ~~тоже решил попробовать~~ решил проверить с помощью компьютера, насколько выполняются обещанные в гипотезе равенства. Собственно, почему бы нет — современные процессоры ведь не только для того чтобы в игры играть — почему бы не использовать компьютер по своему основному (compute — вычислять) предназначению…

Кому интересно что получилось, прошу под кат.

Постановка задачи

Начнем с начала. О чем собственно, теорема? Как гласит Википедия (формулировка в английской версии немного более понятна), для взаимно-простых (не имеющих общих делителей) чисел a, b и с, таких что a+b=c, для любого ε>0 существует ограниченное число троек a+b=c, таких что:

Функция rad называется радикалом, и обозначает произведение простых множителей числа. Например, rad(16) = rad(2*2*2*2) = 2, rad(17) = 17 (17 простое число), rad(18) = rad(2*3*3) = 2*3 = 6, rad(1000000) = rad(2^6 ⋅ 5^6) = 2*5 = 10.

Собственно, суть теоремы в том, что количество таких троек довольно мало. Например, если взять наугад ε=0.2 и равенство 100+27=127: rad(100) = rad(2*2*5*5) = 10, rad(27)=rad(3*3*3)=3, rad(127) = 127, rad(a*b*c) = rad(a)*rad(b)*rad© = 3810, 3810^1.2 явно больше 127, равенство не выполняется. Но бывают и исключения, например для равенства 49 + 576 = 625 условие теоремы выполняется (желающие могут проверить самостоятельно).

Следующий ключевой для нас момент — этих равенств, согласно теореме, ограниченное число. Т.е. это значит, что их все можно просто попытаться перебрать на компьютере. В итоге, это дает нам ~~Нобелевскую премию~~ вполне интересную задачу по программированию.

Итак, приступим.

Исходный код

Первая версия была написана на Python, и хотя этот язык слишком медленный для подобных расчетов, писать код на нем легко и просто, что удобно для прототипирования.

Получение радикала: раскладываем число на простые множители, затем убираем повторы, преобразуя массив в множество. Затем просто получаем произведение всех элементов.

def prime_factors(n):     factors = []     # Print the number of two's that divide n     while n % 2 == 0:         factors.append(int(2))         n = n / 2      # n must be odd at this point so a skip of 2 ( i = i + 2) can be used     for i in range(3, int(math.sqrt(n)) + 1, 2):         # while i divides n , print i ad divide n         while n % i == 0:             factors.append(int(i))             n = n / i      # Condition if n is a prime number greater than 2     if n > 2:         factors.append(int(n))     return set(factors)  def rad(n):     result = 1     for num in prime_factors(n):          result *= num     return result

Взаимно-простые числа: раскладываем числа на множители, и просто проверяем пересечение множеств.

def not_mutual_primes(a,b,c):     fa, fb, fc = prime_factors(a), prime_factors(b), prime_factors(c)     return len(fa.intersection(fb)) == 0 and len(fa.intersection(fc)) == 0 and len(fb.intersection(fc)) == 0

Проверка: используем уже созданные функции, тут все просто.

def check(a,b,c):     S = 1.2  # Eps=0.2     if c > (rad(a)*rad(b)*rad(c))**S and not_mutual_primes(a, b, c):         print("{} + {} = {} - PASSED".format(a, b, c))     else:         print("{} + {} = {} - FAILED".format(a, b, c))  check(10, 17, 27) check(49, 576, 625)

Желающие могут поэкспериментировать самостоятельно, скопировав вышеприведенный код в любой онлайн-редактор языка Python. Разумеется, код работает ожидаемо медленно, и перебор всех троек хотя бы до миллиона был бы слишком долгим. Ниже под спойлером есть оптимизированная версия, рекомендуется использовать ее.

Окончательная версия была переписана на С++ с использованием многопоточности и некоторой оптимизации (работать на Си с пересечением множеств было бы слишком хардкорно, хотя вероятно и быстрее). Исходный код под спойлером, его можно скомпилировать в бесплатном компиляторе g++, код работает под Windows, OSX и даже на Raspberry Pi.

Код на С++

// To compile: g++ abc.cpp -O3 -fopenmp -oabc  #include <string.h> #include <math.h> #include <stdbool.h> #include <stdint.h> #include <stdio.h> #include <vector> #include <set> #include <map> #include <algorithm> #include <time.h>  typedef unsigned long int valType; typedef std::vector<valType> valList; typedef std::set<valType> valSet; typedef valList::iterator valListIterator;  std::vector<valList> valFactors; std::vector<double> valRads;  valList factors(valType n) {   valList results;   valType z = 2;   while (z * z <= n) {     if (n % z == 0) {       results.push_back(z);       n /= z;     } else {       z++;     }   }   if (n > 1) {     results.push_back(n);   }   return results; }  valList unique_factors(valType n) {   valList results = factors(n);   valSet vs(results.begin(), results.end());   valList unique(vs.begin(), vs.end());   std::sort(unique.begin(), unique.end());   return unique; }  double rad(valType n) {   valList f = valFactors[n];   double result = 1;   for (valListIterator it=f.begin(); it<f.end(); it++) {       result *= *it;   }   return result; }  bool not_mutual_primes(valType a, valType b, valType c) {   valList res1 = valFactors[a], res2 = valFactors[b], res3; // = valFactors[c];   valList c12, c13, c23;   set_intersection(res1.begin(),res1.end(), res2.begin(),res2.end(), back_inserter(c12));   if (c12.size() != 0) return false;   res3 = valFactors[c];   set_intersection(res1.begin(),res1.end(), res3.begin(),res3.end(), back_inserter(c13));   if (c13.size() != 0) return false;   set_intersection(res2.begin(),res2.end(), res3.begin(),res3.end(), back_inserter(c23));   return c23.size() == 0; }  int main() {   time_t start_t, end_t;   time(&start_t);      int cnt=0;   double S = 1.2;   valType N_MAX = 10000000;      printf("Getting prime factors...\n");      valFactors.resize(2*N_MAX+2);   valRads.resize(2*N_MAX+2);   for(valType val=1; val<=2*N_MAX+1; val++) {       valFactors[val] = unique_factors(val);       valRads[val] = rad(val);   }      time(&end_t);   printf("Done, T = %.2fs\n", difftime(end_t, start_t));      printf("Calculating...\n");   #pragma omp parallel for reduction(+:cnt)   for(int a=1; a<=N_MAX; a++) {     for(int b=a; b<=N_MAX; b++) {       int c = a+b;       if (c > pow(valRads[a]*valRads[b]*valRads[c], S) && not_mutual_primes(a,b,c)) {         printf("%d + %d = %d\n", a,b,c);         cnt += 1;       }     }   }   printf("Done, cnt=%d\n", cnt);      time(&end_t);   float diff_t = difftime(end_t, start_t);   printf("N=%lld, T = %.2fs\n", N_MAX, diff_t); }

Для тех кому лень устанавливать компилятор С++, приведена слегка оптимизированная Python-версия, запустить которую можно в любом онлайн редакторе (я использовал https://repl.it/languages/python).

Python-версия

from __future__ import print_function import math import time import multiprocessing  prime_factors_list = [] rad_list = []  def prime_factors(n):     factors = []     # Print the number of two's that divide n     while n % 2 == 0:         factors.append(int(2))         n = n / 2      # n must be odd at this point so a skip of 2 ( i = i + 2) can be used     for i in range(3, int(math.sqrt(n)) + 1, 2):         # while i divides n , print i ad divide n         while n % i == 0:             factors.append(int(i))             n = n / i      # Condition if n is a prime number greater than 2     if n > 2:         factors.append(int(n))     return factors  def rad(n):     result = 1     for num in prime_factors_list[n]:          result *= num     return result  def not_mutual_primes(a,b,c):     fa, fb, fc = prime_factors_list[a], prime_factors_list[b], prime_factors_list[c]     return len(fa.intersection(fb)) == 0 and len(fa.intersection(fc)) == 0 and len(fb.intersection(fc)) == 0  def calculate(N):     S = 1.2     cnt = 0     for a in range(1, N):         for b in range(a, N):             c = a+b             if c > (rad_list[a]*rad_list[b]*rad_list[c])**S and not_mutual_primes(a, b, c):                 print("{} + {} = {}".format(a, b, c))                 cnt += 1      print("N: {}, CNT: {}".format(N, cnt))     return cnt  if __name__ == '__main__':      t1 = time.time()      NMAX = 100000     prime_factors_list = [0]*(2*NMAX+2)     rad_list = [0]*(2*NMAX+2)     for p in range(1, 2*NMAX+2):         prime_factors_list[p] = set(prime_factors(p))         rad_list[p] = rad(p)          calculate(NMAX)      print("Done", time.time() - t1)

Результаты

Троек a,b,c действительно очень мало.

Некоторые результаты приведены ниже:
N=10: 1 «тройка», время выполнения <0.001c
1 + 8 = 9

N=100: 2 «тройки», время выполнения <0.001c
1 + 8 = 9
1 + 80 = 81

N=1000: 8 «троек», время выполнения <0.01c
1 + 8 = 9
1 + 80 = 81
1 + 242 = 243
1 + 288 = 289
1 + 512 = 513
3 + 125 = 128
13 + 243 = 256
49 + 576 = 625

N=10000: 23 «тройки», время выполнения 2с

Тройки A,B,C до 10000

1 + 8 = 9
  1 + 80 = 81
  1 + 242 = 243
  1 + 288 = 289
  1 + 512 = 513
  1 + 2400 = 2401
  1 + 4374 = 4375
  1 + 5831 = 5832
  1 + 6560 = 6561
  1 + 6655 = 6656
  1 + 6859 = 6860
  3 + 125 = 128
  5 + 1024 = 1029
  10 + 2187 = 2197
  11 + 3125 = 3136
  13 + 243 = 256
  49 + 576 = 625
  1331 + 9604 = 10935
  81 + 1250 = 1331
  125 + 2187 = 2312
  243 + 1805 = 2048
  289 + 6272 = 6561
  625 + 2048 = 2673

N=100000: 53 «тройки», время выполнения 50c

Тройки A,B,C до 100000

1 + 8 = 9
  1 + 80 = 81
  1 + 242 = 243
  1 + 288 = 289
  1 + 512 = 513
  1 + 2400 = 2401
  1 + 4374 = 4375
  1 + 5831 = 5832
  1 + 6560 = 6561
  1 + 6655 = 6656
  1 + 6859 = 6860
  1 + 12167 = 12168
  1 + 14336 = 14337
  1 + 57121 = 57122
  1 + 59048 = 59049
  1 + 71874 = 71875
  3 + 125 = 128
  3 + 65533 = 65536
  5 + 1024 = 1029
  7 + 32761 = 32768
  9 + 15616 = 15625
  9 + 64000 = 64009
  10 + 2187 = 2197
  11 + 3125 = 3136
  13 + 243 = 256
  28 + 50625 = 50653
  31 + 19652 = 19683
  37 + 32768 = 32805
  49 + 576 = 625
  49 + 16335 = 16384
  73 + 15552 = 15625
  81 + 1250 = 1331
  121 + 12167 = 12288
  125 + 2187 = 2312
  125 + 50176 = 50301
  128 + 59049 = 59177
  169 + 58880 = 59049
  243 + 1805 = 2048
  243 + 21632 = 21875
  289 + 6272 = 6561
  343 + 59049 = 59392
  423 + 16384 = 16807
  507 + 32768 = 33275
  625 + 2048 = 2673
  1331 + 9604 = 10935
  1625 + 16807 = 18432
  28561 + 89088 = 117649
  28561 + 98415 = 126976
  3584 + 14641 = 18225
  6561 + 22000 = 28561
  7168 + 78125 = 85293
  8192 + 75843 = 84035
  36864 + 41261 = 78125

При N=1000000 имеем всего лишь 102 «тройки», полный список приведен под спойлером.

Тройки A,B,C до 1000000

1 + 8 = 9
  1 + 80 = 81
  1 + 242 = 243
  1 + 288 = 289
  1 + 512 = 513
  1 + 2400 = 2401
  1 + 4374 = 4375
  1 + 5831 = 5832
  1 + 6560 = 6561
  1 + 6655 = 6656
  1 + 6859 = 6860
  1 + 12167 = 12168
  1 + 14336 = 14337
  1 + 57121 = 57122
  1 + 59048 = 59049
  1 + 71874 = 71875
  1 + 137780 = 137781
  1 + 156249 = 156250
  1 + 229375 = 229376
  1 + 263168 = 263169
  1 + 499999 = 500000
  1 + 512000 = 512001
  1 + 688127 = 688128
  3 + 125 = 128
  3 + 65533 = 65536
  5 + 1024 = 1029
  5 + 177147 = 177152
  7 + 32761 = 32768
  9 + 15616 = 15625
  9 + 64000 = 64009
  10 + 2187 = 2197
  11 + 3125 = 3136
  13 + 243 = 256
  13 + 421875 = 421888
  17 + 140608 = 140625
  25 + 294912 = 294937
  28 + 50625 = 50653
  31 + 19652 = 19683
  37 + 32768 = 32805
  43 + 492032 = 492075
  47 + 250000 = 250047
  49 + 576 = 625
  49 + 16335 = 16384
  49 + 531392 = 531441
  64 + 190269 = 190333
  73 + 15552 = 15625
  81 + 1250 = 1331
  81 + 123823 = 123904
  81 + 134375 = 134456
  95 + 279841 = 279936
  121 + 12167 = 12288
  121 + 255879 = 256000
  125 + 2187 = 2312
  125 + 50176 = 50301
  128 + 59049 = 59177
  128 + 109375 = 109503
  128 + 483025 = 483153
  169 + 58880 = 59049
  243 + 1805 = 2048
  243 + 21632 = 21875
  289 + 6272 = 6561
  338 + 390625 = 390963
  343 + 59049 = 59392
  423 + 16384 = 16807
  507 + 32768 = 33275
  625 + 2048 = 2673
  864 + 923521 = 924385
  1025 + 262144 = 263169
  1331 + 9604 = 10935
  1375 + 279841 = 281216
  1625 + 16807 = 18432
  2197 + 583443 = 585640
  2197 + 700928 = 703125
  3481 + 262144 = 265625
  3584 + 14641 = 18225
  5103 + 130321 = 135424
  6125 + 334611 = 340736
  6561 + 22000 = 28561
  7153 + 524288 = 531441
  7168 + 78125 = 85293
  8192 + 75843 = 84035
  8192 + 634933 = 643125
  9583 + 524288 = 533871
  10816 + 520625 = 531441
  12005 + 161051 = 173056
  12672 + 117649 = 130321
  15625 + 701784 = 717409
  18225 + 112847 = 131072
  19683 + 228125 = 247808
  24389 + 393216 = 417605
  28561 + 89088 = 117649
  28561 + 98415 = 126976
  28561 + 702464 = 731025
  32768 + 859375 = 892143
  296875 + 371293 = 668168
  36864 + 41261 = 78125
  38307 + 371293 = 409600
  303264 + 390625 = 693889
  62192 + 823543 = 885735
  71875 + 190269 = 262144
  131072 + 221875 = 352947
  132651 + 588245 = 720896

Увы, программа работает все равно медленно, результатов для N=10000000 я так и не дождался, время вычисления составляет больше часа (возможно я где-то ошибся с оптимизацией алгоритма, и можно сделать лучше).

Еще интереснее посмотреть результаты графически:

В принципе, вполне очевидно, что зависимость количества возможных троек от N растет заметно медленнее самого N, и вполне вероятно, что результат будет сходиться к какому-то конкретному числу для каждого ε (рискну высказать гипотезу что в данном случае оно не превысит 256:). Кстати, при увеличении ε число «троек» заметно сокращается, например при ε=0.4 имеем всего 2 равенства при N<100000 (1 + 4374 = 4375 и 343 + 59049 = 59392). Так что в целом, похоже что теорема действительно выполняется (ну и наверное ее уже проверяли на компьютерах помощнее, и возможно, все это уже давно посчитано).

Желающие могут поэкспериментировать самостоятельно, если у кого будут результаты для чисел 10000000 и выше, я с удовольствием добавлю их к статье.

ссылка на оригинал статьи https://habr.com/post/427091/

Численная проверка abc-гипотезы (да, той самой)

Постановка задачи

Исходный код

Результаты

Комментарии

Добавить комментарий Отменить ответ