Коды Грея и задачи перебора

от автора

В данной статье будут рассмотрены следующие вопросы:

  • Двоичные коды Грея. Их существование. Перебор подмножеств данного множества в порядке минимального изменения.
  • Существование и реализация перебора подмножеств из k элементов в порядке минимального изменения.

Итак, приступим.

Двоичный код Грея

Двоичным кодом Грея порядка n называется последовательность n-битных кодов, в которой любые два соседних кода различаются ровно в одном разряде.

Пример кодов Грея порядка 2:

  • 00
  • 01
  • 11
  • 10

Нетрудно заметить, что такая последовательность не единственная(её как минимум можно обратить). Поэтому давайте разберемся в существовании двоичных кодов Грея других порядков и заодно выделим какой-то один вид таких последовательностей для дальнейшей работы.

Существование

Существование кодов Грея легко доказывается по индукции.
База — image — пустая последовательность.
Переход. Пусть image — последовательность кодов Грея порядка image. image — последовательность image записанная в обратном порядке. Тогда последовательность image получается приписыванием нуля слева к каждому коду в последовательности image и единицы слева к каждому коду image и последующим их объединением, т.е. image. Нетрудно проверить, что свойство кодов Грея в последовательности image, построенную таким образом, не нарушается. image

Коды Грея, полученные таким способом, называются рефлексивными или симметрично отраженными. В дальнейшем мы будем рассматривать именно такие рефлексивные двоичные коды Грея.

Перебор подмножеств данного множества в порядке минимального изменения

Рассмотрим следующую задачу: «Дано множество из n элементов. Требуется вывести все его подмножества в таком порядке, что каждое следующее подмножество получается из предыдущего удалением или добавлением ровно одного элемента(т.е. в порядке минимального изменения).»

Будем считать, что элементы нашего множества пронумерованы от 1 до n. Тогда любому набору элементов множества можно поставить в соответствие n-битный двоичный код: если i-ый элемент множества входит в набор, то i-ый бит кода равен единице, иначе нулю. Таким образом, перебор всех подмножеств сводится к перебору двоичных кодов, а перебор подмножеств в порядке минимального изменения — к перебору двоичных кодов Грея.

Идея алгоритма рекурсивного перебора кодов Грея непременно следует из доказательства их существования.

image Собственно, как и говорилось в доказательстве, код Грея порядка n получается из кода Грея порядка n-1 приписыванием нуля слева(этому соответствует вызов функции и присвоение перед ним) и обратного кода Грея порядка n-1 приписыванием единицы слева(этому соответствует вызов функции и присвоение перед ним).

Перейдем к оценке сложности данного алгоритма. Очевидно, что дерево вызовов функции image является полным двоичным деревом высоты n. Следовательно, общее число вызовов функции при генерации кодов Грея порядка n есть ни что иное, как image, что равно количеству всевозможных n-битных кодов. Следовательно, алгоритм оптимален.

В качестве упражнения читателю предлагается проанализировать следующий, более короткий, алгоритм рекурсивного перебора.

Пример

Также хотелось бы сказать о существовании итеративного алгоритма перебора и других полезных свойствах кодов Грея, которые не рассматриваются в данной статье, и о которых можно узнать из других источников, например Википедии.

А теперь давайте перейдем к последней и самой интересной задаче.

Перебор подмножеств из k элементов в порядке минимального изменения.

Начнем с постановки задачи: «Дано множество из n элементов. Требуется вывести все его подмножества, состоящие ровно из k элементов, в таком порядке, что каждое следующее подмножество получается из предыдущего заменой ровно одного элемента(т.е. в порядке минимального изменения).»

Здесь сразу приходит в голову идея алгоритма из предыдущей задачи с дополнительной проверкой числа единиц при выводе. Но при этом возникает вопрос о корректности этого алгоритма(нам никто не гарантирует расположение кодов с k единицами в последовательности image в порядке минимального изменения — с разницей в двух разрядах). Поэтому мы не станем останавливаться на этом и проведем поиски алгоритма с асимптотикой, лучшей, чем image и попытаемся доказать его корректность.

Введем некоторые обозначения:

  • image — строка, получаемая конкатенацией символа x (m раз) и конкатенацией символа y (k раз). Пример: image.
  • image — последовательность всех n-битных кодов с k единицами, в которой коды идут в том порядке, в котором они расположены в последовательности image.
  • image — последовательность всех n-битных кодов с k единицами, в которой коды идут в том порядке, в котором они расположены в последовательности image.

Лемма

Первый двоичный код с image единицами в последовательности image имеет вид image, а последний — image или image, если image.

Доказательство

Доказывать будем индукцией по image и image.
База — image — верно(нетрудно проверить приведенные формулы для двух кодов 0 и 1).
Переход. Пусть формулы верны для image и любого image. Вспомним формулу из доказательства существования кодов Грея: image. Отсюда получим, что первый код с image единицами в последовательности image с приписанным слева нулем является первым кодом с image единицами в последовательности image. При image получим единственный код с image единицей, для которого формула также верна. При image последний код с image единицами в последовательности image есть первый код с image единицей и приписанной слева единицей в последовательности image. При image формула также верна. image

Теорема

Соседние двоичные коды в последовательности image различаются ровно в двух разрядах.

Доказательство

Доказывать будем также индукцией по image и image.
База — image — очевидно(всего один возможный код в последовательности).
Переход. Пусть теорема верна для image и image. При image или image имеем всего один код в последовательности image. При image соседние слова находящиеся полностью в image или в image по индукционному предположению различаются ровно в двух разрядах. Остается проверить одну пару соседних кодов в image последний код с image единицами в image и первый код с image единицами в image (последний с image единицей в image с приписанной слева единицей). По лемме, при image, они имеют вид image и image соответственно, а при imageimage и image. Нетрудно видеть, что они различаются ровно в двух разрядах. image

Теперь мы можем сформулировать замечательные следствия из теоремы.

  • Наивный алгоритм, предложенный ранее, корректен.
  • Последовательность image задается следующим рекуррентным соотношением: image.
  • Последовательность image задается следующим рекуррентным соотношением: image.

Эти следствия можно и нужно использовать для написания программы рекурсивного перебора подмножеств из k элементов в порядке минимального изменения.
Хотелось бы обратить внимание на то, что вывод двоичного кода подразумевает еще и заполнение оставшихся разрядов единицами или нулями, в зависимости от значения u и v.

Перейдем к оценке сложности приведенного алгоритма. Заметим, что при углублении в рекурсию значение u всегда уменьшается. То есть мы сделаем не больше n углублений для достижения какого-то двоичного кода. Всего таких кодов — . Получаем итоговую асимптотику . Это довольно грубая оценка, но она всяко лучше image, особенно при величине k стремящейся к n: алгоритм практически линеен.

Легко заметить, что дерево вызовов будет двоичным, но не будет полным. Проведем параллель оценки сложности в терминах деревьев: каждый лист соответствует получению какого-то двоичного кода, а расстояние до листа в дереве не превышает n. Оценка говорит нам о том, что мы просто просуммировали верхнюю оценку длин — n — всех путей до листов. Но ведь многие из этих путей имеют длину меньше n, а еще больше путей пересекаются друг с другом. Это должно наталкивать нас на мысль, что асимптотика приведенного алгоритма на самом деле намного лучше.

Точная оценка асимптотики — далеко не тривиальный факт, который можно найти в книге Э.Рейнгольда, Ю.Нивергельта и Н.Део «Комбинаторные алгоритмы. Теория и практика», либо попытаться доказать самому.

На этом хотелось бы закончить статью. Спасибо за внимание и до скорых встреч.

ссылка на оригинал статьи http://habrahabr.ru/post/200806/


Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *