При попытке найти оптимальную стратегию для игры за компьютер довольно быстро приходим к такому приближению:
Допустим, что состояние некоторых клеток нам уже известно, и мы хотим сделать ход, максимально приближающий нас к победе. В таком случае имеет смысл выбирать клетку, которая занята кораблём противника в наибольшем числе возможных размещений кораблей, не противоречащих имеющейся информации
В самом деле. Если возможная конфигурация только одна, то мы заканчиваем игру за один ход, расстреливая его корабли по очереди (ведь конфигурация нам известна!) Если же конфигураций больше, то нам нужно уменьшить их число как можно сильнее, тем самым увеличив имеющееся у нас количество информации. Если мы попадём в корабль, то ничего не потеряем (ведь ход остаётся у нас!), а если промахнёмся — то число оставшихся комбинаций будет минимальным из возможных после этого хода.
Понятно, что это только приближение к отпимальной стратегии. Если противник будет знать о нашем плане, он постарается разместить корабли так, чтобы они не попадали в те клетки, куда мы будем стрелять в начале игры. Правда, ему это поможет мало — мы всё равно в конце концом зажмём его в угол — но возможно, что определённая гибкость нам не помешала бы. Кроме того, не исключено, что продуманная серия ходов, первый из которых не является оптимальным, привела бы к лучшему результату. Но не будем пока усложнять и без того сложную задачу, а попытаемся просчитать все конфигурации и построить карту вероятности заполнения поля.
На первый взгляд, задача кажется неподъёмной. Число конфигураций представляется порядка 1020 (на самом деле их несколько меньше — ближе к 1015), так что на полный перебор времени уйдёт слишком много. Перебирать раскраски поля и оставлять только допустимые — не лучше: всё равно нам каждую комбинацию придётся просмотреть.
Что же ещё попробовать? Любой олимпиадник тут же ответит — динамическое программирование. Но как его организовать?
Идём сверху вниз. Какая информация нам нужна?
Итак, будем идти сверху вниз. Предположим, что поле у нас разделено на две части — часть A состоит из первых k строк, а часть B — из всех остальных. Заполнением части поля назовём любую раскраску его клеток в два цвета. Заполнение всего поля называется корректным, если чёрные клетки образуют набор кораблей, удовлетворяющий правилам (корабли прямые, не соприкасаются, их длины образуют нужный набор). Два заполнения S1 и S2 части A мы будем называть эквивалентными, если для любого заполнения T части B объединенные заполнения всего поля S1|T и S2|T будут корректными или некорректными одновременно.
Для решения задачи нам достаточно:
- Описать все классы эквивалентности заполнений для части A
- Для каждого класса вычислить число различных заполнений, и для каждой клетки области A указать, в каком числе заполнений она была чёрной (назовём эту информацию картой данного класса)
- Описать пересчёт классов и их карт при добавлении к области A новой строки.
Пусть у нас есть неизвестное заполнение S области A и известное заполнение T области B. Что нам достаточно знать про S?
Во-первых, неплохо иметь полное состояние последней строки. Только в этом случае мы сможем определить, какие клетки первой строки области B мы ещё можем занимать, а какие — нет.
Во-вторых, надо знать, сколько и каких законченных кораблей в области A уже есть. Законченным мы называем корабль, который уже нельзя продлить в область B. В нашем случае это либо корабли, не имеющие клеток в последней строчке, либо корабли, целиком лежащие в ней (и занимающие две или более клетки).
В-третьих, про каждый корабль, который ещё можно продлить в область B, нам нужно знать его текущую длину. Сами эти корабли легко узнать по последней строчке: они занимают в ней одну чёрную клетку, окруженную белыми полями.
И всё. Класс эквивалентности целиком определяется этими данными, причём даже не все их комбинации являются допустимыми. Посчитаем, сколько получилось:
- Последняя строчка: 10 бит, причём не все варианты возможны: не может идти более 4 единиц подряд, и не может быть двух групп по 4 единицы (0111101111). Всего получается 909 вариантов.
- Уже выставленные корабли. От 0 до 4 однопалубных, от 0 до 3 двухпалубных, от 0 до 2 трёхпалубных, 0 или 1 четырёхпалубный. Всего 120 вариантов.
- Для каждого изолированного бита строчки — число клеток в соответствующем вертикальном корабле, попавших в A: от 1 до 4. Таких кораблей не более 5, итого не более 1024 вариантов.
Каждый класс, таким образом, описывается 27 битами, а их общее количество — не более 120 миллионов. В действительности, эта оценка сильно завышена, и программа смогла найти 1053612 классов.
Добавляем новую строку
Пусть у нас есть заполнение S, про которое нам известна только описанная выше информация. Мы хотим продлить его ещё на одну строку: перечислить все заполнения, которые можно получить, определить классы для них, и для каждого нового класса построить карту плотности заполнений.
Сначала посмотрим, какие строки мы можем добавлять к нашему заполнению. Основной критерий известен всем: черная клетка новой строчки не может быть соседней по диагонали с чёрной клеткой последней строчки S. Далее, как мы уже знаем, в новой строчке не может быть слишком длинных кораблей. И еще, если один из вертикальных кораблей имеет длину 4, то продолжаться на новую строку он тоже не может. Остальные ограничения связаны с набором кораблей, и их удобнее проверять потом.
Переберём все строки, которые можно добавить. Если в строке есть более одной единицы подряд, то они образуют горизонтальный корабль — его сразу учитываем в счётчиках законченных кораблей. С изолированными единицами есть три ситуации:
- В последней строке S изолированная единица была, а в новой строке в этом месте её нет. Значит, корабль закончен, и его длина добавляется к счётчику.
- В новой строке изолированная единица есть, а в последней строке S в этом месте её не было. Значит, появился новый вертикальный корабль, и его длина сейчас равна 1.
- Изолированная единица есть и в последней строке S, и в новой строке. Значит, вертикальный корабль продолжается, и его длина увеличивается на 1.
Теперь проверим, допустим ли набор длин. Пусть s1, s2, s3, s4 — число законченных кораблей длины 1,2,3,4 соответственно, а n1, n2, n3, n4 — число незаконченных кораблей с соответствующими длинами. Чтобы набор не противоречил условиям, необходимо следующее:
s1<=4 && s2<=3 && s3<=2 && s4+n4<=1 && (s3+s4+n3+n4)<=3 && (s2+s3+s4+n2+n3+n4)<=6 && (s1+s2+s3+s4+n1+n2+n3+n4)<=10
Информация для нового класса готова. Чтобы построить для него карту, достаточно скопировать первые строки старой карты, а в следующую строку вписать добавленную битовую строчку, умноженную на число комбинаций. Карты одного и того же класса, полученные из разных конфигураций, складываются.
Концовка
После того, как мы добавили к исходной пустой конфигурации 10 строк, у нас получился список из 1053612 классов, каждый — со своей картой. Чтобы получить карту всех конфигураций поля, нам надо пройтись по всем этим классам,«закончить» незаконченные корабли, посчитать число получившихся кораблей каждого размера, и если оно правильное — то прибавить карту класса к общей сумме.
Для пустого поля 10×10 получилось 1855545978831780 конфигураций, а карта заполнения выглядит так (все числа поделены на 109):

То, что она симметрична, косвенно подтверждает, что грубых ошибок в программе нет 🙂 Самая заполненная клетка — С1, самая незаполненная — B2.
После хода в С1 карта примет такой вид:

Последовательность «лучших ходов» при постоянных промахах выглядит так (см. рисунок):
C1, J8, A8, H1, A4, J4, D10, G10, E1, D2, B3, A2, C9, B10, H9, I10, I7, J6, I5, H6, J2, I3, H4, G5, G2, F3, E4, B7, A6, B5, C6, C3, D4, D5, F6.
Видно, что программа не торопится ловить линкоры. К 24-му ходу, когда «диагональному» алгоритму остаётся последний ход до гарантированного попадания, число оставшихся расположений кораблей составляет примерно 240*109, а у «диагонального» алгоритма оно составляет 260*109. Разница невелика. Надо будет устроить турнир между этими алгоритмами, чтобы выяснить, насколько она существенна.
Неделя Морского Боя
Оптимальный алгоритм игры в морской бой GORKOFF
Алгоритм игры в «морской бой»: обстрел противника impersonalis
И более старые публикации:
Теория и практика игры «Морской бой» — по-честному born2fly
Морской бой с искусственным интеллектом — по-честному michurin
ссылка на оригинал статьи http://habrahabr.ru/post/181384/
Добавить комментарий