Взламываем Ball Sort Puzzle

Ball Sort Puzzle — это популярная мобильная игра на IOS/Android. Суть её заключается в перестановке шариков до тех пор, пока в колбах не будут шарики одного цвета. При этом шарик можно перетаскивать либо в пустую колбу, либо на такой же шарик.

Так случилось, что я в неё залип. Очнулся примерно через месяц, на 725 уровне. Он мне никак не давался — насколько бы глубоко я не пытался продумать свою стратегию. В итоге — с этим вопросом я вышел в интернет, и заодно выяснил несколько интересных особенностей головоломки.

Во-первых, — игра ~~бесконечна~~ почти бесконечна. По крайней мере уже сейчас на YouTube есть прохождения всех уровней в плоть до 5350, а в телеграмме гуляют скриншоты 10к+ уровней. Вторая особенность, и вот это уже некрасиво, — не у всех уровней есть решение.

Ну это ни в какие ворота — против нас играет коварный ИИ. Нужно действовать соответственно!

Под катом мы:

Придумаем алгоритм, решающий эту головоломку (Python)
Научимся парсить скриншот игры, чтобы скармливать алгоритму задачки (OpenCV)
Напишем телеграм бота, который будет принимать скриншоты и возвращать решения
Выстроим CI/CD через GitHub Actions и задеплоим бота на Яндекс.Функции

Погнали!

Алгоритмическое решение задачи

Решать такую задачу было весьма занимательно. Поэтому предлагаю заинтересованному читателю попробовать решить её самостоятельно.

Я же в первую очередь решил побить проблему на сущности. Это сделает алгоритм чуть более элегантным, а так же поможет в будущем парсить скриншоты игры:

class Color

class Color:     def __init__(self, symbol, verbose_name, emoji):         self.symbol = symbol         self.verbose_name = verbose_name         self.emoji = emoji      def __repr__(self) -> str:         return f'Color({self})'      def __str__(self) -> str:         return self.emoji

Beta-редактор хабра ломается на рендеринге emoji :poop:

class Ball

class Ball:     def __init__(self, color: Color):         self.color = color      def __eq__(self, other: 'Ball'):         return self.color is other.color      def __repr__(self):         return f'Ball({self.color.verbose_name})'      def __str__(self) -> str:         return str(self.color)

class Flask

class Flask:     def __init__(self, column: List[Color], num: int, max_size: int):         self.num = num         self.balls = [Ball(color) for color in column]         self.max_size = max_size      @property     def is_full(self):         return len(self.balls) == self.max_size      @property     def is_empty(self) -> bool:         return not self.balls      def pop(self) -> Ball:         return self.balls.pop(-1)      def push(self, ball: Ball):         self.balls.append(ball)      def __iter__(self):         return iter(self.balls)      def __getitem__(self, item: int) -> Ball:         return self.balls[item]      def __len__(self) -> int:         return len(self.balls)      def __str__(self) -> str:         return str(self.balls)

class Move

class Move:     def __init__(self, i, j, i_color: Color):         self.i = i         self.j = j         self.emoji = i_color.emoji      def __eq__(self, other: 'Move') -> bool:         return (self.i, self.j) == (other.i, other.j)      def __repr__(self) -> str:         return f'Ball({self})'      def __str__(self) -> str:         return f'{self.i} -> {self.j}'

Для решения будем использовать метод поиска с возвратом (Backtracking).

Решение задачи методом поиска с возвратом сводится к последовательному расширению частичного решения. Если на очередном шаге такое расширение провести не удается, то возвращаются к более короткому частичному решению и продолжают поиск дальше. Данный алгоритм позволяет найти все решения поставленной задачи, если они существуют.

В случае с нашей игрой это метод применяется так: мы рекурсивно обходим все возможные перестановки шариков (move) до тех пор, пока

Либо нас не выкинет наш критерий остановки — решённый пазл
Либо в нашем хранилище состояний (states) не будет всех возможных перестановок — в таком случае решения нет

    def solve(self) -> bool:         if self.is_solved:             return True          for move in self.get_possible_moves():             new_state = self.commit_move(move)             if new_state in self.states:  # Cycle!                 self.rollback_move(move)                 continue              self.states.add(new_state)             if self.solve():                 return True             self.rollback_move(move)          return False

Алгоритм достаточно прямолинейный и далеко не всегда выдаёт оптимальное решение. Тем не менее он справляется с решением большинства задачек из игры за 1 сек.

Проверим алгоритм на чём-нибудь попроще:

def test_3x3():     data_in = [         [color.RED, color.GREEN, color.RED],         [color.GREEN, color.RED, color.GREEN],         [],     ]      puzzle = BallSortPuzzle(data_in)     result = puzzle.solve()     assert result is True     play_moves(data_in, puzzle.moves)

Полная версия программы доступна на github.

Распознавание скриншотов игры

Мы будем работать с .jpg картинками двух видов

Каждый чётный раунд игры состоит из 11 колб и 36 шариков, а нечётный — 14 колб и 48 шариков. Чётные и нечётные раунды отличаются расположением колб, но на счастье всё остальное у них одинаковое — по 4 шарика в колбе, 2 колбы пустые, цвета используются одни и те же.

Первое, что хочется сделать — это обрезать рабочую область, оставив только колбы с шариками. В противном случае наша программа за шарики может принимать элементы управления, фон или рекламу. Для этого отрежем по четверти сверху и снизу изображения.

class ImageParser:     def __init__(self, file_bytes: np.ndarray, debug=False):         self.image_orig = cv2.imdecode(file_bytes, cv2.IMREAD_COLOR)         self.image_cropped = self.get_cropped_image(self.image_orig)      @staticmethod     def get_cropped_image(image):         height, width, _ = image.shape         quarter = int(height / 4)         cropped_img = image[quarter : height - quarter]         return cropped_img

Теперь будем искать кружочки. В библиотеке OpenCV ровно для этих целей существует метод HoughCircles. Чтобы его использовать нужно перевести изображение в чёрно-белый вид, а также «эмпирически подобрать» параметры поиска. Чтобы найденные кружочки потом расфасовать по колбам, нормализуем и отсортируем их.

    @staticmethod     def normalize_circles(circles):         last_y = 0         for circle in circles:             if math.isclose(circle[1], last_y, abs_tol=3):                 circle[1] = last_y             else:                 last_y = circle[1]         return circles      def get_normalized_circles(self) -> List[Any]:         image_cropped_gray = cv2.cvtColor(self.image_cropped, cv2.COLOR_BGR2GRAY)         circles = cv2.HoughCircles(image_cropped_gray, cv2.HOUGH_GRADIENT, 2, 20, maxRadius=27)         if circles is None:             raise ImageParserError("No circles :shrug:")          circles = np.round(circles[0, :]).astype("int16")         ind = np.lexsort((circles[:, 0], circles[:, 1]))         circles = circles[ind]         circles = self.normalize_circles(circles)         ind = np.lexsort((circles[:, 0], circles[:, 1]))         circles = circles[ind]         return circles

Отсортированные шарики слева-направо, сверху-вниз

Дальше будем определять цвет шарика.

Из-за того, что Telegram жмёт картинки мы не можем просто взять цвет центрального пикселя — он может быть артефактом компрессии. Поэтому найдём доминирующий цвет, — тот который в кружочке встречается чаще всего.

    @staticmethod     def get_dominant_color(circle) -> Color:         colors, count = np.unique(circle.reshape(-1, circle.shape[-1]), axis=0, return_counts=True)         dominant = colors[count.argmax()]         return dominant

Этот доминирующий цвет мы будем сравнивать с изначально заданными цветами, и искать ближайший. В данной задаче нам на помощь приходит Евклидово расстояние и теорема Пифагора: если представить цвет точкой в трёхмерном пространстве, то расстояние до любой другой точки этого пространства:

$d = \sqrt{(r2-r1)^2 + (b2-b1)^2 + (g2-g1)^2}$

Посчитаем такое расстояние до каждого из изначально заданных цветов и найдём минимальное

RBG_TO_COLOR = {     (147, 42, 115): VIOLET,     (8, 74, 125): BROWN,     (229, 163, 85): L_BLUE,     (68, 140, 234): ORANGE,     (196, 46, 59): BLUE,     (51, 100, 18): GREEN,     (35, 43, 197): RED,     (87, 216, 241): YELLOW,     (125, 214, 97): L_GREEN,     (123, 94, 234): PINK,     (16, 150, 120): LIME,     (102, 100, 99): GRAY, } COLORS = np.array(list(RBG_TO_COLOR.keys()))  def get_closest_color(color: np.ndarray) -> Color:     distances = np.sqrt(np.sum((COLORS - color) ** 2, axis=1))     index_of_smallest = np.where(distances == np.amin(distances))     smallest_distance = COLORS[index_of_smallest].flat     return RBG_TO_COLOR[tuple(smallest_distance)]  # type: ignore

Далее нам остаётся только распределить шарики по колбам. Итоговый class ImageParser доступен на github.

Преобразуем программу в Telegram Bot

Узнать про то, как сделать телеграм бота на Python можно сразу из нескольких статей на хабре. Я лишь опишу пару нюансов, с которыми столкнулся.

Так как наш бот хоститься на Яндекс.Функции — триггером к его запуску будет запрос на заданный нами webhook.

Whenever there is an update for the bot, we will send an HTTPS POST request to the specified url, containing a JSON-serialized Update.

Если в сообщении есть массив photo, то можно увеличить вероятность распознавания шариков выбрав фотографию с максимальным весом:

if photos := message.get('photo'):     # here photos is an array with same photo of different sizes     # get one with the highest resolution     hd_photo = max(photos, key=lambda x: x['file_size'])

Чтобы скачать картинку, придётся сделать 2 запроса к Telegram API

# Получение данных о файле, нас интересует ключ ответа file_path GET https://api.telegram.org/bot{BOT_TOKEN}/getFile?file_id={file_id} # Получение самого файла GET https://api.telegram.org/file/bot{BOT_TOKEN}/{file_path}

В остальном же всё просто — получаем картинку, скармливаем её парсеру и затем алгоритму-решателю.

main.py

def handler(event: Optional[dict], context: Optional[dict]):     body = json.loads(event['body'])  # type: ignore     print(body)     message = body['message']     chat_id = message['chat']['id']      if photos := message.get('photo'):         # here photos is an array with same photo of different sizes         hd_photo = max(photos, key=lambda x: x['file_size'])  # get one with the highest resolution         try:             file = telegram_client.download_file(hd_photo['file_id'])         except TelegramClientError:             text = "Cant download the image from TG :("         else:             file_bytes = np.asarray(bytearray(file.read()), dtype=np.uint8)             try:                 image_parser = ImageParser(file_bytes)                 colors = image_parser.to_colors()             except ImageParserError as exp:                 text = f"Cant parse image: {exp}"             else:                 puzzle = BallSortPuzzle(colors)  # type: ignore                 solved = puzzle.solve()                 if solved:                     text = get_telegram_repr(puzzle)                 else:                     text = "This lvl don't have a solution"     else:         return {             'statusCode': 200,             'headers': {'Content-Type': 'application/json'},             'body': '',             'isBase64Encoded': False,         }      msg = {         'method': 'sendMessage',         'chat_id': chat_id,         'text': text,         'parse_mode': 'Markdown',         'reply_to_message_id': message['message_id'],     }      return {         'statusCode': 200,         'headers': {'Content-Type': 'application/json'},         'body': json.dumps(msg, ensure_ascii=False),         'isBase64Encoded': False,     }

Отмечу ещё один нюанс: телеграм очень строго следует политике экранирования спецсимволов. Для Markdown это:

To escape characters ‘_’, ‘*’, ‘`’, ‘[‘ outside of an entity, prepend the characters ‘\’ before them.

Любой такой неэкранированный символ — и вы не увидите ответа в телеграм-чате. И останется только гадать — является ли это ошибка интеграции или вот такой коварный баг. Будьте осторожны.

Деплой бота в Яндекс.Функцию

Про создание Я.Функции также есть отличная статья от @mzaharov. Там подробно описан процесс заведения функции, а также установки вебхука для телеграмм бота.

Я расскажу как сделал Continuous Delivery при помощи GitHub Actions. Каждая сборка мастера увенчивается деплоем новой версии функции. Такой подход заставляет придерживаться модели разработки GithubFlow с его главным манифестом

Anything in the master branch is always deployable.

Каждая сборка мастера состоит из 3ёх этапов

lint (black, flake8, isort, mypy) — проверка кода на соответствие всем стандартам Python 2020
test — тестируем программу с помощью pytest, поддерживая качество и покрытие кода
deploy — непосредственно заливаем новую версию приложения в облако

Деплоить будем с помощью Yandex-Serveless-Action — уже готового Action для использования в своих пайплайнах

  deploy:     name: deploy     needs: pytest     runs-on: ubuntu-latest     if: github.ref == 'refs/heads/master'     steps:       - uses: actions/checkout@master       - uses: goodsmileduck/yandex-serverless-action@v1         with:           token: ${{ secrets.YC_TOKEN }}           function_id: ${{ secrets.YC_FUNCTION_ID }}           runtime: 'python38'           memory: '256'           execution_timeout: "120"           entrypoint: 'main.handler'           environment: "\             TELEGRAM_BOT_TOKEN=${{ secrets.TELEGRAM_BOT_TOKEN }}"           source: 'app'

Переменные окружения программы и сборки спрячем в GitHub Secrets на уровне репозитория.

Результат

Бота можно найти в telegram по позывному @ballsortpuzzlebot.

Все исходники — на Github.

Присоединяйтесь к маленькому community любителей этой игры в telegram. Бот был добавлен в группу и внимательно следит за всеми отправленными картинками.

Бонус! Уровни, у которых нет решения

Мой алгоритм умывает руки — говорит что перебрал все возможные комбинации и решения нет. Возможно это баг алгоритма.. или QA-отдел мобильной игры просто забил на эти уровни, так как не предполагал, что кто-то так далеко зайдёт)

Заключение

Для меня это был интересный опыт скрещивания технологий (Telegram API + Python + OpenCV + Lambda). Надеюсь он окажется полезен кому-нибудь ещё.

Найденные баги, предложения по оптимизации алгоритма, или даже PR в репозиторий крайне приветствуются

С новым годом!

ссылка на оригинал статьи https://habr.com/ru/post/536086/