Сердце роя: алгоритм навигации роя киборгов-насекомых

от автора

Одной из самых активно обсуждаемых тем двадцать первого века является искусственный интеллект и роботизированные технологии. С каждым годом появляются все более совершенные андроиды, способные выполнять те или иные действия, имитируя своих создателей. Но человекоподобный робот не единственный вид, который заслуживает внимания. Также создаются роботы, имитирующие других существ, таких как рыбы, птицы и насекомые. Во время создания роящихся роботов нельзя не учесть тот факт, что рой реальных насекомых, будь то пчелы или муравьи, всегда действует как слаженный механизм, а каждая отдельная особь точно знает свою задачу и маршрут движения, необходимый для ее выполнения. Реализовать подобное поведение внутри исключительно роботизированной системы крайне сложно и затратно, потому необходимы альтернативные решения, даже если они слегка футуристичны Ученые из Наньянского технологического университета (Сингапур) разработали новый алгоритм управления навигацией для роящихся киборгов-насекомых, позволяющий им успешно перемещаться по сложной местности организованными группами. Что легло в основу данного алгоритма, и как он работает? Ответы на эти вопросы мы найдем в докладе ученых.

Основа исследования

Исследования роевой навигации, относящиеся к руководству коллективом агентов для совместного перемещения по среде, привлекают все большее внимание в последние годы. Используя коллективный интеллект автономных объектов, роевая навигация не только облегчает эффективное перемещение по неизведанным территориям, но и расширяет свою полезность в различных аспектах жизни человека, таких как логистика, реагирование на стихийные бедствия и сельское хозяйство. В логистике роевая навигация позволяет оптимизировать планирование маршрутов между несколькими транспортными средствами, повышая эффективность транспортировки и сокращая затраты. При реагировании на стихийные бедствия она обеспечивает скоординированные усилия между роботизированными группами для поддержки мониторинга стихийных бедствий и поиска выживших. В сельском хозяйстве она поддерживает методы точного земледелия, мониторинг здоровья сельскохозяйственных культур и автоматизацию задач для повышения производительности и минимизации воздействия на окружающую среду.

Однако использование обычных роботизированных платформ, таких как UAV и UGV, в роевой навигации имеет заметные недостатки, включая их относительно большой размер и ограниченную мобильность. Эти недостатки создают практические проблемы, особенно в средах, где пространственные ограничения мешают эффективному выполнению задач. Кроме того, их способность работать на больших территориях напрямую ограничена емкостью аккумулятора, что ограничивает выносливость и общую эффективность.


Изображение №1

В этом исследовании представлены киборги-насекомые как решение ограничений традиционных роботов в роевой навигации. Киборги-насекомые (1a), которые объединяют живых насекомых с миниатюрными электронными контроллерами, предлагают несколько преимуществ по сравнению с обычными роботами. Одним из преимуществ является их энергоэффективность. В отличие от роботов, которые обычно полагаются на энергоемкие приводные механизмы, такие как двигатели для передвижения, киборги используют естественную подвижность насекомых и требуют меньшего потребления энергии. Киборги также могут адаптироваться к сложным ландшафтам. Они могут без усилий маневрировать вокруг препятствий различных форм и размеров и легко проходить через узкие пространства. Кроме того, киборги оснащены сложными сенсорными системами, которые позволяют им быстро воспринимать и реагировать на окружающую среду.

Из-за этих особенностей исследования киборгов в последнее время привлекают все большее внимание. Ранее уже были исследования киборгов, которые в основном продемонстрировали их функциональность в условиях отсутствия препятствий. В других трудах описывалось как одиночный киборг успешно перемещается по довольно сложной местности за счет ручного управления. Еще более эффективными стали киборги, способные перемещаться по заданному маршруту, но по неизведанной местности, преодолевая препятствия самостоятельно. Однако, несмотря на вышеупомянутые достижения в управлении одним киборгом, проблема навигации нескольких киборгов в литературе не рассматривалась (1b1d).

Многоагентная система имеет многочисленные преимущества по сравнению с одноагентной системой, такие как отказоустойчивость, распределенное решение проблем и применимость к масштабным проблемам. Кроме того, многокиборговая система предлагает уникальные преимущества, особенно с точки зрения повышенной надежности и интеллекта. Что касается надежности, взаимодействие между киборгами в многокиборговой системе может улучшить их способность восстанавливаться после переворота, поскольку хорошо продуманный алгоритм управления роем может позволить перевернувшимся киборгам быть окруженными соседями, которые обеспечивают точки поддержки и помогают в их быстром восстановлении. Кроме того, роевое поведение многокиборговой системы способствует ее интеллекту. Когда киборг сталкивается с потенциально сложной областью, он замедляется и пытается пройти через препятствие или обойти его. Соседние киборги будут маневрировать вокруг замедленного киборга таким же образом, как они избегали бы препятствий. Следовательно, это маневрирование заставляет соседних киборгов обходить сложную зону, вызвавшую замедление. Это кооперативное поведение похоже на обычные человеческие стратегии, такие как выбор более коротких очередей в супермаркетах. Более того, при правильно разработанных алгоритмах управления роем киборги, обходящие сложную зону, могут коллективно помогать особям, оказавшимся в ней как в ловушке.

В то время как системы с несколькими киборгами предлагают различные преимущества по сравнению с системами с одним киборгом, управление несколькими насекомыми-киборгами представляет собой множество проблем. Будучи частично биологическими существами, насекомые-киборги сохраняют естественные инстинкты, которые ограничивают точность управления по сравнению с роботами, поскольку каждое насекомое по-разному реагирует на один и тот же стимул. Управление одним киборгом может быть осуществимо, несмотря на эту изменчивость, но управление роем представляет собой проблему. Продвинутые методы, такие как адаптивное управление, могут привести киборгов в желаемые положения, но они часто требуют интенсивной стимуляции. Этот уровень стимуляции увеличивает риск привыкания, когда восприимчивость киборгов к сигналам управления со временем уменьшается. Считается, что этот процесс включает синаптические изменения в нервной системе, когда нейроны становятся менее восприимчивыми к стимулу из-за снижения высвобождения нейротрансмиттера или из-за снижения чувствительности рецепторов. Более того, некоторые врожденные модели поведения насекомых-киборгов могут даже препятствовать применению традиционной логики управления роем. Например, попытки использовать стимуляцию для разделения насекомых-киборгов, находящихся в непосредственной близости, часто оказываются безуспешными, часто заставляя одно насекомое взбираться на другое, что приводит к запутыванию. Запутывание представляет потенциальный риск, поскольку оно может повредить рюкзак киборга (электронную часть) или его соединение с насекомым, делая киборга нефункциональным. В совокупности эти проблемы показывают, что традиционные методы контроля не подходят для управления роем киборгов.

В рассматриваемом нами сегодня труде ученые предложили алгоритм, который может решить вышеописанные проблемы. Этот алгоритм не только адаптируется к уникальным характеристикам насекомых-киборгов, но и использует эти черты для эффективной навигации роя. Он предлагает улучшения по сравнению с обычными методами с точки зрения безопасности, выносливости и адаптивности. В частности, данный алгоритм использует естественные инстинкты насекомых, обеспечивая эффективную навигацию по сложным ландшафтам без необходимости точного управления движением. Прерывистые управляющие входы, генерируемые алгоритмом, помогают смягчить привыкание, тем самым увеличивая время работы. Кроме того, стратегия управления снижает риск запутывания среди киборгов, повышая общую безопасность роя.

Результаты исследования

Принцип работы алгоритма


Изображение №2

Предложенный в этом труде алгоритм может управлять роем киборгов от начала до заданной цели в неизвестной песчаной местности при наличии препятствий и холмов (2a). Управляемая система из нескольких киборгов состоит из лидера и нескольких последователей (ведомых). Все они являются агентами, способными к базовому направленному рулевому управлению и движению вперед. Каждый агент может обнаруживать соседей в пределах ограниченного диапазона обнаружения и отличать лидера от последователей. Только лидеру дается положение цели. Предложенный алгоритм состоит из двух основных компонентов: планирование движения и отслеживание траектории (2b). Алгоритм планирования движения обеспечивает желаемые положения киборгов для следующего временного шага на основе их локальной информации. Затем алгоритм отслеживания траектории получает эту информацию и вычисляет соответствующую амплитуду и типы стимуляции (влево, вправо или ускорение), которые будут применены к насекомым.

Алгоритм планирования движения был разработан на основе наблюдаемого поведения туристов, которые следуют за лидером тура. В частности, алгоритм состоит из следующих двух четких и простых правил. Первое правило — это правило свободного движения (FM от freemotion), которое предоставляет последователям свободу двигаться либо когда лидер виден, либо когда они остаются близко к толпе. В противном случае они придерживаются правила движения к толпе (MTC от move-toward-crowd), которое направляет последователей к лидеру, когда он виден, и в направлении толпы, когда он не виден. Объединяя эти правила, был создан алгоритм управления TGI (от Tour Group Inspired, т. е. вдохновленный туристическими группами). Его можно применить к системе мульти-киборгов: если количество соседей mi в пределах свободного диапазона последователя i (т. е. круговой области вокруг него, радиус которой меньше его диапазона обнаружения) меньше порогового значения M, последователь i следует правилу MTC; в противном случае он совершает свободные движения. Когда последователи вычисляют mi, лидеру присваивается больший вес, чем отдельному последователю. В результате, когда лидер выходит из зоны свободного доступа последователя i, последний воспринимает потерю как эквивалентную нескольким соседям, часто опускаясь ниже порога M. Это побуждает последователя i следовать за лидером, поддерживая сплоченность группы и предотвращая ситуацию, когда лидер уходит, а группа остается.

Стоит отметить, что особь в режиме свободного движения не может активно следовать за роем все время. Однако алгоритм управления гарантирует, что если число соседей «свободного» последователя падает ниже порогового значения, он будет повторно стимулирован для повторного присоединения к группе. Этот механизм позволяет особи временно заниматься свободным движением, сохраняя при этом общую сплоченность с роем. Более того, этот механизм также снижает риск запутывания, которое происходит, когда киборги стимулируются в непосредственной близости. Если насекомое-киборг находится в области с достаточным количеством соседних насекомых, ему разрешено свободно перемещаться без стимуляции. В этом нестимулированном состоянии киборги полагаются на свои естественные инстинкты, чтобы маневрировать вокруг близлежащих насекомых, тем самым избегая запутывания.

Дополнительно, как было сказано выше, использовался алгоритм отслеживания траектории. Важно, что к насекомым можно применять два типа стимуляции: рулевое управление (влево или вправо) и ускорение. Чтобы определить тип стимуляции, алгоритм работает следующим образом. Для каждого последователя i алгоритм сначала делит его свободный диапазон на несколько секторов. Затем алгоритм выбирает произвольного киборга из целевого сектора (с наибольшим количеством соседей) в качестве целевого киборга и направляет последователя к нему. Если угол θi между текущим направлением движения последователя i и линией, соединяющей себя с целевым киборгом, меньше порогового значения θthreshold, рулевое управление не применяется, и алгоритм переходит к принятию решения об ускорении. Ускорение не будет применяться, если скорость последователя i (vi) превысит определенное пороговое значение vthreshold. В противном случае будет применено ускорение, и его величина пропорциональна расстоянию между последователем и целевым киборгом. Эта величина ограничена максимальным напряжением (2.5 В), которое может выдержать киборг.

Алгоритм управления TGI использует свободные движения насекомых, потенциально повышая эффективность преодоления препятствий и рельефа местности. Кроме того, использование свободных движений снижает частоту электрических стимуляций насекомых. Следовательно, это снижает вероятность привыкания насекомых, экономит заряд батареи рюкзака и, в свою очередь, продлевает использование киборгов. Более того, правило FM в алгоритме TGI смягчает влияние индивидуальной изменчивости насекомых на эффективность управления. В частности, правило FM обеспечивает свободные движения киборгов в плотно упакованных частях роя, эффективно предотвращая запутывания и тем самым укрепляя надежность системы из нескольких киборгов.

Практические испытания

Осуществимость предлагаемого алгоритма навигации роя была проверена в реальных экспериментах в рамках концептуального, но сложного сценария. Было проведено десять испытаний для демонстрации воспроизводимости экспериментов.

В экспериментах в качестве платформы робота использовались 20 киборгов на песчаном поле размером 3.5 м на 3.5 м с камнями и холмами. Среди 20 киборгов есть один лидер, а остальные 19 — последователи. Лидеру была назначена определенная целевая позиция, тогда как 19 агентам-последователям были предоставлены только относительные позиции их промежуточных соседних агентов. Как уже упоминалось, последователи могут различать лидера и последователей. Все киборги заранее не имеют информации о препятствиях и холмах. Лидер направлялся к цели с помощью алгоритма, разработанного ранее, в то время как последователи контролировались с помощью алгоритма TGI, разработанного в данном труде.


Изображение №3

Предложенная стратегия управления была успешно реализована в системе мульти-киборгов, эффективно направляя рой к назначенной целевой области. Для демонстрации воспроизводимости экспериментов было проведено десять испытаний, результаты которых просуммированы на изображении выше. Иллюстрация экспериментов по навигации роя киборгов на неизвестной прегражденной местности представлена на 3a. Траектории киборгов представлены на 3b, где путь лидера, траектории последователей, позиции, в которых киборги были стимулированы, и конечные позиции всех 20 киборгов представлены желтой кривой, синими кривыми, красными кругами и черными точками соответственно. На 3c показан соответствующий вид сверху испытания №1 (Exp 1). Результаты Exp 2–10 проиллюстрированы на 3d.

На 3d наблюдается заметное отклонение лидера в Exp 2, где он, по-видимому, переходит в другую позицию, а затем возвращается к своей назначенной траектории. Это происходит из-за того, что маркер лидера, который используется для локализации в системе захвата движения VICON, становится загрязненным и временно неотслеживаемым в течение > 5 секунд. В течение этого периода алгоритм управления не мог отслеживать точное положение лидера. Следующий механизм был разработан для смягчения таких сбоев. Когда маркер лидера становится неотслеживаемым, последователи перемещаются к последней известной позиции лидера, обеспечивая сплоченность группы и не давая группе рассредоточиться. Как только система VICON снова получает маркер лидера, алгоритм управления снова включается, направляя лидера обратно к его предполагаемой траектории, и в этот момент агенты-последовательницы возобновляют отслеживание в реальном времени.

Степень автономии, изображенная на 3e, иллюстрирует эффективность предлагаемого алгоритма в использовании инстинктов насекомых. В этом исследовании степень автономии для системы мульти-киборгов определялась следующим образом: для каждого экспериментального испытания вычислялось отношение Alk для лидера и среднее отношение Afk для последователей в испытании k между временем без стимуляции и всем экспериментальным периодом. Затем степень автономии всех 10 испытаний определяется как Σ10k = 1Alk/10 для лидера и Σ10k = 1Afk/10 для последователей. Как показано на 3e, синяя полоса указывает степень автономии последователей, в то время как желтая полоса представляет степень автономии лидеров. Планки погрешностей обозначают стандартное отклонение. При обычном управлении средняя степень автономности лидера составила 0.26 по результатам 10 экспериментальных испытаний, тогда как последователи при предлагаемом алгоритме управления достигли средней степени автономности 0.5. Данный подход почти удваивает время свободного перемещения киборгов, эффективно снижая вероятность привыкания насекомых, экономя заряд батареи рюкзака и, в свою очередь, продлевая использование роевой системы.

Дополнительные наблюдения

В ходе экспериментов несколько других интересных явлений продемонстрировали особенности предлагаемого алгоритма управления TGI:

  • Использование свободных движений уменьшает запутанность среди киборгов, что приводит к повышению безопасности системы из нескольких киборгов.
  • Взаимодействие между соседями может помочь застрявшему киборгу выбраться из сложной ситуации.
  • Соседи могут помочь киборгу восстановиться после переворота, что, в свою очередь, повышает устойчивость роя киборгов.

Рассмотрим эти наблюдения более детально.


Изображение №4

Во-первых, алгоритм управления TGI повышает безопасность многоагентной системы, уменьшая запутанность между киборгами. Эксперименты показали, что киборги инстинктивно избегают столкновений с соседями во время свободного перемещения. Однако, когда два киборга приблизились друг к другу слишком близко и правило разделения из обычного алгоритма BOIDS было применено для стимуляции киборгов отходить друг от друга, они не разделились и вместо этого запутались. Запутанность может привести к нежелательным результатам, таким как повреждение киборгов. Эта проблема часто возникала при обычном управлении на основе алгоритма BOIDS, когда соседи становились слишком близкими. Как показано на 4a, центральная линия внутри рамки указывает на медианное число запутанности, в то время как границы представляют собой 25-й и 75-й процентили (нижний и верхний квартили). Этот график демонстрирует, что предлагаемый алгоритм TGI уменьшает запутывания по сравнению с алгоритмом BOIDS. На 4b показаны запутывания, где несколько киборгов перекрываются, тогда как 4c показывает близко расположенных, но не запутывающихся киборгов. Возможность использования свободного движения для предотвращения запутывания демонстрируется на 4d и 4e. Когда киборги приближались друг к другу, метод BOIDS пытался разделить их, применяя интенсивную стимуляцию, что оказалось безуспешным (4d). Напротив, предлагаемый контроль TGI использовал свободное движение киборгов, используя их врожденное поведение, чтобы избежать запутывания (4e).


Изображение №5

Во-вторых, взаимодействие между соседями может помочь застрявшему киборгу выбраться из сложной ситуации. Как показано на 5a, в ходе эксперимента маркер киборга (в форме «Y») заклинился на краю препятствия. Тем временем, следуя предложенному алгоритму управления, другие киборги обходили киборга, что косвенно позволяло рою обойти препятствие. Кроме того, примечательно, что в соответствии с правилом MTC предложенного алгоритма управления киборги, обходящие сложные зоны, могут помогать застрявшим киборгам, облегчая прохождение всего роя. Как показано на снимках, когда киборг, отмеченный желтым кругом, изначально застрял на препятствии, он оставался не стимулированным из-за своей близости к соседям. Однако, когда соседи обходили застрявшего (t = t2), они начали «притягивать» его (стимуляции были повторно применены к киборгу), оттягивая его от препятствия.

В-третьих, соседи могут помочь перевернувшемуся киборгу. Хотя соседние киборги могут перемещаться вокруг перевернувшегося киборга таким же образом, как они избегают препятствий, они также играют пассивную, но важную роль в содействии его восстановлению. Перевернувшийся киборг может использовать взаимодействия с ближайшими соседями, такие как физический контакт или хватание, чтобы помочь себе вернуться в вертикальное положение. Это кооперативное взаимодействие повышает общую устойчивость роя, не требуя прямого алгоритмического вмешательства. Гистограмма на 5b иллюстрирует три случая самостоятельной попытки и помощи соседей по восстановлению после переворотов. Различие в показателях восстановления особенно очевидно в случае 3, где киборг боролся в течение 26.5 секунд, прежде чем схватить проходящего мимо соседа, а затем успешно восстановился всего за 4.5 секунды. Снимки случаев 1 и 3, где киборги восстановились с помощью соседей, также представлены на 5b соответственно. Предложенный алгоритм управления TGI обеспечивает наличие соседей вокруг каждого киборга и, в свою очередь, повышает надежность системы из нескольких киборгов.

Видеоматериалы к исследованию:

Видео №1: презентация роя киборгов.

Видео №2: движение роя киборгов к целевой позиции.

Видео №3: сравнение алгоритмов BOIDS и TGI.

Видео №4: застрявший киборг выбирается из «ловушки».

Видео №5: восстановление после переворота.

Видео №6: поведение роя во время смены роли лидера.

Видео №7: сопротивление стимулам и преодоление препятствия с помощью инстинктов.

Для более детального ознакомления с нюансами исследования рекомендую заглянуть в доклад ученых и дополнительные материалы к нему.

Эпилог

В рассмотренном нами сегодня труде ученые описали разработанный ими алгоритм управления многоагентными кибернетическими системами. Роль киборгов исполнили насекомые, к которым были прикреплены специальные электронные устройства (рюкзаки). Эти рюкзаки оснащены датчиками (оптическими, инфракрасными), аккумулятором и антенной для связи, что позволяет посылать на рюкзак дистанционные стимулы.

Во время практических испытаний было задействовано 20 особей мадагаскарских шипящих тараканов: один лидер и 19 последователей. Рой должен был преодолеть расстояние от старта к финишу по песчаной местности с различными препятствиями на их пути.

Важной особенностью алгоритма управления роем является большая степень свободы действий для насекомых. В определенных ситуациях (при застревании в препятствии, запутывании нескольких особей или переворотах на спину) куда выгоднее и эффективнее позволить киборгу выйти из затруднительного положения, используя собственные инстинкты и кооперационное поведение, а не использовать стимуляцию, которая может вызвать привыкание с последующим снижением ее эффективности.

Факт того, что для этого исследования использовались живые особи, а не полноценные роботы, обусловлен тем, что в таком варианте необходимо меньше энергии, а маневренность и локомоция тараканов куда лучше, чем у роботов. Кроме того, как уже упоминалось выше, инстинкты насекомых также играли положительную роль в выполнении поставленной перед роем задачи. Снижая степень внешнего воздействия и контроля и позволяя природному поведению главенствовать, можно наблюдать сложные формы поведения, такие как кооперация, которую воссоздать алгоритмически крайне сложно.

В совокупности, данное исследование показывает, что биогибридные системы обладают огромным потенциалом и нуждаются в дальнейшем изучении и совершенствовании. Управляемый, но при этом обладающий определенной степенью свободы рой киборгов-насекомых может быть использован как в сельском хозяйстве для мониторинга урожая, так и в случаях каких-либо катастроф для оценки безопасности местности и поиска пострадавших.

В будущем ученые намерены продолжить свою работу. Следующим шагом станет разработка алгоритма управления роем, позволяющего не только выполнять простые действия (как перемещение с точки A в точку B), но и выполнять более сложные кооперативные задачи (например, перенос большого объекта).

Немного рекламы

Спасибо, что остаётесь с нами. Вам нравятся наши статьи? Хотите видеть больше интересных материалов? Поддержите нас, оформив заказ или порекомендовав знакомым, облачные VPS для разработчиков от $4.99, уникальный аналог entry-level серверов, который был придуман нами для Вас: Вся правда о VPS (KVM) E5-2697 v3 (6 Cores) 10GB DDR4 480GB SSD 1Gbps от $19 или как правильно делить сервер? (доступны варианты с RAID1 и RAID10, до 24 ядер и до 40GB DDR4).

Dell R730xd в 2 раза дешевле в дата-центре Maincubes Tier IV в Амстердаме? Только у нас 2 х Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 ТВ от $199 в Нидерландах! Dell R420 — 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB — от $99! Читайте о том Как построить инфраструктуру корп. класса c применением серверов Dell R730xd Е5-2650 v4 стоимостью 9000 евро за копейки?


ссылка на оригинал статьи https://habr.com/ru/articles/872402/