Компьютер освоил StarCraft на уровне опытных игроков

Николай Воронцов

Исследователи из китайской компании Alibaba Group и Университетского колледжа Лондона продемонстрировали компьютерную программу, которая самостоятельно освоила в StarCraft некоторые тактики, используемые опытными игроками. Исследование доступно на ArXiv.org.

Вызов: национальная премия в области будущих технологий.

В последнее время искусственный интеллект начал обыгрывать людей в игры, которые раньше компьютер не мог освоить на уровне профессиональных игроков. Сначала программа AlphaGo «победила человечество в го», выиграв у одного из сильнейших игроков в мире, затем программа Libratus победила в 20-дневном покерном турнире «Brains Vs. Artificial Intelligence: Upping the Ante», обыграв четырех профессиональных игроков в покер. Тем не менее, в некоторых играх с неполной информацией компьютер все еще уступает человеку, и пока что одной из таких игр остается первый StarCraft.

В новой работе исследователи рассказали о прогрессе компьютерного игрока, который для обучения использует двунаправленно-скоординированную сеть (Bidirectionally-Coordinated Net, BiCNet) на основе рекуррентных нейросетей. По словам авторов, BiCNet лучше других существующих нейросетей подходит для обучения и взаимодействия нескольких агентов (подконтрольных ИИ боевых единиц).

Представленная авторами программа самостоятельно достигла определенных успехов в области микроконтроля юнитов при ведении боя в StarCraft. Для обучения использовались тестовые сражения — например, три пехотинца против зерглинга с большим количеством здоровья. Сначала пехотинцы постоянно сталкивались друг с другом, убегая от зерглинга, но после 50 повторений сражения и более чем 40 тысяч шагов агенты научились разбегаться от врага практически безупречно.

Кроме перемещения юнитов с минимальным блокированием пути следования друг друга ИИ также самостоятельно освоил различные тактики ведения боя. Программа освоила базовую тактику «Hit & Run» («Ударил-убежал»), при которой один или несколько агентов с дистанционной атакой начинают вести огонь по противнику, однако затем отступают на условно безопасное расстояние. Также компьютер освоил более сложную тактику, атаку прикрывающим огнем, — несколько агентов используют тактику «Hit & Run», пока один из них не будет выбран врагом в качестве основной цели, остальные агенты при этом продолжают вести сосредоточенный огонь по врагу.

Кроме того, разработчики продемонстрировали, что компьютерный игрок освоил сосредоточенное ведение огня по одной цели малыми группами, что позволяет эффективно уничтожать юниты противника в бою. Также искусственный интеллект научился учитывать возможности юнитов разного типа, при этом в бою учитываются как возможности агентов (например, десантные корабли используются для того, чтобы спрятать танки от ультралисков), так и возможности врага (ИИ при сражении с муталисками рассредотачивает свои юниты, чтобы снаряды-симбионты не могли поразить нескольких агентов).

Стоит отметить, что микроконтроль может обеспечить в бою победу даже при значительно превосходящих силах противника. Однако кроме этого в StarCraft необходимо принимать еще и глобальные стратегические решения — строить здания, покупать улучшения и оперативно отвоевывать ресурсы. Общую «продвинутость» программы можно будет оценить после участия ее в Starcraft AI Competition — это ежегодные соревнования среди специализированных алгоритмов.

Стратегия в реальном времени StarCraft вместе с дополнением Brood War была выпущена Blizzard в 1998 году. StarCraft принято считать одной из важнейших игр в киберспорте. Несмотря на солидный для компьютерной игры возраст и уже вышедшую вторую часть крупные турниры по StarCraft: Brood War проходят до сих пор. Недавно Blizzard Entertainment официально объявила о создании ремастеринг-версии StarCraft, релиз запланирован на лето 2017 года.

Николай Воронцов

Нашли опечатку? Выделите фрагмент и нажмите Ctrl+Enter.

17:03 31.07.23 2.3 Роботы и дроны Технологии

Похожий на цветок розы мягкий манипулятор поможет собрать урожай

Он надежно обхватывает хрупкие предметы, не повреждая их

Андрей Фокин

Инженеры из Японии и Вьетнама разработали мягкий манипулятор ROSE, способный бережно захватывать хрупкие предметы, не повреждая их. Он состоит из мягкой воронкообразной оболочки, напоминающей цветок розы, которая способна скручиваться, равномерно обхватывая предмет, оказавшийся внутри. Благодаря своей универсальности и прочности манипулятор может пригодиться в сельском хозяйстве для сбора урожая. Доклад с описанием конструкции был представлен на конференции Robotics: Science and Systems, 2023. При поддержке Angie — первого российского веб-сервера Чтобы робот мог безопасно взаимодействовать с хрупкими объектами, его обычно оснащают манипуляторами, в конструкции которых присутствуют мягкие материалы. Нередко их устройство в той или иной степени имитирует анатомию человеческой руки. Например, пальцы трехпалого захвата EndoFlex с внутренней стороны покрыты мягким силиконом. Однако для управления манипуляторами такого типа обычно требуются несколько актуаторов и сложные алгоритмы позиционирования, которые позволяют подстраивать пространственное положение пальцев и руки в соответствии формой и положением захватываемого предмета. Кроме это, сила прикладывается к объекту неравномерно и только в точках соприкосновения с пальцами, поэтому ее может оказаться недостаточно для удержания. Манипулятор, разработанный инженерами под руководством Ван Ан Хо (Van Anh Ho) из Японского национального института передовых промышленных наук и технологи, имеет более простую конструкцию и для полноценной работы достаточно только одного актуатора. Принцип его работы напоминает раскрытие цветка розы, поэтому разработчики дали ему название ROSE. Рабочая часть манипулятора представляет собой прочную оболочку из силиконовой резины (первые повреждения на изогнутом краю появились только после 400 тысяч циклов срабатывания), которая образует двустенный стакан. Внешняя часть оболочки прикреплена нижней частью к круглому пластиковому основанию с отверстием в центре, а внутренняя воронкообразная поверхность к вращающемуся цилиндру, вставленному в центральное отверстие основания. При вращении внутренней оболочки относительно внешней происходит сжатие манипулятора. Если при этом во внутренней полости оказывается предмет, то он равномерно обхватывается с боков. Усилие и площадь обхвата можно регулировать с помощью угла закручивания оболочек относительно друг друга, а также нагнетанием давления воздуха в пространство между стенками стакана. Для изучения характеристик манипулятора его присоединили к роборуке UR5. Испытания показали, что захват может выдержать максимальную нагрузку около 328 Ньютон при собственной массе захвата 49 грамм, что дает значение соотношения грузоподъемности к весу примерно 6800 процентов от массы захвата вместе с ротором. Манипулятор может бережно и безопасно обхватывать хрупкие предметы различной формы и размеров не нанося им повреждений. В экспериментах использовались стальные шары, фрукты, клейкая лента, банка с кофе и куриное яйцо, которое захват легко вытащил из миски с оливковым маслом, что довольно трудно осуществить, так как из-за масла яйцо становится скользким. Кроме этого, ROSE может захватывать и сыпучие материалы, например, гравий и гальку. https://www.youtube.com/watch?v=E1wAI09LaoY Инженеры придумали способ, с помощью которого манипулятору можно добавить способность «чувствовать» захватываемый предмет. Для этого они разместили множество небольших меток с внутренней стороны оболочки. Их положение контролируется с помощью компьютерного зрения через три небольшие камеры, закрепленные на пластиковом основании манипулятора. По мнению разработчиков, ROSE мог бы пригодиться в сельском хозяйстве для сбора урожая и не только. В будущем они планируют продолжить работу над математической моделью деформации оболочки при скручивании. Иной тип мягкого манипулятора продемонстрировали инженеры из Австралии. Он способен ухватывать предметы, обвиваясь вокруг них как щупальце осьминога.