Разработчики из MIT, Nvidia и ETH Zurich разработали сложный комплекс задач Watch-And-Help (WAH). В WAH агенты искусственного интеллекта (AI) должны воспринимать цели, перенимая действия человека и координируя их с ним для быстрого решения задач.
Разработка ученых опирается на теорию воплощенного познания. Исследователи надеются улучшить производительность AI-систем: чат-ботов, роботов, беспилотных транспортных средств и даже умных колонок. Обученный на подобной основе робот сможет проверить, заперта ли дверь, принести зазвонивший смартфон и т.д.
На первом этапе WAH, наблюдении, AI-агент наблюдает за имитирующим человека агентом, который выполняет задачу, а затем синтезирует цель из его действий. На втором этапе, помощи, AI-агент помогает “человеку” достичь аналогичной цели в совершенно другой среде. Двухэтапная структура создает уникальные проблемы для сотрудничества человека и AI, рассказали разработчики. У AI-агента возникаем необходимость рассуждать о намерениях человекоподобного агента и обобщать свои знания о цели.
Разработчики расширили платформу с открытым исходным кодом VirtualHome и создали многоагентную среду VirtualHome-Social. Система имитирует домашние настройки, поэтому агенты могут взаимодействовать с различными объектами: например, открывать контейнеры или брать посуду из ящика, видеть аватары реальных людей и взаимодействовать с ними.
Специалисты разработали протокол оценки и предоставили контрольные показатели для WAH.
Исследования поспособствуют дальнейшим исследованиям по созданию более совершенного машинно-социального интеллекта, уверены ученые.