Исследователи Google Research обучают нейронные модели для повышения производительности роботов, следующих инструкциям людей. Такие модели генерируют направления движения и улучшают навигационные характеристики роботов в смоделированных и реальных средах.
Роботы, понимающие человеческую речь, используются в разных условиях. Но, как выяснили в Google Research, существующие AI-модели работают лишь ненамного лучше, чем шаблонные команды. Бенчмарки естественного языка, включая BLEU, ROUGE, METEOR и CIDEr, неэффективны для оценки качества навигационных инструкций, генерируемых AI.
Для решения этой проблемы в Google Research разработали модель «совместимости команд и траекторий» (instruction-trajectory compatibility). Решение превосходит существующие метрики автоматической оценки без использования справочных инструкций. Технологию можно использовать в настройке обучения с подкреплением или для поиска высококачественных инструкций по навигации с фильтрацией.