В России изобрели устройство, распознающее речь в шумном аэропорту

В российской компании «Промобот» создали спецверсию микрофонного массива — устройства, с помощью которого роботы распознают речь человека в шумных местах — аэропорту, МФЦ или торговом центре. В массив входит комплекс из восьми микрофонов и программный алгоритм. На рынке робототехники ему нет аналогов.

Разработка и тестирование длились с января. В отличие от других систем, распознавание речи Promobot практически не зависит от расстояния: за год эффективность распознавания на расстоянии одного метра от робота выросла в три раза (с 25% до 75%). Это самый высокий показатель в мире для сервисных роботов.

Микрофонный массив состоит сразу из восьми микрофонов — с их помощью робот детектирует шум на расстоянии до двух метров от него. Алгоритм обеспечивает захват аналоговых данных с микрофонов, их преобразование, эхоподавление и передачу данных. Программа «отделяет» человеческую речь от шума, затем — распознаёт фразы, благодаря чему робот вступает в диалог. В отличие от голосовых ассистентов, которые реагируют лишь на чёткую речь человека, Promobot реагирует на весь шум — и уже «внутри него» ищет человеческий голос, причём как детский, так и взрослый.

Устройство запатентовано осенью 2020 года. Микрофонным массивом заинтересовались китайские производители роботов — российская компания планирует начать продажу устройства уже в январе 2021 года.