Компания Smart Engines получила американский патент на фирменную разработку. С ее помощью ИИ может восстанавливать параметры трехмерного пространства по двумерному снимку. Ученые предложили использовать преобразования Хафа в качестве слоев нейронной сети, благодаря чему нейросети — при снижении числа обучающих параметров в 100 раз — значительно лучше справляются с базовыми задачами компьютерного зрения. В частности, теперь ИИ может легко обнаруживать частично заслоненные объекты и достраивать их форму. Это шестой патент США, который получили ученые Smart Engines за год.
Новая технология может применяться для решения широкого класса задач — начиная от систем распознавания документов и заканчивая беспилотными транспортными системами.
Запатентованная учеными Smart Engines нейросетевая архитектура объединяет блоки, используемые в нейросетях, с классическим инструментом анализа изображений реального мира — преобразованием Хафа. Эти два механизма дополняют друг друга. Хаф-анализ часто используется для поиска и выделения прямых, таких как строки текста или границы объектов — дорог, домов, документов. А сверточные слои нейросети в свою очередь помогают решить задачу классификации обнаруженных отрезков.
«Механизм работы выглядит так. Первый блок сверточных слоев нейросети строит локальные признаки точек изображения. Затем преобразование Хафа интегрирует значения локальных признаков вдоль прямых, в результате чего появляется возможность посчитать сложные нелинейные статистики — например, дисперсию. Сверточные слои после преобразования Хафа работают с этими статистиками вдоль прямых. Следующий этап — транспонирование, после чего происходит переход карт признаков в исходные координаты. На последнем этапе полученный результат обрабатывается еще одним блоком сверхточных слоев, в результате чего мы получаем изображение в исходных координатах, но в каждой его точке накоплена информация со всего изображения, — прокомментировал руководитель отдела машинного обучения Smart Engines, Александр Шешкус.
Хафовские нейросети могут гораздо лучше справляться с задачей поиска точек схода, определения форм и выделения контуров объектов, а также лучше детектируют протяженные или частично заслоненные объекты.
Важным аспектом данного изобретения является то, что полученные нейросетевые архитектуры более устойчивы к широкому спектру атак на ИИ. Так, даже замещение части изображения не станет препятствием для обнаружения объекта. Например, если на изображении с дорогой точка схода случайно или намеренно заслонена каким-то объектом — Хафовская нейронная сеть все равно ее найдет.