Ученые Пермского Политеха улучшили обнаружение объектов нейронными сетями
06.03.2023
Пожалуй, самая популярная и перспективная задача нейросетей – технологии распознавания образов. Они либо по отдельности, либо в интегрированном виде используются в таких сферах, как безопасность и наблюдение, сканирование и создание изображений, маркетинг и реклама, дополненная реальность и поиск изображений. Обучение - очень важная часть создания данной технологии. Слишком маленькое или наоборот большое количество данных в нейросети приводит к некорректной работе. Порой даже оптимальный размер данных может привести к плохим результатам, если объекты, по которым обучалась программа, будут захвачены с одного ракурса или находятся на одном фоне. Сегодня специалистам приходится определять границы изучаемых объектов вручную в специальных программах. Этот процесс очень длительный и трудоемкий. Ученые Пермского Политеха создали программу с генератором случайных синтетических изображений, которая позволит обучать нейросеть быстрее. Разработка является уникальным способом улучшения качества обнаружения необходимых объектов, что позволяет обеспечить технологический суверенитет России.
Исследование опубликовано в сборнике «International Conference on Applied Innovations in IT (ICAIIT)».
Чтобы облегчить работу айти-специалистам, которые обычно вручную создают фотографии для обучения нейросети, политехники разработали программу, которая генерирует синтетические картинки, комбинируя между собой изображения реального объекта с использованием 3D-камеры, натуралистичный фон и некоторые шумовые эффекты - помехи или предметы окружающей среды. Например, для создания набора картинок с уличным фонарем программа дополнительно использовала ветви деревьев, которые частично закрывают светильник, а также дождь, слабую освещенность, дефекты камеры. Эти шумовые эффекты делают результирующее изображение более реалистичным. Качество обучения зависит от того, насколько равномерно перемешиваются данные и насколько разнообразные картинки получаются.
— Тестируя программу, мы постарались провести как можно больше экспериментов, чтобы получить максимально широкий обзор влияния синтетических данных на производительность нейронной сети. В испытании использовались наборы данных по 1000 и 2000 искусственных картинок. После чего мы заметили, что такое обучение дает низкое качество распознавания. По этой причине мы решили обучать нейросеть, смешивая синтетические данные с настоящими фотографиям, — сообщил доцент кафедры микропроцессорных средств автоматизации Леонид Мыльников.
— Наборы изображений по тематике на основе синтетических данных с небольшим количеством реальных фотографий улучшило качество обнаружения объекта нейросетью. Это решает проблему создания больших баз данных, необходимых для обучения сетей и значительно упрощает работу специалистов из ИТ сферы. Технология может применима и к движущимся изображениям, — рассказал аспирант кафедры «Информационные технологии и автоматизированные системы» Павел Сливницин.
В настоящее время политехники занимаются получением еще более реалистичных изображений, например, содержащих такие элементы, как эффекты коррозии и деформации изучаемого нейросетью объекта. Это будет способствовать дальнейшему улучшению качества обнаружения.
Исследование опубликовано в сборнике «International Conference on Applied Innovations in IT (ICAIIT)».
Чтобы облегчить работу айти-специалистам, которые обычно вручную создают фотографии для обучения нейросети, политехники разработали программу, которая генерирует синтетические картинки, комбинируя между собой изображения реального объекта с использованием 3D-камеры, натуралистичный фон и некоторые шумовые эффекты - помехи или предметы окружающей среды. Например, для создания набора картинок с уличным фонарем программа дополнительно использовала ветви деревьев, которые частично закрывают светильник, а также дождь, слабую освещенность, дефекты камеры. Эти шумовые эффекты делают результирующее изображение более реалистичным. Качество обучения зависит от того, насколько равномерно перемешиваются данные и насколько разнообразные картинки получаются.
— Тестируя программу, мы постарались провести как можно больше экспериментов, чтобы получить максимально широкий обзор влияния синтетических данных на производительность нейронной сети. В испытании использовались наборы данных по 1000 и 2000 искусственных картинок. После чего мы заметили, что такое обучение дает низкое качество распознавания. По этой причине мы решили обучать нейросеть, смешивая синтетические данные с настоящими фотографиям, — сообщил доцент кафедры микропроцессорных средств автоматизации Леонид Мыльников.
— Наборы изображений по тематике на основе синтетических данных с небольшим количеством реальных фотографий улучшило качество обнаружения объекта нейросетью. Это решает проблему создания больших баз данных, необходимых для обучения сетей и значительно упрощает работу специалистов из ИТ сферы. Технология может применима и к движущимся изображениям, — рассказал аспирант кафедры «Информационные технологии и автоматизированные системы» Павел Сливницин.
В настоящее время политехники занимаются получением еще более реалистичных изображений, например, содержащих такие элементы, как эффекты коррозии и деформации изучаемого нейросетью объекта. Это будет способствовать дальнейшему улучшению качества обнаружения.
Марина Осипова © Вечерние ведомости
Читать этот материал в источнике
Читать этот материал в источнике
В Каменске-Уральском открылся центр поддержки малого и среднего бизнеса
Пятница, 29 ноября, 14.22
Учёные УрФУ разработали технологию производства огнеупорного цемента
Пятница, 29 ноября, 13.17
Пруд в екатеринбургском парке 50-летия ВЛКСМ могут включить в государственный водный реестр
Пятница, 29 ноября, 12.34