Conference publications

Abstracts

XXIII conference

Invariant transfer method in application to image recognition

Nikulin V.N., Bagaev I.V., Kanishchev I.S.

Vyatka State University, Department of mathematical methods in economy, 610000, Kirov, Russia

1 pp. (accepted)

В компьютерной памяти фотография представима в виде цифровой матрицы. Рассмотрим пример из области морской биологии: проводится аэрофотосъёмка морской поверхности, на которой киты выступают в качестве объектов наблюдения. Имеется тренировочная база данных, включающая несколько тысяч фотоснимков, которые классифицированы относительно 447 образцов или классов. Задача состоит в построении модели для классификации независимой выборки из нескольких тысяч фотоснимков.

Основываясь на наших экспериментах, представляется логичным предположить, что фону (морской поверхности) соответствуют меньшие значения цифровой матрицы в сравнении с объектами (китами). Для нахождения центра объекта мы можем вычислить векторы средних (или стандартных отклонений) по горизонтали и вертикали. Затем найти точки максимумов, которые и выступают в роли координат центра интересующего нас объекта.

Отметим, что количество элементов цифровой матрицы превышает несколько миллионов. Эта информация должна быть сжата с тем, чтобы ускорить работу классификатора. Для этой цели мы можем применить несколько подходов: 1) статистический, 2) метод главных компонент и 3) метод, основанный на быстрых преобразованиях Фурье. Все эти методы используют в качестве входной информации прямоугольники сравнительно малой размерности как части основной цифровой матрицы. Предполагается, что центры прямоугольников близки к центрам основных объектов.

В случае статистического подхода мы вычисляем для каждого прямоугольника базовые статистические характеристики: 1) минимум, 2) максимум, 3) среднее, 4) медиана и 5) стандартное отклонение.

Следует отметить, что данная задача не является сбалансированной: количество наблюдений, соответствующих различным классам, ранжируется от 1 до 47. Для того, чтобы преодолеть эту проблему предлагается использовать метод инвариантного переноса. Суть этого метода состоит в следующем. Мы предполагаем, что разницы статистических характеристик (внутри конкретного класса) отражают такие явления как: 1) угол фотосъёмки, 2) расстояние до объекта, 3) движение объекта и 4) колебания морской поверхности. По этим причинам разницы статистических характеристик инвариантны в абсолютном понимании и могут быть использованы для генерации дополнительных наблюдений с тем, чтобы сделать тренировочную выборку сбалансированной.

В нашей работе мы использовали данные с платформы Kaggle.

view as PDF (in Russian) (PDF)