Русский
!Просим всех участников МКО-2026 пройти опрос

Presentations

Compact text representation of 3D objects

Nikolsky I.M, Saybel T.A.

Московский государственный университет им. М.В. Ломоносова, факультет ВМК

В работе предложено новое компактное текстовое представление сканированных трёхмерных объектов, хранимых в виде облака точек – совокупности точек трёхмерного пространства, снятых с поверхности сканируемого объекта. В настоящее время лазерные сканеры способны за короткое время генерировать миллионы точек, что затрудняет хранение сканов и работу с ними. В связи с этим актуальной задачей является разработка компактных форматов хранения облаков точек.

Предлагаемое текстовое представление трёхмерных объектов строится на основе топологических графов геометрических примитивов, составляющих объект. Отметим, что в некоторых теориях зрения считается, что человек распознаёт объекты окружающего мира, бессознательно декомпозируя их на простые формы. Такие идеи высказывали, например, Д. Марр [1] и И. Бидерман [2].

В нашей работе примитивы извлекаются из облака точек с помощью метода RANSAC. Далее формируется топологический граф, отображающий взаимное расположение примитивов в объекте. Каждая вершина графа помечается символом, соответствующим примитиву. Ребро соединяет вершины, если соответствующие примитивы имеют не менее определённого числа общих точек.

Представление объекта в виде графа примитивов занимает намного меньше памяти, чем исходное облако точек. Кроме того, оно инвариантно относительно поворота и масштабирования, поскольку представляет собой описание набора примитивных форм, составляющих объект и топологических отношений между ними . Данный граф можно конвертировать в строк символов путём обхода в глубину. Представление объекта в виде строки символов является ещё более компактным и позволяет использовать редакторское расстояние Левенштейна при сравнении объектов по их текстовым представлениям.

Эффективность использования описанного текстового представления исследовалась на коллекции ShapeNetSem [3]. Путём конвертации изображений данной коллекции в текстовое представление удалось уменьшить их суммарный объём с 58 Гб до 1,8 Мб. Точность (доля верно распознанных объектов) при распознавании объектов на основании сравнения текстовых представлений составила 70%.

Литература.

1. Марр Д. Зрение: информационный подход к изучению представления и обработки зрительных образов. – М.: Радио и связь, 1987. – 400 с.

2. Biederman I. Recognition-by-components: a theory of human image understanding // Psychol Rev., Vol. 2, No. 94, 1987. – Pp. 115-147.

3. Chang A. X., Funkhouser T. et al. ShapeNet: An Information-Rich 3D Model Repository // arXiv Preprint, 2015. – URL: https://arxiv.org/abs/1512.03012.

© 2004 Designed by Lyceum of Informational Technologies №1533