Русский
!

Presentations

"Flora of Russia" on iNaturalist: data technologies in field botany

Seregin A.P.

Lomonosov Moscow State University, Faculty of Biology, Department of Ecology and Plant Geography, Herbarium, Leninskie Gory, 1, 119991, Moscow

Стремительный рост данных о биоразнообразии – новая реальность, с которой мы столкнулись в последние годы. Четверть данных об отдельных местонахождениях живых организмов была собрана за последние три года, а половина – за семь лет. На этой основе стала складываться новая научная дисциплина «информатика биоразнообразия». Основа этого лавинообразного роста – доступность и рост производительности электронных устройств (особенно смартфонов) и высокоскоростной интернет. Это явление получило массовое распространение и стало неожиданным драйвером существовавшего и прежде научного волонтёрства (citizen science).

Научная проблема, которой занимается наша группа, – сбор и анализ больших данных о разнообразии сосудистых растений России. Ранее мы организовали на международной платформе iNaturalist проект «Флора России» (https://www.inaturalist.org/projects/flora-of-russia) для сбора данных о разнообразии сосудистых растений страны в форме привязанных к карте фотографий, определенных и верифицированных экспертами. Проект стартовал 9 января 2019 г., а спустя 22 месяца при участии 10,8 тыс. волонтёров-наблюдателей и 4 тыс. экспертов мы собрали 848 тыс. фотонаблюдений о 7 тыс. видах. Сейчас iNaturalist обеспечивает четверть электронных данных по флоре России.

Сейчас мы создали самый большой массив данных о биоразнообразии России, это единственный источник данных о современном состоянии разнообразия флоры страны. Полученный массив – совершенно новое явление, фундаментальные характеристики которого нам ясны лишь в общих чертах. Растущее сообщество участников проекта в сентябре 2020 г. преодолело отметку в 10 тыс. участников, и сейчас это самый масштабный проект в области научного волонтёрства в России. При реализации проекта происходит внедрение в классическую науку новейших технологий (методы сбора, машинное обучение, анализ больших данных). Методы проекта хорошо применимы для сосудистых растений, как доступного объекта наблюдений. Важно и то, что при привлечении волонтёров происходит перераспределение затрат, в т.ч. за счёт трудового вклада сообщества. Рост данных проекта приводит к бутылочному горлышку экспертизы, также имеется проблема неравномерности данных. Диспропорции в данных проекта самые разные – пространственные, таксономические, сезонные, временные, социально-экономические. Диспропорциональность выборки требует разработки методов и технологий выравнивания данных, их калибровки и дальнейшего регулярного пересмотра моделей. Темпы накопления данных показывают, что анализ, который будет проводиться через год, будет основан на сведениях, которые пока не собраны. Мы впервые получаем возможность оценить современные изменения во флоре страны. Проект дает уникальную возможность прямого общения натуралистов со всей страны с экспертами из ведущих научных центров.

© 2004 Designed by Lyceum of Informational Technologies №1533