English
!

Доклады

Визуализация результатов исследований методом главных компонент

Заречнев В.А.

zarechnev_v@mail.ru 8-953-693-89-66

В литературе к методу главных компонент, обращаются, как правило, для получения интегральных показателей на основе только первой главной компоненты. А именно, построение на основе данных вначале матрицы унифицированных данных, далее стандартизованной матрицы, получение на ее основе матрицы парных коэффициентов корреляции и спектра этой матрицы. Затем, если первое собственное значение преобладает (более 55% по сравнению с суммой всех вместе взятых), то, перемножив матрицу унифицированных данных на первый собственный вектор-столбец, получали интегрированные показатели. Предметом нашего исследования было наглядное представление показателей 82 регионов России в 2021 году [1] в графическом виде на основе двух первых главных компонент. Спектр матрицы парных коэффициентов корреляции позволяет получить координаты наблюдений в системе координат, более удобной для интерпретации. Первые два собственных значения в сумме составляли, как правило, более 90% от общей суммы. Точечные графические построения и в Statistica и в Excel предусматривают использование только той информации, которая содержится в двух столбцах, на основе которых и выполняется построение. Но нам была необходима возможность наряду с двумя столбцами, на основе которых строится график использовать третий столбец с детальным описанием наблюдений, которые бы мы хотели видеть на графике. Всему этому удовлетворяла программа построения двумерных графиков [4]. В данной программе интервал, на основе которого строится двумерный график, включает в себя и третий столбец, содержащий подписи под точками, координаты которых брались из первых двух столбцов. Естественно подписи в данном случае возможно делать только под интересующими нас точками. Также можно делать фрагменты графиков в задаваемых границах. Ну, а при использовании программ нахождения спектра матриц методом Якоби [2;3] или QR-разложения матриц [4] необходимость в использовании программы Statistica для нашего исследования вообще отпадает.

Литература

1. https://rosstat.gov.ru/storage/mediabank/Region_Pokaz_2021.pdf

2. Заречнев В.А. Статистическое моделирование. Методы, алгоритмы, реализация. Учеб. пособие. – Киров, “Авангард”, 2004. – 159 с.

3. Заречнев В.А. Прогнозирование на компьютере. Методы, алгоритмы, реализация. Учеб. пособие. – Киров, “Старая Вятка”, 2004. – 134 с.

4. Заречнев В.А. Многомерный статистический анализ. Избранные главы. - Киров, ВятГУ, 2012. Электронный ресурс.

Материалы доклада

© 2004 Дизайн Лицея Информационных технологий №1533