Conference publications

Abstracts

XV conference

New view on creation on dynamic decision support systems

Komartsova L.G.

Kaluga 248003, Boldin street, 5, 7

1 pp.

Во многих реальных системах, связанных с интеллектуальной обработкой информации, необходимо обеспечивать эту обработку в режиме on- line. Основные проблемы, которые необходимо решать в этом случае, связаны с выбором соответ-ствующего метода кластеризации. Наиболее известным методом кластеризации является k-means, который находит k различных групп данных (кластеров) и их кластерных центров как среднее векторов данных, находящихся внутри кластеров. Эта процедура минимизирует расстояние каждого вектора до его ближайшего кла-стерного центра. Обычно это достигается путем значительного числа итераций.

On-line версия k-means алгоритма основывается на априорном знании о распределении входных данных. Для каждого нового вектора обновляется только ближайший кластерный центр. Это правило известно как «локальный» k-means (или победитель забирает все), который может работать с данными, поступающи-ми в интеллектуальную систему непрерывно.

Другие известные методы кластеризации DSA (Dynamic Clustering Algorithm, FCMC ( Fuzzy C-means Clustering хотя и являются эффективными ме-тодами, работают в режиме off –line и требуют, как и алгоритм k-means, заранее определенного числа кластеров.

Менее известным является эволюционный кластерный метод (Evolving Clas-tering Method -ECM), который обеспечивает кластеризацию на протяжении всего жизненного цикла системы при непрерывном поступлении входных данных. Он предназначен для on-line кластеризации. Разработан комбинированный алгоритм, который включает специальную методику для уточнения кластерных центров при обучении в режиме off-line, что позволяет проводить смешанное обучение при функционировании ИС.

Основное достоинство алгоритма заключается в том, что, в отличие от дру-гих методов кластеризации, число кластеров заранее не определяется и может ме-няться в режиме on- line по мере поступления входных данных. Ограничение за-ключается в том, что для каждого кластера ищется максимальное расстояние меж-ду примером и ближайшим кластерным центром, и это расстояние не может быть больше заданной величины Dist. Однако в процессе эволюции (в режиме on-line) эта величина может меняться в зависимости от текущей ошибки кластеризации.

Проведенные эксперименты показали высокую эффективность нейросетевого классификатора на основе комбинированного алгоритма: этот классификатор бы-стрее обучается по сравнению другими алгоритмами и дает меньший процент ошибок классификации.

view as PDF