Русский
!Просим всех участников МКО-2026 пройти опрос

Presentations

Исследование прозрачности моделей фреймворка fedot на примере задачи прогнозирования выживаемости раковых клеток

Ким Т.В., Трофимов Ю.В.1, Аверкин А.Н.2

Государственный университет «Дубна»; Россия, 141980, г. Дубна; email: ktv.25@uni-dubna.ru

1Государственный университет «Дубна»; ЛИТ им. Г. М. Мещерякова ОИЯИ; Россия, 141980, г. Дубна; email: ura_trofim@bk.ru

2Государственный университет «Дубна»; Россия, 141980, г. Дубна; email: averkin2003@inbox.ru

Интерпретируемость результатов ML-моделей в биомедицинских исследованиях является немаловажным фактором. Проблемой AutoML-систем является то, что они действуют как черные ящики. В данной работе исследуется уровень прозрачности моделей, генерируемых фреймворком FEDOT.

Для построения прогностической модели мы используем технологию AutoML фреймворка FEDOT, реализующий подход построения композитных моделей [1].

FEDOT обеспечивает структурную прозрачность модели, предоставляя итоговое решение в виде направленного ациклического графа. Это позволяет отследить архитектуру пайплайна и параметры каждого узла. В ходе экспериментов FEDOT показал высокую точность (MAE: 0.007, RMSE: 0.01), превзойдя результаты AutoML H2O (MAE: 0.0443, RMSE: 0.086) и ручных реализаций (MAE: 0.0901, RMSE: 0.12) при параметрах: AutoML H2O (GBM): ntrees=50, max_depth=12, learn_rate=0.1, col_sample=0.7, nfolds=5; ручной (GBR): n_est=500, lr=0.05, depth=4, patience=20; FEDOT (LGBMR): boosting=gbdt, bagging_frac=0.85, depth=unlimited, early_stopping=30.

Прозрачности FEDOT недостаточно: сложные ансамбли скрывают вклад признаков и делают модель семантически непрозрачной. Предложен гибридный подход с дополнительной интерпретацией через SHAP. [2]. Это позволит оценить глобальную важность факторов и объяснить решения.

Таким образом, структурной прозрачности FEDOT недостаточно для полной интерпретации прогнозов, FEDOT следует дополнять методами объяснимого ИИ.

Работа выполнена в рамках государственного задания Министерства науки и высшего образования Российской Федерации (тема № 124112200072-2).

Литература.

1. Мельникова М.А., Таксанц М.В., Голованова И.В., Мельников Д.М. Применение математического моделирования в аддитивных технологиях для топологической оптимизации // Наукоёмкие технологии в машиностроении 2025, 4, 2025. Стр. 8-16.

2. Ким Т. В, Булякова И. А., Трофимов Ю. В., Аверкин А. Н. Генерация синтетических данных для обучения модели предсказания степени выживаемости раковых клеток с последующим XAI-анализом // Мягкие измерения и вычисления 8, 93, 2025. Стр 28-48.

© 2004 Designed by Lyceum of Informational Technologies №1533