Разработка комплексной системы оценки устойчивости моделей машинного обучения по отношению к состязательным атакам
Проект № 22-71-10124
Руководитель — Парфёнов Д.И.
Проект направлен на решение научной проблемы обработки больших массивов данных сервисов и приложений в сетях последнего поколения для обнаружения инцидентов кибербезопасности и построения устойчивых систем защиты на основе состязательного машинного обучения.
На первом этапе выполнения НИР в 2022 году решен ряд задач, затрагивающих разработку моделей, методов, алгоритмов и программных прототипов для анализа и защиты систем ИИ от состязательных атак.
Предлагаемые подходы предложены по результатам всестороннего обзора текущего состояния исследований в данной области, не требуют априорных знаний о типах проведенных атак и расположены на стыке глубокого обучения и граничных вычислений.
В рамках исследования предложена методика аналитической обработки больших массивов данных сервисов и приложений в сетях последнего поколения для построения устойчивых систем защиты на основе состязательного машинного обучения. Проведена генерация и исследовательский анализ наборов данных с помощью эмулятора DeepMIMO. Полученные наборы данных будут использованы на следующих этапах для исследования и построения состязательных примеров и проведения состязательных атак в беспроводных сетях поколения 6G.
В рамках решения задачи по разработке моделей, методов, алгоритмов и программных прототипов генерации отравляющих атак и атак на уклонение на интеллектуальные системы/сервисы/приложения на основе графовых нейронных сетей посредством машинного обучения с подкреплением предложен подход, основанный на применении генеративно-состязательных сетей для генерации синтетических состязательных образцов данных путем замены истинных значений целевого признака. В рамках исследования проанализирована зависимость точности моделей от архитектуры генератора G на входном слое при подаче случайного вектора шума. Установлено, что увеличение размерности вектора случайного шума rand_dim с 8 до 128 показало, что для моделей машинного обучения SVC, RF изменение сбалансированной точности не превышает 1,5 %, а для моделей LR и XGBoost может изменяться в пределах 4 %.
В рамках данного исследования выполнен анализ данных в миллиметровых волнах (mmWave) и массивных системах MIMO, сгенерированный на платформе DeepMIMO на основе сценария трассировки лучей на открытом пространстве. Сгенерированный набор данных для построения модели машинного обучения использован с целью предсказания, находится ли объект в зоне линии прямой видимости базовой станции. Кроме того, в рамках данной работы предложен подход к применению генеративно-состязательных сетей для генерации синтетических состязательных образцов путем замены истинных значений целевого признака. Исследование сбалансированной точности обученных базовых классификаторов от нецелевой состязательной атаки при решении задачи бинарной классификации показало, что модели машинного обучения неустойчивы к данному типу атаки.
В результате реализации НИР опубликовано 4 печатные работы, включая 2 статьи в изданиях, индексируемых в Scopus и WoS, а также 2 статьи в рецензируемом журнале, входящем в перечень ВАК.
Посмотреть отчет за 2023 год
Последнее обновление: 15.05.2024
Ответственный за информацию:
Болдырев Петр Алексеевич, управление научной и инновационной деятельности, начальник управления
(тел.91-21-38)