Методы и алгоритмы автоматической интеллектуальной обработки больших массивов слабоструктурированных данных для защиты сетей 5G
Проект № МК-258.2022.1.6
Руководитель — Парфенов Д.И.
Проект направлен на решение фундаментальной научной проблемы разработки новых инструментов обеспечения безопасности сервисов развернутых на базе сетей 5G.
Целью исследования является разработка моделей и эффективных алгоритмов, направленных на всестороннее решение проблем безопасной сервисов использующих сети 5G, с учетом проводимых состязательных атак на модели машинного обучения. В основе предлагаемого подхода лежит возможность динамического анализа входных данных и проведения перекрестной проверки моделей машинного обучения для выявления аномалий и идентификации типов состязательных атак, таких как искажение разметки и обучающей выборки, утечка данных через обученные модели, а также атаки на предобученные и аутсорсинговые ML-модели.
На первом этапе выполнения НИР в 2022 году решен ряд вопросов, затрагивающих разработку комплекса программно-алгоритмических решений и состоящий из: структурной модели системы АutoML эффективного размещения исходных и промежуточных данных и описания взаимосвязей модулей анализа состязательных атак на модели машинного обучения, алгоритма анализа входных данных и проведения перекрестной проверки различных видов моделей машинного обучения для выявления аномалий и алгоритма классификации типов состязательных атак на модели машинного обучения, таких как искажение разметки и обучающей выборки, утечки данных через обученные модели, а также атаки на предобученные и аутсорсинговые ML-модели в задаче анализа инцидентов кибербезопасности сети 5G.
Построенная модель, основанная на автоматическом машинном обучении, позволит усовершенствовать существующие способы создания приложений для анализа данных в сфере кибербезопасности и, в частности, для обнаружения атак. Эффективность моделей машинного обучения оценивается не только по качеству, но и по времени работы (вычислительной трудоемкости). Разработанные модели машинного обучения экспериментально исследованы в сочетании с различными наборами признаков анализируемых потоков данных, а также с учетом оптимизации их гиперпараметров.
Кроме того, проведено исследование эффективности применения технологии трансферного обучения для повышения устойчивости сверточных нейронных сетей от состязательных атак. В ходе эксперимента построена базовая модель нейронной сети для решения задачи классификации и реализованы атаки на основе алгоритмов PGD и FGSM, которые снизили точность классификации примерно в 2,8 раза. Для защиты от рассмотренных моделей атак на нейронную сеть проведено состязательное обучение на сгенерированных изображениях с помощью алгоритма PGD, который оказывал наибольшее влияние на точность классификации. Точность модели после состязательного обучения повысилась на 12,11%. Для повышения устойчивости нейронной сети также рассмотрена технология трансферного обучения. Модель CNN, прошедшая состязательное обучение на наборе данных GTSRB, использована при решении схожей задачи классификации на схожем наборе данных RTSD. Трансферное обучение позволило добиться повышения надежности после состязательного обучения на 42,38% по сравнению с исходным набором данных.
В результате реализации НИР опубликованы 5 работы, включая 3 статьи в изданиях, индексируемых в Scopus и Web of Science, 2 статьи в сборниках международных и всероссийских научных конференций, индексируемых в РИНЦ, а также получено 1 свидетельство о регистрации программы для ЭВМ в ФИПС.
Посмотреть отчет за 2023 год
Последнее обновление: 26.12.2023
Ответственный за информацию:
Болдырев Петр Алексеевич, управление научной и инновационной деятельности, начальник управления
(тел.91-21-38)