|
Реализация комплексных исследований в области цифровых интеллектуальных технологий для распределенной обработки больших данных
Проект № НШ-2502.2020.9
Руководитель — Болодурина И.П.
На втором этапе выполнения НИР в 2021 году решен ряд вопросов, затрагивающих разработку и исследование алгоритмов анализа данных, построения признакового пространства, подбора наиболее эффективных моделей обработки данных, а также апробацию платформы автоматизации распределенных вычислений для образования, медицины и сельского хозяйства.
Во второй год выполнения проекта решены следующие задачи:
-
Создание экспертной системы по определению решаемой задачи машинного обучения на основе образцов анализируемых данных и ответов пользователя на поставленные вопросы, по построения и отбору признаков, подбору наиболее эффективных моделей, их адаптации, обучению, гиперпараметрической оптимизации, сравнению и оценке:
а) разработка модели представления знаний экспертной системы;
б) создание алгоритма логического вывода в рамках экспертной системы;
в) разработка алгоритма формирования пояснений в рамках экспертной системы;
г) создание алгоритма анализа данных пользователя, их предобработки, построения и выбора метрики качества, признаков для решаемой задачи;
д) разработка алгоритма выбора и обучения алгоритмов машинного обучения, их тренировки, настройки гиперпараметров, контроля недообучения/переобучения и отбора наилучших вариантов для последующего использования;
е) создание алгоритма интерпретации работы алгоритмов машинного обучения;
ж) создание алгоритма генерации кода и оформления достигнутых целей экспертной системы в виде облачного сервиса с REST API;
и) наполнение базы знаний экспертной системы;
- Разработка моделей и методик выявления угроз и выбора эффективных средств защиты для настройки их конфигурации и сбора потока событий и инцидентов безопасности с целью минимизации рисков и ущерба от возможных кибератак на вычислительную инфраструктуру платформы для обработки больших данных;
- Апробация прототипа платформы автоматизации распределенных вычислений для обработки больших данных на различных прикладных задачах по распознаванию образов, классификации и кластеризации больших наборов данных для медицины, образования, сельского хозяйства;
- Апробация экспертной системы на различных задачах машинного обучения с использованием различных форм данных, включая таблицы числовых и категориальных признаков, связанные таблицы данных, текстовые данные, картинки.
Также в рамках выполнения гранта защищена диссертационная работа М.В. Ушаковой на соискание ученой степени кандидата технических наук.
В результате реализации НИР опубликовано 46 работ, включая 25 статей в изданиях, индексируемых в Scopus, 8 статей в рецензируемых журналах, входящих в перечень ВАК, 9 статей в сборниках международных и всероссийских научных конференций, индексируемых в РИНЦ, а также получено 4 свидетельства о регистрации программы для ЭВМ в ФИПС.
Посмотреть отчет за 2020 год
Последнее обновление: 06.10.2021 Ответственный за информацию: Болдырев Петр Алексеевич, управление научной и инновационной деятельности, начальник управления
(тел.91-21-38)
|