Ключевым этапом развития образовательной деятельности Центра является создание образовательной платформы с целью обеспечения комплексной поддержки очного и дистанционного профессионального обучения, а также повышения квалификации в области технологий хранения и анализа больших данных. Создаваемая платформа объединит в себе кадровый профессорско-преподавательский состав, учебно-методическое обеспечение и программные решения с целью подготовки компетентных профессионалов в новой развивающейся сфере, собравшей воедино теорию, методы и инструментальные средства обработки, хранения и анализа разнородных, сложно структурированных данных большого объема.
Направления платформы создаются с учетом необходимости разработки образовательных программ и стандартов, отвечающих современным тенденциям в области технологий хранения и анализа больших данных. В рамках платформы формируются уникальные методы интеллектуального анализа данных, выборок, временных рядов, а также методы оптимизации в задачах машинного обучения, рассматриваются такие понятия, как методы распределенного хранения и обработки данных, базы данных, объектно-ориентированное и суперкомпьютерное моделирование систем обработки больших данных, различные области предметно-ориентированных знаний.
В рамках создаваемой образовательной платформы предполагается разработка курсов лекций по следующим четырем направлениям:
● Технологии хранения и анализа больших данных: аналитика больших данных (число выпускников ежегодно – 400);
● Технологии хранения и анализа больших данных: хранение больших данных (число выпускников ежегодно – 200);
● Технологии хранения и анализа больших данных: программная инженерия и информационные технологии (число выпускников ежегодно – 400);
● Технологии хранения и анализа больших данных: предметно-ориентированные знания (число выпускников ежегодно – 300).
Разработана концепция образовательных программ (их компонентов) и образовательной платформы. Ее ключевые компоненты: профессорско-преподавательский; учебно-методический – репозиторий материалов к обучающим курсам, созданным в ведущих научных/учебных центрах России (МГУ, ФИЦ ИУ РАН, СПбГТУ, ННГУ, РЭУ и др.); инфраструктурный – система электронного дистанционного обучения.
Начата работа по формированию коллектива и созданию курсов и методических разработок. Привлечены ведущие специалисты в области машинного обучения и математической статистики (г. Белгород, СПбПУ Петра Великого, РАН).
Разработано 22 новых и существенно модернизированных базовых курса лекций, для каждого из которых создан стандартный набор документов (учебно-методический комплекс, расширенная программа, согласованная с Минобрнауки России, слайды, лекции, краткий курс лекций, сборник задач):
1. Анализ временных рядов;
2. Интеллектуальный анализ данных;
3. Принципы построения вероятностных моделей в задачах анализа больших данных;
4. Статистический анализ больших выборок;
5. Методы оптимизации в задачах машинного обучения;
6. Статистика больших данных;
7. Анализ риска;
8. Прикладной многомерный статистический анализ
9. Современные методы распределенного хранения и обработки данных;
10. Технологии распределенного хранения и обработки данных;
11. Базы данных – теория, практика, перспективы: от сложных структур к большим данным;
12. Объектно-ориентированное моделирование систем обработки больших данных;
13. Пакеты прикладных программ для статистической обработки и анализа данных;
14. Суперкомпьютерное моделирование и технологии;
15. Современные методы анализа и обработки сигналов и изображений;
16. Анализ больших текстовых данных и информационный поиск;
17. Основы теории нечетких множеств и измерения нечеткости;
18. Прикладные задачи анализа данных;
19. Методы обработки и распознавания изображений;
20. Интеллектуальные методы обработки видео;
21. Прикладные задачи теории случайных процессов;
22. Цифровая экономика.
По итогам 2019 года разработаны три новых базовых курса, которые включают комплекты учебно-методических материалов (учебно-методические комплексы, слайды лекций, методические материалы с примерами практических заданий и контрольных вопросов):
1. Элементы теории риска и принятия решений;
2. Основы организации и хранения данных. Базы данных;
3. Логико-математические методы в анализе больших лингвистических данных.
Данные курсы имеют комплексную ориентацию на группу направлений образовательной программы (аналитика больших данных, программная инженерия и информационные технологии, а также предметно-ориентированные знания).
Произведена модернизация базовых курсов образовательной платформы для дистанционного обучения (в части разработки звукового сопровождения слайдов лекций).
Разработаны три программы повышения квалификации в сфере технологий хранения и анализа больших данных для специалистов государственных учреждений, государственных служащих и сотрудников госкомпаний. Программы ориентированы на повышение квалификации как управленческого, так и инженерно-технического персонала.
1. Большие данные: хранение и анализ*;
2. Аналитика процессов в бизнесе и социально-экономической сфере**;
3. Гибридный интеллект. Сценарии использования в бизнесе и государственном управлении**.
* Программа рассчитана на инженерно-технический персонал.
** Программа рассчитана на управленцев разного уровня – от представителей государственных и муниципальных органов управления до руководителей компаний среднего и малого бизнеса.
Разработанные Центром курсы применяются в ряде ведущих вузов страны, которые входят в консорциум Центра. Среди них – Московский государственный университет имени М.В. Ломоносова, Белгородский государственный национальный исследовательский университет, Нижегородский государственный университет имени Н.И. Лобачевского, Санкт-Петербургский политехнический университет Петра Великого, Ульяновский государственный университет и другие. Более 800 студентов этих вузов получили специальные знания по направлению «Технологии хранения и анализа больших данных», прослушав курсы, разработанные Центром.