Состоялось ежегодное заседание ТК 164 «Искусственный интеллект» с участием представителей Центра компетенций НТИ по большим данным МГУ

30 июля 2020 года в режиме видеоконференции состоялось второе ежегодное заседание Технического комитета по стандартизации «Искусственный интеллект» (ТК 164), работу одного из подкомитетов которого – ПК 02 «Данные» – курирует Московский государственный университет имени М.В. Ломоносова. Всего в мероприятии приняли участие более 100 представителей компаний, научно-исследовательских организаций, вузов, органов власти, ассоциаций и фондов, входящих в комитет.

Технический комитет по стандартизации 164 «Искусственный интеллект» (ТК 164) создан в 2019 году по инициативе Российской венчурной компании (РВК) при поддержке Минпромторга РФ и Росстандарта. В сферу ответственности ТК 164 входит широкий спектр вопросов, связанных с нормативно-техническим регулированием различных аспектов прикладного использования технологий ИИ. ТК 164 представляет собой зеркальное отражение на национальном уровне профильного международного подкомитета ISO/IEC JTC 1 SC 42 Artificial Intelligence. В составе ТК 164 действует ПК 02 «Данные» (ранее РГ 02 «Большие данные»), функции секретариата которой выполняет Национальный центр цифровой экономики МГУ. Деятельность ПК 02 поддерживается в рамках программы Центра компетенций НТИ по технологиям хранения и анализа больших данных (структурного подразделения Национального центра цифровой экономики МГУ).

Сергей Гарбук

Со вступительным словом к участникам встречи обратился председатель ТК 164 Сергей Гарбук. Он сообщил, что в настоящий момент в состав комитета входят 130 организаций: ИТ-компании – 45, вузы – 20, научно-исследовательские организации – 17, органы государственной власти – 17, потребители систем ИИ (медицина, транспорт, безопасность, ТЭК и др.) – 16, ассоциации и фонды – 15.

Сергей Гарбук обратил внимание на недостаточную представленность организаций-потребителей ИИ в составе комитета. «Я посчитал правильным в дальнейшем нашу работу построить таким образом, чтобы привлекать большее количество заинтересованных потребителей систем ИИ к работе технического комитета, учитывать их позицию, ориентироваться на их практические потребности с учетом особенностей их бизнеса», – отметил председатель комитета.

Структурно ТК 164, по словам Сергея Гарбука, сегодня устроен в виде секретариата и семи структурных подразделений (трех подкомитетов и четырех рабочих групп), среди которых ПК 01 «Искусственный интеллект в здравоохранении» (на базе Научно-практического клинического центра диагностики и телемедицинских технологий Департамента здравоохранения города Москвы), ПК 02 «Данные» (на базе МГУ имени М.В. Ломоносова), ПК 03 «Искусственный интеллект на транспорте» (на базе компании «Яндекс»), РГ 01 «Основополагающие стандарты» (на базе Международного научно-исследовательского института проблем управления), РГ 03 «Качество систем искусственного интеллекта» (на базе Сколковского института науки и технологий), РГ 04 «Прикладные технологии искусственного интеллекта» (на базе ПАО «Сбербанк»), РГ 05 «Искусственный интеллект в образовании» (на базе НИУ «Высшая школа экономики»).

«Когда мы структурируем технический комитет, исходим из двух принципов. Принцип первый – максимальное соответствие структуре международного технического комитета [ISO/IEC JTC 1/SC 42 Artificial intelligence] <…>, потому что наш ТК является зеркальным по отношению к международному. Второй [принцип] – максимальный охват тех отраслей, в которых нормативно-техническое регулирование искусственного интеллекта представляется наиболее важным и целесообразным, и создание соответствующих отраслевых подкомитетов. Это здравоохранение, транспорт, в будущем, возможно, безопасность», – поделился Сергей Гарбук.

Структура ТК 164

За год бюро ТК 164, в которое входят председатель, ответственный секретарь, руководители подкомитетов и рабочих групп, провело шесть заседаний по наиболее важным вопросам, связанным с формированием новых структурных подразделений, подготовкой отчета о работе комитета за 2019 год, утверждением плана деятельности на 2020 год, развитием международного взаимодействия и пр.

Одной из важнейших задач комитета, по словам Сергея Гарбука, является создание национальных документов по стандартизации ИИ. В настоящее время такая работа ведется по 42 документам, которые достаточно равномерно распределены по структурным подразделениям комитета – от 5 до 8 документов на подкомитет или рабочую группу.
 

Распределение 42 национальных документов по стандартизации ИИ в ТК 164

«У каждого документа есть свой разработчик, а технический комитет, включая наши структурные подразделения, обеспечивает экспертизу этих документов. Для эффективной работы ТК <…> крайне заинтересован в привлечении новых отечественных экспертов, их сейчас, конечно не хватает», – отметил Сергей Гарбук.

За истекший период восемь документов доведены до конечной стадии разработки. Из них два утверждены и опубликованы в конце прошлого года (ГОСТ Р 58776-2019 «Средства мониторинга и прогнозирования намерения людей. Термины и определения»; ГОСТ Р 58777-2019 «Воздушный транспорт. Аэропорты. Технические средства досмотра. Методика определения показателей распознавания незаконных вложений по теневым рентгеновским изображениям»).

Три документа на данный момент прошли публичное обсуждение и находятся на стадии утверждения окончательной редакции в Росстандарте (1.11.022-1.024.19 Информационная поддержка жизненного цикла изделий. Интерактивные электронные технические руководства с применением технологий ИИ и дополненной реальности. Общие требования; 1.11.022-1.021.19 Системы искусственного интеллекта. Классификация систем искусственного интеллекта; 1.11.022-1.022.19 Системы искусственного интеллекта. Способы обеспечения доверия. Общие положения).

Еще по трем документам завершается стадия публичного обсуждения, либо разработчиками уже учитываются поступившие замечания (1.11.164-1.025.20 Информационный технологии. Большие данные. Обзор и словарь; 1.11.164-1.012.20 Информационные технологии. ИИ. Ситуационная видеоаналитика. Термины и определения; 1.11.164-1.037.20 Средства мониторинга поведения и прогнозирования намерений людей. Аппаратно-программные средства для колесных транспортных средств. Классификация, назначение, состав и характеристики средств фото- и видеофиксации).

«Выбирая эти документы, мы ориентировались прежде всего на необходимость решения вопросов, связанных с терминологическими задачами в области искусственного интеллекта и задачами разработки метрологических стандартов в области отдельных прикладных технологий искусственного интеллекта», – обратил внимание Сергей Гарбук.

Рассказывая о международной деятельности ТК 164, докладчик поделился, что в отчетный период состоялись  два пленарных заседания подкомитета ISO/IEC JTC 1/SC 42 Artificial Intelligence, входящего в совместный комитет ISO/IEC JTC1 Information Technologies. Первое прошло в октябре 2019 года в Токио, второе – в апреле 2020 года в онлайн-режиме. На текущий момент план проведения заседаний международного подкомитета составлен вплоть до апреля 2024 года.

«Вероятнее всего, он [план] будет корректироваться в связи с пандемией. В частности, в октябре 2020 года, скорее всего, пленарное заседание будет проводиться тоже в онлайн-режиме. Обращаю ваше внимание, что по текущим планам, как они согласованы в международной организации по стандартизации, в октябре 2021 года пленарное заседание будет проводиться в Москве. Возможно, оно сдвинется из-за карантина. <…> Это очень серьезное и интересное мероприятие. Сейчас в международный подкомитет по искусственному интеллекту входят порядка 80 стран, это ведущие специалисты в своей области, все они приедут к нам сюда. С ними можно будет пообщаться, обменяться мнениями, установить непосредственный контакт. Безусловно, к этому мероприятию надо будет готовиться очень серьезно», – отметил Сергей Гарбук.

Участие в заседаниях подкомитета ISO/IEC JTC 1/SC 42 Artificial Intelligence

В международном подкомитете по стандартизации ИИ сейчас утверждено пять документов, при этом ведется работа над созданием 22.

Международные документы по стандартизации ИИ

Экспертное сообщество ТК 164 осуществляет взаимодействие с национальными и международными организациями по вопросам стандартизации ИИ, нормативно-правового регулирования и пр.

Взаимодействие ТК 164 с национальными и международными организациями

По словам Сергея Гарбука, в рамках мероприятий с участием представителей ТК 164 основное внимание уделялось вопросам этики применения искусственного интеллекта, его использования в здравоохранении, образовании и других отраслях, а также информационной безопасности, в частности деперсонификации больших данных.

Председатель ТК 164 также озвучил пять практических принципов стандартизации ИИ, которые сформировалось за время работы органа. Первый из них – выявление нормативно-технических барьеров, специфичных именно для области ИИ, на преодоление которых направлена деятельность по разработке стандартов. В частности, одна из ключевых целей стандартизации ИИ связана со снятием нормативных ограничений в области физической и информационной безопасности.

«Если говорить об информационной безопасности, это, прежде всего, тесная связь проблемы искусственного интеллекта с использованием больших объемов данных, которые зачастую являются конфиденциальными, содержат в себе персональные данные и так далее. Вопрос нахождения технологического и нормативного компромисса между соблюдением требований в области информационной безопасности и между снятием препятствий для недискриминационного доступа разработчиков к этим большим данным – этот вопрос не решен ни у нас в стране, ни в мире, его предстоит решить», – заявил Сергей Гарбук.

«Что касается физической безопасности, этот вопрос наиболее остро стоит для систем, некорректная работа которых может привести к человеческим жертвам, к экологическому, экономическому ущербу и так далее. Эти системы – прежде всего, беспилотный транспорт, медицинские системы, промышленная робототехника, системы безопасности и некоторые другие. Решением этих проблем является создание метрологических стандартов, которые позволяют гарантировать безопасность систем искусственного интеллекта в реальных условиях эксплуатации», – сообщил Сергей Гарбук.

К другим целям стандартизации, по его словам, относятся обеспечение гарантий качества систем ИИ, а также повышение эффективности их применения на основе унификации и обеспечения интероперабельности. 

Второй принцип стандартизации заключается в разработке межотраслевых (термины и определения, форматы описания и разметки данных, способы деперсонификации данных, общие принципы обеспечения качества систем ИИ, классификация примеров использования систем ИИ) и отраслевых метрологических (способы подтверждения безопасности систем ИИ в реальных условиях эксплуатации, способы достоверной оценки характеристик систем ИИ, определяющих эффективность их применения по назначению) стандартов.

Третий принцип заключается в стремлении создать конечный корпус документов по стандартизации ИИ. «По нашей оценке, такой корпус стандартов искусственного интеллекта, состоящий из двух групп [межотраслевые и отраслевые стандарты], о которых я ранее говорил, включает порядка 170 (до 200) документов», – обратил внимание Сергей Гарбук.

 

Планируемый корпус стандартов ТК 164

Четвертый принцип стандартизации основывается на необходимости взаимодействия с отраслевыми системами сертификации технологий ИИ.

Взаимодействие с системами оценки соответствия

Пятый принцип – формирование конкретных национальных целей и приоритетов при участии в деятельности по международной стандартизации ИИ. «Нам необходимо устанавливать такие требования, разрабатывать такие стандарты, чтобы обеспечивать возможность пользователю системы искусственного интеллекта подтверждать ее соответствие установленным требованиям в области безопасности независимо от того, где, кем и когда была разработана система искусственного интеллекта. Это наша принципиальная позиция, которую мы продвигаем на международном уровне», – заявил Сергей Гарбук.

По его мнению, требуется уточнение позиции в части определения понятия ИИ, этических аспектов создания и применения систем ИИ, а также вопросов защиты персональных данных.

Далее последовали доклады руководителей структурных подразделений ТК 164. Результатам деятельности РГ 02 «Большие данные», созданию и планам работы ПК 02 «Данные» было посвящено выступление Юрия Хохлова, руководителя подкомитета, председателя совета директоров Института развития информационного общества (ИРИО), члена президиума Наблюдательного совета Центра компетенций НТИ по технологиям хранения и анализа больших данных на базе МГУ.

Юрий Хохлов отметил, что РГ 02 «Большие данные» была «переконвертирована» в ПК 02 «Данные» вслед за изменениями, произошедшими в структуре международного подкомитета ISO/IEC JTC 1/SC 42 Artificial Intelligence.

Докладчик сравнил планы работ структурного подразделения ТК 164 на 2020 год с текущим статусом их выполнения. Так, 13 июля завершилось общественное обсуждение первой редакции стандарта ГОСТ Р «Информационные технологии. Большие данные. Обзор и словарь», разрабатываемого МГУ и ИРИО. От четырех организаций поступило 54 замечания, после обработки которых членам технического комитета будет разослан уточненный вариант проекта стандарта для финального рассмотрения. Затем планируется перейти к нормоконтролю и утверждению документа в Росстандарте.

По словам Юрия Хохлова, завершается также подготовка первой редакции ГОСТ Р «Информационные технологии. Эталонная архитектура больших данных. Часть 1. Структура и прикладные процессы». Данный документ, тоже разрабатываемый МГУ и ИРИО, призван обеспечить эффективное и последовательное описание организациями используемой архитектуры и ее реализации с учетом ролей/исполнителей и связанных с ними проблемных вопросов. Планируемый срок начала публичного обсуждения стандарта – сентябрь 2020 года.

Завершается подготовка первой редакции еще одного национального стандарта ГОСТ Р «Информационные технологии. Эталонная архитектура больших данных. Часть 5. Дорожная карта стандартов». Подобно предыдущим двум документам, этот стандарт разрабатывается на средства МГУ и ИРИО и призван выполнять две функции: во-первых, дать описание существующих и разрабатываемых стандартов, относящихся к большим данным, во-вторых, определить приоритетные направления разработки будущих стандартов больших данных на основе анализа пробелов и несоответствий. Планируемый срок начала публичного обсуждения стандарта – сентябрь 2020 года.

Рассказывая об участии ТК 164 в разработке международных стандартов по большим данным, Юрий Хохлов выделил четыре аспекта. Во-первых, с российской стороны продолжается участие в разработке двух международных стандартов: 1) ISO/IEC 24668 Information technology – Artificial intelligence – Process management framework for Big Data analytics; 2) ISO/IEC 20547-4 Information technology – Big Data reference architecture – Part 4: Security and privacy. Во-вторых, временная рабочая группа «Качество данных» (Data Quality Ad Hoc Group) подготовила и направила новые предложения по разработке стандартов по качеству данных: 1) ISO/IEC NP 5259-1 Data Quality for analytics and ML – Overview; 2) ISO/IEC NP 5259-3 Data Quality for analytics and ML – Management; 3) ISO/IEC NP 5259-4 Data Quality for analytics and ML – Process. Юрий Хохлов подчеркнул важность участия российских коллег в обсуждении подобных инициатив. В-третьих, еще одна международная временная рабочая группа «Данные для искусственного интеллекта» (AI Data AHG) продолжает работу над докладом по данным для ИИ.

Юрий Хохлов сообщил, что пандемия оказала влияние на финансирование разработки четырех стандартов, которые ранее были инициированы Ассоциацией больших данных (АБД). Работу по трем из этих стандартов (ГОСТ Р «Большие данные. Типы обработки больших данных»; ГОСТ Р «Большие данные. Показатели качества данных. Часть 1. Общие положения»; ГОСТ Р «Большие данные. Методология оценки эксплуатационных характеристик алгоритмов обработки больших данных. Часть 1. Общие положения») предложено пока приостановить, то есть исключить данные документы из Программы национальной стандартизации 2020 года. В то же время была подчеркнута важность разработки национального стандарта ГОСТ Р «Большие данные. Типовая архитектура песочниц данных. Часть 1. Общие положения», предложено обратиться в Росстандарт с просьбой профинансировать создание этого документа из средств федерального бюджета. При этом АБД готова выступить в качестве экспертной организации.

Текущий статус по плану работ ПК 02 «Данные»

Юрий Хохлов озвучил дальнейшие планы работы ПК 02 «Данные» над стандартами. Так, до конца 2020 года ФИЦ «Информатика и управление» РАН за счет средств федерального бюджета подготовит первую редакцию ГОСТ Р «Информационные технологии. Эталонная архитектура больших данных. Часть 4. Безопасность и конфиденциальность». В ноябре 2020 года выйдет первая редакция разрабатываемого НИУ ВШЭ ГОСТ Р «Информационные технологии. Большие данные. Техническое задание. Требования к содержанию и оформлению». В конце 2020 года также планируется разработать первую редакцию  национального стандарта ГОСТ Р «Информационные технологии. Эталонная архитектура больших данных. Часть 2. Примеры использования и производные требования». Разработчиком документа тоже выступает НИУ ВШЭ.

Среди проведенных за отчетный период мероприятий докладчик выделил секцию «Цифровая стандартизация» в рамках II Всероссийского форума «Цифровизация-2019» в МГУ (28 октября 2019 года), а также семинар «Деперсонификация (анонимизация) больших данных» в Центре компетенций НТИ по технологиям хранения и анализа больших данных на базе МГУ (11 декабря 2019 года).

В планах ПК 02 «Данные» проведение следующих мероприятий:

· Секция «Стандарты цифровой экономики» в рамках онлайн-форума «Цифровизация-2020» (организатор – Национальный центр цифровой экономики МГУ, время проведения – октябрь/ноябрь 2020 года);

· Семинар «Типы обработки больших данных» (организатор – АБД, время проведения – осень 2020 года);

· Серия международных экспертных семинаров «Политика работы с данными» (организаторы: Всемирный банк, ИРИО, МГУ и другие российские организации), в том числе семинар «Концептуальная схема политики работы с данными» (время проведения – конец августа 2020 года), семинар «Данные как инфраструктура» (время проведения – начало сентября 2020 года), семинар «Персональные данные и этика данных» (время проведения – конец сентября 2020 года).

О текущих результатах деятельности и планах работы на национальном и международном уровнях рассказали также представители других структурных подразделений ТК 164:

· ПК 01 «Искусственный интеллект в здравоохранении» – председатель подкомитета Сергей Морозов, директор НПКЦ диагностики и телемедицины;

· ПК 03 «Искусственный интеллект на транспорте» – председатель подкомитета Антон Шингарев, директор по корпоративным отношениям компании «Яндекс»;

· РГ 01 «Основополагающие стандарты» – руководитель рабочей группы Александр Агеев, генеральный директор МНИИПУ;

· РГ 03 «Качество систем искусственного интеллекта» – члены рабочей группы Анна Жданова и Павел Осиненко, специалисты Сколтеха;

· РГ 04 «Прикладные технологии искусственного интеллекта» – руководитель рабочей группы Андрей Незнамов, исполнительный директор Sberbank.ai;

· РГ 05 «Искусственный интеллект в образовании» – руководитедь рабочей группы Антоний Швиндт, специалист НИУ ВШЭ.

В ежегодном заседании ТК 164 также приняли участие научные сотрудники и ведущие специалисты Центра компетенций НТИ по технологиям хранения и анализа больших данных на базе МГУ: Александр Райков, Андрей Микрюков, Алексей Аверкин, Михаил Натензон, Сергей Афанасьев, Максим Часовиков и Анна Пагина.


В прошлую пятницу, в 17:45