Министерство цифрового развития, связи и массовых коммуникаций Российской Федерации (Минцифры России) сообщило о начале реализации проекта по созданию так называемого национального озера данных.
Озером данных (DataLake) называют крупные объёмы данных, собранных в «сыром» виде. Проект официально называется ГосДата.хаб. Он объединяет потоки обезличенных данных различных государственных органов. Как отмечают в пресс-службе, национальное озеро данных систематизирует хранение и обработку данных для государственных аналитических сервисов, упростит подготовку отчетов госорганам и бюджетным организациям, благодаря автоматизированному формированию документов по заданным алгоритмам. Все собранные данные будут попадать в озеро в обезличенном виде, их деперсонализация будет происходить на стороне поставщика данных.
Глава Минцифры России Максут Шадаев рассказал:
ГосДата.хаб объединит обезличенные данные органов власти всех уровней и позволит формировать расширенную аналитику. В первую очередь запустим сервисы аналитики для IT и связи. Государство будет мотивировать бизнес предоставлять обезличенные данные по отдельным направлениям, которые критически важны для системы госуправления. Обмен данными будет двухсторонним: обезличенные данные государственных датасетов сможет использовать и бизнес для развития собственных решений.
Первоначально наборы данных, собранные в ГосДата.хабе, будут доступны для госорганов, однако в перспективе доступ к ним также получит бизнес, для чего будет создан датамаркет – один из публичных разделов Национальной системы управления данными (НСУД). Основной площадкой реализации национального озера данных будет ФГАУ НИИ «Восход».
Реализация проекта намечена на 2022-2024 годы. В опытную эксплуатацию система будет запущена в 2023 году.