Рубрика «Блог компании НП «Информационная культура»» - 2

Совет по открытым данным: террабайты Минкультуры, выше в рейтинге G8 и о том куда идет Минэкономразвития
21 октября выдался днём богатым на общественные мероприятия, об одном из них, заседании общественного совета при Росстате, я писал ранее. А вот про Совет по открытым данным вполне можно поговорить подробнее.

Прежде чем я перескажу всё своими словами — посмотрите на официальную новость там какие-то из вопросов раскрыты, а какие то я расскажу сейчас.

Итак, было 3 большие темы:
1. Открытые данные Минкультуры
2. Выполнение Россией требований хартии G8
3. Техтребования на портал открытых данных от Минэкономразвития России

Открытые данные Минкультуры

Выступал Михаил Городилов из Минкультуры и, если кратко, то его выступление можно свести к следующим тезисам:

  1. «Мы открыты» Они только-только начали открывать данные открытые данные и что-то уже разместили на сайте Минкультуры — mkrf.ru/opendata/
  2. «Цифровой контент — это тоже данные» Обещают очень много данных цифрового контента и то что планируют оцифровывать и создавать до 280 террабайт в год
  3. «Мы хотим денег» Это прозвучало совершенно недвусмысленно, о том что Минкультуры хочет чтобы работы по созданию ими открытых данных в том числе из цифрового контента были профинансированы из госпрограммы «Информационное общество».
  4. «Мы хотим чтобы бизнес платил» Посыл также очень простой. Чтобы бизнес который потенциально использовал бы их данные далее бы тоже участвовал в финансировании их создания. Прозрачно намекалось на Яндекс и Гугл и другие крупные интернет-холдинги

Вот такие нехитрые мысли прозвучали от Минкультуры. При этом у них, на самом деле, много есть данных которые давно пора открыть, но до сих пор ничего из них они не разместили. Ни государственный реестр фильмов, ни базу по культурному наследию, ни многое другое. Позиция та же что и у Росстата, только понимания пока еще меньше.

Дадут ли им денег? Не знаю. В этом году всем Минфин обрезает финансирование и не дает денег на новые инициативы. Надо ли их дожимать открывать то что уже есть? Я считаю что надо.

Хартия G8

Читать полностью »

Росстат обещает открываться, но не забесплатно

Поскольку я вхожу в Совет по открытым данным при Правительственной комиссии я регулярно присутствую на большом числе мероприятий по открытости данных и открытости вообще.

Не могу похвастаться что там бывает много интересного, чаще всего это много разговоров на языке далеком от простого человека, однако такая работа по «лоббированию открытости» тоже нужна.

И вот сегодняшний день был буквально заполнен такими мероприятиями. Мне довелось побывать утром на Общественном совете при Росстате на заседание которого меня позвали сотрудники Росстата. А вечером на Совете по открытым данным.

Про Совет я ещё напишу отдельно, а вот про Росстат прямо сейчас.

Как всегда есть две новости — хорошая и плохая.

Итак, хорошая новость.

В Росстате лучше всех понимают что такое открытые данные и данные вообще они тоже очень хорошо понимают. Они сразу поняли что такое Semantic Web, SPARQL, Linked Data и другие термины пугающие остальных чиновников. Они очень хорошо понимают что надо сделать чтобы данные преобразовать в машиночитаемые и довести до связанных данных.

В плане понимания — они безусловные лидеры. Вот просто они первые кто понимает так хорошо, на удивление.

Но есть и плохая новость.
Читать полностью »

Открытые данные из существующих государственных порталов
Когда мы говорим про открытые данные которые государственные органы должны раскрывать, мы, чаще всего, сталкиваемся с тем что данных в нужной нам форме нет. Или, по крайней мере, так утверждают те кто должен вести базы данных и реестры создаваемые государством.

И действительно, есть данные которых, скорее всего, просто не существует, например данее по границам участков почтовых отделений. В мире, например в переписи открытых данных Open Knowledge Foundation это один из важных наборов данных, но полноценно отсутствующий в России.

Но есть и другая сторона этой медали. Есть уже созданные государственные порталы и проекты в которых собраны большие базы данных недоступные в машиночитаемом виде для граждан. И это именно тот случай когда чиновники не могут сказать что данных нет, вопрос лишь в качестве данных и их доступности в удобном виде.

Далее я буду писать только о тех порталах и проектах что созданы и поддерживаются на государственные деньги. И тех которые содержат немало полезной информации.

ОБД Мемориал

Ссылка: http://obd-memorial.ru
Открытые данные из существующих государственных порталов

С сайта мы можем узнать что:
На сегодняшний день в ОБД введено 13,7 млн. цифровых копий документов о безвозвратных потерях периода Великой Отечественной войны из 38 тыс. архивных дел ЦА МО РФ, ЦВМА, РГВА, ГА РФ, региональных архивов Росархива и 42,2 тыс. паспортов воинских захоронений существующих мест воинских захоронений в Российской Федерации и за ее пределами.

Дополнительно в ОБД загружено более 1000 томов Книги Памяти.

Всего в ОБД около 29 млн. записей из архивных документов (не путать с общим числом боевых потерь — 8,67 млн. чел.) и около 10 млн. записей из Книги Памяти.

Иначе говоря за государственный счет была проведена маштабнейшая работа по оцифровке данных и переводе их в базу данных онлайн, но при этом не предоставлено ни одного интерфейса для работы с данными — ни дампов базы, ни API с REST+JSON, ничего другого что позволило бы вести аналитическую работу над данными.

Зачем это нужно? То что не сделало государство — могут сделать желающие волонтеры и разработчики проведя геокодирование данных, создавая мобильные приложения и региональные проекты посвященные Великой отечественной войне.

Читать полностью »

Открытый код — Github для государства

Гитхаб уже много лет как является одним из лидирующих сервисов и сообществ разработчиков работающих с открытым кодом. Не секрет что в последние годы Гитхабом пользуется всё большее число представителей органов власти и гражданских хакеров (civil hackers).

В качестве последней инициативы — на Гитхабе появился специальный проект «Гитхаб для государства» (Github for Government) где были собраны аккаунты многочисленных государственных ведомств с разбивкой по странам.

На сегодняшний день десятки государственных разработчиков и чиновников используют Гитхаб в своей основной работе. Многие проекты разрабатываются полностью открыто с публичными багтрекерами, разработчиками отвечающими на вопросы и публичную экспертизу.
Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js