Источник картинки: indianexpress.com/article/business/budget/budget-2016-rs-25k-cr-falls-short-of-psu-banks-hopes
Открытые данные (как и все остальные направления) развиваются в России своеобразно: сложно понять и привыкнуть к тому, что о доходах и расходах государства узнать намного проще, чем об экологии, образовании, здравоохранении. При этом федеральные и региональные ведомства публикуют в основном реестры подведомственных учреждений, списки актуальных вакансий и адреса культурных учреждений и аптек (весьма “заезженные” массивы данных с ограниченными областями применения).
Финансовые государственные органы смотрят на открытость намного шире:
- Министерство финансов регулярно публикует данные о сводной бюджетной росписи (расходы федерального бюджета), открывает исторические бюджеты, проводит конкурсы и встречи для разработчиков
- Региональные и муниципальные финансовые органы размещают информацию о бюджетах, их проектах, отчетах об исполнении бюджетов (да, не всегда качественно, не всегда в одном месте, но данные есть и ими можно пользоваться). В цифрах: примерно 90 региональных и 23 000 муниципальных бюджетов в год.
- Федеральное казначейство размещает реестры субсидий, участников и неучастников бюджетного процесса, данные о государственных контрактах. В цифрах: реестр участников бюджетного процесса насчитывает более 150 тыс. записей, количество записей о государственных контрактах приближается к 20 миллионам.
- Ряд других ведомств, таких как ФНС, тоже начинают совершать первые действия по открытости. Предоставление базовых данных из ЕГРЮЛ в машиночитаемом формате и бесплатно, естественно, не планируется, но попытку найти что-то интересное в их данных все же можно совершить.
В целом, работа госорганов в этом направлении не может не радовать, за что отдельное спасибо Минфину и Казначейству (на правах пиара и рекламы данных), открытым к диалогу и запросам разработчиков. Одна большая проблема только в том, что во всей этой деятельности отсутствует системный подход, вследствие чего данные публикуются где угодно (попробуйте, например, собрать бюджеты всех муниципалитетов Санкт-Петербурга) и как угодно (а затем все эти бюджеты изучить, выявить ошибки и попробовать доказать муниципалитетам, что их данные не верны), а их качество оставляет желать лучшего. Из очевидных спорных моментов можно выделить следующее:
Расстановка приоритетов
Несмотря на наблюдение за работой Минфина с момента объявления “курса на открытость” (2012-2013 год), для меня до сих пор остается загадкой приоритизация раскрытия данных. Одной из основных мотиваций для запуска этого направления в России было вхождение в ТОП-5 в международном рейтинге Open Budget Index. Он складывается из двух показателей: прозрачность (доступ к информации и данным) и возможность участия граждан в бюджетном процессе. Со вторым показателем у нас пока все плохо (и в этом “виновато” не только государство, но и сами граждане), а вот о первом можно порассуждать.
С точки зрения доступа к информации о расходах и доходах (не рассматриваем критерий “машиночитаемость”) — Россия если и не лидер в мире, то в первой тройке-пятерке точно: информация раскрывается на федеральном, региональном, муниципальном уровнях. Но выбор массивов для раскрытия вызывает вопросы, и, если раньше стандартным объяснением было: “мы не знаем, что вам [разработчикам] нужно”, то сейчас отсылка идет на проведенные Минфином опросы о востребованности финансовых данных. В опросах были перечислены такие интересные данные, как реестры расходных обязательств, федеральный бюджет, перечни публичных нормативных обязательств и еще около 30 пунктов, а в итоге опубликованы в этом году будут данные об алмазах, изумрудах и других драгоценных камнях (нужно отметить, что 2-3 интересных новых набора все же будут). За четыре года я не встретила ни одного российского или зарубежного человека, который бы интересовался российскими данными об алмазах (о продаже нефти, “госконтрактных” данных, бюджетах, финансировании СМИ спрашивают, а кто “голосовал” за открытость изумрудов для меня остается загадкой).
Вопрос о сомнительном выборе данных для раскрытия не возник бы, если бы были опубликованы “базовые” данные, к которым, в первую очередь, относится федеральный бюджет (т.е. Закон “О федеральном бюджете”). Это не только основной показатель для рейтингов (Open Budget Index, Open Data Barometer), ради которых все и затевалось, но и основной финансовый документ, по которому живет и функционирует государство. Сводная бюджетная роспись (расходы федерального бюджета) публикуется в машиночитаемом формате и обновляется на сайте Минфина, а всех остальных данных из закона “О федеральном бюджете” (доходы, различные нормативы, субсидии и т.д.) в машиночитаемом виде нет. Данные регионов и муниципалитетов в XLS и CSV публикуются (не всеми, но многими), данные по контрактам и отчетам об исполнении бюджетов тоже есть, а вот федеральный бюджет у нас до сих пор только в PDF. Хотя по официальной позиции (трижды озвученной на встречах с разработчиками) “раскрытию ФЗ “О федеральном бюджете” ничего не препятствует и это будет сделано”. Вот только после появления этих данных сказать о том, что “и года не прошло” уже не получится. Прошло.
Низкое качество данных
Предположим, вам повезло и вы нашли нужные данные (даже вдвойне повезло — они не только есть, но и машиночитаемые). Радость от их наличия обычно длится недолго — примерно до первой попытки в них разобраться: структура бывает запутанной (передаю привет “лесенке” Минфина, малопригодной и для программиста, и для “обычного человека”), документация практически всегда отсутствует. Понять базовые данные, такие как бюджеты и контракты, можно, но сложно, — Бюджетный кодекс, системно описывающий бюджетную систему, и Альбомы ТФФ, документирующие данные о госконтрактах и госзакупках, подробны, но объемны и усыпаны специфической терминологией (что, безусловно, снижает привлекательность этих данных для разработчиков). Основные проблемы начинаются при детальном рассмотрении и попытке использовать и сопоставлять данные:
- Официальные данные, полученные с сайта zakupki.gov.ru, пестрят наличием опечаток в названиях организаций, путаницей с указанием валюты (о количестве контрактов, заключенных в австралийских долларах мы рассказывали в рассылке по госфинансам на прошлой неделе), путаницей в размерности (данные указываются в тысячах, когда должны быть указаны в рублях), ошибками в ИНН (фантазия физлиц при заполнении полей “ИНН/КПП” безгранична; логика представителей организаций, указывающих ИНН банка вместо ИНН своей организации не поддается объяснениям).
- С бюджетами не лучше. При их формировании и/или публикации неверно используются классификаторы (например, отсутствуют ведущие нули, цифра “0” заменяется буквой “о”), используются битые ссылки (например, на другие xls файлы с компьютера Маши из администрации муниципалитета), реже встречаются расхождения в суммах или некорректное понимание представителями муниципалитетов тонкостей Бюджетной системы РФ (например, МО Дворцовый использовал в 2015 году одинаковые коды для муниципальных программ, что недопустимо согласно официального ответа Комитета финансов СПб).
Подробнее поговорить о качестве данных можно на хакатоне Budget Stories, который пройдет 25-26 июня в Санкт-Петербурге (меня позвали поучаствовать в нем в роли ментора, поэтому не буду скрывать свою личную заинтересованность в привлечении тех, с кем можно обсудить финансовые данные, их качество и идеи приложений).
Отсутствие ответственных и низкая заинтересованность в повышении качества данных
Исправить опечатки, привести адреса и телефоны к единому формату трудозатратно, но реализуемо. Сложнее разобраться с содержательными ошибками, для устранения которых требуются комментарии первоисточника. В случае с муниципальными данными (в основном с бюджетами) сложно вдвойне — уровень ИТ-грамотности и понимания специфики “открытых данных” на муниципальном уровне объективно ниже, задач и проблем и без открытых данных полно. Кроме того, формально муниципалитеты не являются третьим уровнем власти, то есть на качество их данных ни Минфин, ни региональные госорганы повлиять не могут. И, если проблема не устраняется взаимодействием с источником данных, то следующей инстанцией официально является Прокуратура, обращение в которую не является “позитивным” способом решения проблемы и вряд ли поспособствует продолжению коммуникаций с муниципалитетом (если вы планируете, например, выступать с предложениями).
С госконтрактами и другими данными, полученными на zakupki.gov.ru, ситуация аналогичная — в общих словах Казначейство “реализовало предупреждающий контроль на соответствие информации о поставщиках, указанной пользователем, сведениям ЕГРЮЛ/ЕГРИП”, а в официальных ответах на конкретные вопросы с примерами неверных данных идет отсылка на “персональную ответственность, которую несет лицо, имеющее право действовать от имени заказчика”.
Резюмируя: данных о госфинансах много, они интересны, не всегда качественные и сложны. А они вам нужны? Может быть вы их уже используете? А если нет, то какие причины останавливают?
В любом случае спасибо за работу по открытости и, для справедливости, надо заметить, что одно оправдание у Минфина все-таки есть — им не хватает обращений и фидбека по качеству данных от разработчиков. Понятно, что оставлять официальные обращения на сайте госорганов не особо удобно (а в случае с Минфином нужно еще потратить время на выбор неочевидных категорий), но можно написать им письмо на opendata@minfin.ru (в одиночку у меня не получилось сдвинуть счетчик обращений с нуля), оставить комментарий на странице в фейсбуке или даже отметить “федеральный бюджет” и другие полезные массивы данных в опросе о востребованности данных. Кстати, представители Казначейства на встрече с разработчиками объявили, что ни одно обращение по поводу данных не остается неотвеченным, проверим? ;-)
Автор: «Информационная культура»