Друзья, под закат уходящего 2014 года и начала 2015 есть отличная новость для всех кто любит работать с открытыми данными, участвовать в конкурсах для разработчиков.
А также, я уверен, что есть и те кто любит историю и исторические данные.
С 23 декабря Минфин России с нашей помощью Информационной культуры открывает конкурс приложений BudgetApps http://budgetapps.ru/contest на открытых данных которые Минфин России публиковал последние несколько лет.
Данные самые разные. Это данные о бюджетах, данные об аудиторских организациях, государственном долге, государственных резервах и многое другое.
Ну и, так оказалось, что меня зовут Иван Бегтин и я член жюри этого конкурса.
Все они есть по ссылке на сайте Минфина — http://minfin.ru/ru/opendata/
И много бюджетных данных есть на Едином портале бюджетной системы — http://budget.gov.ru/data/opendata там есть структура бюджета в CSV формате, сами данные, справочники и многое и многое другое. А также данные по всем официальным учреждениям вот тут http://bus.gov.ru/public/opendata.html. На этот ресурс обратите особое внимание. Там опубликованы индикаторы, бюджеты, уставы и многое другое по каждой государственной организации и муниципальном учреждении в России. Если Вы задумаете любой региональный проект, то эти данные будут просто бесценны.
Это не значит, что нельзя использовать какие-либо другие данные, безусловно можно и нужно, однако поскольку это конкурс Минфина России, то конечно ожидается что другие данные будут использоваться вместе с этими.
Я лично считаю, что не стоит ограничиваться только теми данными которые уже переведены в машиночитаемый вид. Есть также данные которые можно превратить в открытые данные самостоятельно.
Многие умеют писать парсеры, но для тех кто этого не делал раньше, хорошее подпорье может быть ScraperWiki (https://scraperwiki.com/) чтобы собрать информацию со страниц, а также разные библиотеки для разбора Excel файлов, извлечение таблиц из PDF документов — с помощью pdftables.com/ или сервисов Abbyy или их Abbyy Finereader.
На сайте и других ресурсах Минфина кроме данных есть множество другого интересного что можно превратить в данные. Начиная просто от новостей которые стали особенно актуальны в последние дни, продолжая всем остальным.
Исторические бюджеты
Есть огромное направление в открытии данных которое мы столь долго упускали – это направление исторических данных. Тех которые хранятся в архивах в виде больших томов справочников с мириадами таблиц и которые просто необходимы в тот момент когда мы начинаем обращаться к истории, ссылаясь на факты, создавая спецпроекты посвящённые какому-либо событию.
В самые ближайшие дни будут опубликованы первые сканированные бюджеты Российской Империи и Советского Союза. Чуть позже, но тоже очень скоро, появятся все сканированные бюджеты Российской Империи, СССР и РСФСР которые только существуют.
Кроме сканов будут опубликованы и сами данные, преобразованные в таблицы Excel и CSV, реконструированные из справочников в первичном виде и приведенные нами в порядок для последующей визуализации или проекта.
Скажу честно, не будь я членом жюри этого конкурса, я бы лично сделал спецпроект на этих данных. А может быть его еще и сделаю когда конкурс закончится, а может быть кто-то сделает это до меня.
Уже готовы данные бюджетных росписей по нескольким годам, как первичные данные, полученные из текстов книг, так и обработанные и сопоставленные по разным годам.
Поэтому исторические данные вот-вот уже скоро будут, а пока можно начать использовать имеющиеся и заглянуть на общественный проект «Исторические материалы» (istmat.info) где собраны многие бюджетные справочники СССР и Российской Империи.
Где найти больше данных?
Какие дополнительные источники данных у нас есть.
- Хаб открытых данных – hubofdata.ru негосударственный реестр открытых данных поддерживаемый НП “Информационная культура”. Много всего, более 5000 массивов данных, но всё неофициальное.
- Данные Федерального казначейства — http://roskazna.ru/opendata/
- Веб-сервисы ЦБ России — http://cbr.ru/scripts/Root.asp множество интересных данных по российским финансам.
- Портал открытых данных России — http://data.gov.ru/ его польза в том что он агргегирует множество российских и не только данных.
- Данные Всемирного Банка – где также есть информация о России http://data.worldbank.org/
- Данные ООН — http://data.un.org/
И многое другое.
Я знаю что многие используют данные из Википедии и DBPedia, кто-то собирает их сам, а кто придумывает что-то своё.
Что можно сделать?
Во первых и в главных – это проекты по понятности государственных финансов. Наглядно представить как устроен бюджет или государственный долг или какая-то отдельная область финансов.
Во вторых, конечно же, бесконечное количество проектов может быть сделано на данных из bus.gov.ru.
Хотите сделать реестр больниц и сравнить их? Они все там.
Хотите сравнить между собой все государственные университеты? И они все там.
Хотите сделать карту доступности госуслуг и такие данные там есть.
Хотите визуализировать бюджеты МГУ, СПБГУ, МИФИ, МИРЭА или любого Вашего любимого университета? И это возможно.
А по историческим данным – просто даже визуализировать их и сравнить с тем что было и тем что есть сейчас – это уже большая и интересная задача.
Зачем это нужно?
Помимо возможности получить вполне материальный приз, а призовой фонд составляет 400 тысяч рублей, конечно же этим всё не ограничивается. Если проект окажется хорошим и интересным то, конечно, он будет упомянут на сайте Минфина и это само по себе дополнительная реклама любому хорошему проекту.
Как принять участие?
Конкурс начался с 23-го декабря и его сайт находится по адресу www.budgetapps.ru. Там есть всё описание, несколько номинаций. Описание того как будет работать жюри и многое другое. Посмотрите, подумайте, и конечно же задавайте вопросы мне. Я буду отвечать тут и или напрямую пишите мне на почту — ibegtin@infoculture.ru
Автор: ibegtin