Привет! Недавно, пришлось работать на проекте с внешним API. Работал, я, к слову, всегда либо с простым REST, либо с GET/POST only запросами, но в этом нужно было работать с API Timetta. Он использует OData и что же это такое?
Рубрика «открытые данные» - 2
Кратко об OData
2022-07-24 в 6:27, admin, рубрики: crud, data, data mining, odata, open data protocol, веб-сервисы, данные, открытые данные, поисковые технологии, протокол, Разработка веб-сайтов, стандартИнтервью с создателями Organic Maps — открытых мобильных карт на основе OpenStreetMap
2022-06-16 в 19:07, admin, рубрики: open source, OpenStreetMap, organicmaps, интервью, открытые данныеВ июне прошлого года вышла первая версия программы Organic Maps — бесплатных мобильных карт для Android и iOS с открытым исходным кодом. Об этом событии я опубликовал небольшую заметку на Хабре. Весь год шла интенсивная разработка, а число установок превысило 100 тысяч. Я решил взять небольшое интервью у разработчиков Organic Maps и обсудить с ними итоги года работы и планы на будущее.
Насколько естественен естественный язык? Представляем датасет RuCoLA
2022-05-24 в 9:02, admin, рубрики: github, natural language processing, open source, Исследования и прогнозы в IT, корпус текстов, лидерборд, лингвистика, машинное обучение, открытые данные
В последние годы в области NLP произошла настоящая революция: огромные нейросети, предобученные на сотнях гигабайт текстов, бьют все известные рекорды качества. Но обладают ли такие нейросети чутьём на «естественность» текста, которое есть у носителей языка? Оценка предложения по внутреннему чутью в лингвистике получила название приемлемости; умение давать подобную оценку — ещё один шаг на пути к общему пониманию языка. Чтобы узнать, насколько хорошо нейросети для русского языка справляются с этой задачей, мы публикуем RuCoLA (Russian Corpus of Linguistic Acceptability) — датасет русскоязычных предложений, размеченных по бинарной шкале приемлемости. Это совместный труд команды исследователей и NLP-разработчиков из SberDevices, ABBYY, Yandex Research, Huawei Noah’s Ark Lab и Факультета компьютерных наук ВШЭ. Также мы открываем лидерборд на данных RuCoLA, чтобы любой желающий мог проверить способности своих моделей или поучаствовать в развитии методов для оценки приемлемости.
Читать полностью »
ЕГРЮЛ, доходы и расходы, налоги, количество сотрудников в XML и JSON бесплатно
2022-02-08 в 4:37, admin, рубрики: api, big data, json, XML, бесплатно, Блог компании ITSOFT, доходы и расходы, ЕГРЮЛ, Законодательство в IT, налоги, налоговая, открытые данные, среднесписочная численность, финансы в IT, фнс
Налоговая отдаёт данные ЕГРЮЛ по организации в виде PDF. Посредники за автоматический доступ по API хотят денег. На многих сайтах часть данных закрыто, часть функций недоступны бесплатно, и полно рекламы.
Дефицита нет, менеджмент эффективен
2022-02-01 в 7:02, admin, рубрики: история, менеджмент, открытые данные, управление персоналом, Читальный залЭта статья является продолжением материала "Читать полностью »
Преступность в США и России: сравнительный обзор
2022-01-27 в 1:24, admin, рубрики: geopandas, pandas, python, визуализация данных, Инфографика, открытые данные, преступления, Россия, статистика, статистический анализ, СШАМотивация и цель исследования
Цель исследования -- на основе анализа открытых статистических данных сравнить ситуацию с преступностью в США и России и попытаться понять:
-
какие преступления количественно преобладают;
-
как изменяется преступность по годам;
-
каков уровень преступности в удельном выражении (на 1 млн. населения);
-
как указанные параметры распределяются территориально -- по штатам США и регионам России.
Источники данных
Для анализа используются только открытые официальные данные:
-
Количество совершенных преступлений по основным преступлениям (Читать полностью »
Ларри Лессиг о создании Creative Commons 20 лет назад: «Мы были лучше, чем казались. Раньше наша доброта не была видна»
2021-12-31 в 17:21, admin, рубрики: Creative Commons, open source, Законодательство в IT, копирайт, открытые данные
В таком интервью один из основателей Лоуренс Лессиг вспомнил, что 20 лет назад весь мир спорил о двух переменах. Технологии дали возможность делиться контентом в больших масштабах, но законы были изменены так, чтобы всё больше контролировать доступ к контенту и его распространение. Обе стороны находились в состоянии «гонки вооружений». И многие люди боялись, что такой закон победит технологии в этой войне.
Как сказал Лессиг, некоторые из нас подумали, может ли быть что-то другое, кроме системы «все права сохранены». Мы могли бы попытаться создать схему «некоторые права сохранены». Лессиг задался вопросом: «вместо того, чтобы говорить «нет», можно ли сделать пометку „да, пожалуйста, возьми то, что я создал, и поделись с другими“?». Мы не хотели сказать музыкантам, что их работа должна быть бесплатной. Мы не хотели сказать режиссеру, что он не может продавать билеты. Мы не хотели никому грозить пальцем, мы просто хотели дать каждому возможность делать то, что человек хочет делать. Правда в том, что успехи CC не были достигнуты критикой других людей. Вместо этого CC просто дала лёгкую возможность делать правильные вещи, делать то, что автор считает правильным.
«Запуск» лицензий состоялся уже в Сан-Франциско 16 декабря 2002 года. К сотням собравшихся обратились сам Лессиг, Джон Перри Барлоу (автор Декларации независимости киберпространства) и, что необычно, Джек Валенти (лоббист от киноиндустрии).
Открытые данные Министерства культуры РФ — оказались не открытыми данными
2021-12-02 в 8:18, admin, рубрики: авторское право, безумие, Законодательство в IT, информационная безопасность, копирайт, музей, Научно-популярное, общественное достояние, открытые данные, фотографииМы узнали об этом, изучая ситуацию, которая сложилась вокруг использования открытых данных с сайта Министерства культуры РФ. Сначала Минкульт воплотил в них общедоступную информацию. Но затем Минкульт решил, что пора ограничить использование этих открытых данных.
Что такое Госкаталог Музейного фонда?
Находим аномалии в российской статистике COVID-19
2021-11-06 в 13:22, admin, рубрики: COVID-19, matplotlib, pandas, python, визуализация данных, здоровье, коронавирус, открытые данные, статистикаЧто же не так с любыми электронными голосованиями?
2021-09-25 в 15:17, admin, рубрики: data mining, выборы, выборы в госдуму, дэг, криптография, открытые данные, Статистика в IT, Тестирование IT-систем, электронное голосование
Данная публикация написана по мотивам поста «Что же не так с ДЭГ в Москве?». Его автор описывает, как можно выгрузить и расшифровать данные по электронному голосованию, а также приводит целый список замечаний к его текущей системе.

