Рубрика «открытые данные»

Оголяем «данные» и что из этого вышло

2024-10-08 в 10:02, admin, рубрики: визуализация данных, графики, графики и диаграммы, исследование, наука, наука и технологии, наука о данных, открытые данные, стартап, экология

Однажды я задался целью создать устройство, которое измеряло бы качество воздуха — не просто как-то, а с высокой точностью. Проект по разработке устройства привел к созданию NeboAir — недорогого датчика, который претендует на высокую точность. В этом материале я расскажу об испытаниях в реальных условиях и о том, что получилось в итоге.

Оголяем «данные» и что из этого вышло - 1

Зачем это нужно?

Читать полностью »

Как сделать так, чтобы ваши открытые данные были никому не интересны

2024-09-19 в 9:28, admin, рубрики: Creative Commons, open data, лицензии открытых данных, открытая лицензия, открытые данные, скрыть открытые данные, спрятать открытые данные

Читать полностью »

Данные: какие про вас собирают, а какие от вас закрывают?

2023-05-05 в 18:02, admin, рубрики: big data, Большие данные, государство, данные, закон, Законодательство в IT, Законодательство и IT-бизнес, законодательство и ИТ, закрытые данные, открытые данные

Государство активно взяло курс на формирование реестра граждан и наполнение его разнородными данными. Про это высказываются самые разные чиновники после главного шага - введения системы "электронных повесток". К этому готовились. Напомню, что именно было сделано в последние два года для сбора максимального объема данных внутри госсистем.

Государство в декабре принудило все коммерческие компании отдать себе биометрические данные 70 миллионов трудоспособных россиян (закон 211535 о "Единой информационной системе"). Всё что собрали банки, телекомы, интернет-сервисы.
В январе 2023 Путин Читать полностью »

Dolly 2 — открытый аналог ChatGPT со свободной лицензией

2023-04-16 в 10:40, admin, рубрики: AI, Databricks, Dolly, llm, искусственный интеллект, машинное обучение, открытые данные

В конце марта 2023г., компания Databricks выпустила Dolly, большую языковую модель, подобную ChatGPT, дообученную на платформе Databricks Machine Learning Platform. Результат оценки работы модели Dolly показывает, что модель с открытым исходным кодом двухлетней давности (GPT-J) при дообучении на публичном датасете Читать полностью »

(Пере)запускаем отделение Creative Commons в России! Участвуйте и помогайте

2022-12-30 в 20:18, admin, рубрики: Creative Commons, open source, авторское право, Законодательство в IT, копирайт, открытая наука, открытые данные, открытые образовательные ресурсы, публичные лицензии, свободные лицензии, ЮНЕСКО

Привет! Привет всем сторонникам open source, лицензий Creative Commons и прочих альтернативных подходов к авторскому праву! Год назад организация Creative Commons отметила 20 лет с момента основания Читать полностью »

Сервис для оперативной оценки стоимости своих навыков на рынке труда

2022-09-25 в 21:24, admin, рубрики: зарплата, Карьера в IT-индустрии, мода, открытые данные, поиск работы, статистика, Статистика в IT

Введение

Уважаемые читатели, хочу представить Вашему вниманию свой небольшой проект https://sugar-beet.herokuapp.com/, который является воплощением идеи, описанной в своей предыдущей статье Сколько ты стоишь? Метод анализа вакансий с HR-агрегаторов. Стадию развитию его можно определить как MVP. Однако, к сожалению, Heroku отказывается от бесплатного тарифа 28 ноября 2022 года Читать полностью »

Кратко об OData

2022-07-24 в 6:27, admin, рубрики: crud, data, data mining, odata, open data protocol, веб-сервисы, данные, открытые данные, поисковые технологии, протокол, Разработка веб-сайтов, стандарт

Привет! Недавно, пришлось работать на проекте с внешним API. Работал, я, к слову, всегда либо с простым REST, либо с GET/POST only запросами, но в этом нужно было работать с API Timetta. Он использует OData и что же это такое?

Содержание

REST vs OData
Схема
Типы данных
Читать полностью »

Интервью с создателями Organic Maps — открытых мобильных карт на основе OpenStreetMap

2022-06-16 в 19:07, admin, рубрики: open source, OpenStreetMap, organicmaps, интервью, открытые данные

В июне прошлого года вышла первая версия программы Organic Maps — бесплатных мобильных карт для Android и iOS с открытым исходным кодом. Об этом событии я опубликовал небольшую заметку на Хабре. Весь год шла интенсивная разработка, а число установок превысило 100 тысяч. Я решил взять небольшое интервью у разработчиков Organic Maps и обсудить с ними итоги года работы и планы на будущее.

Читать полностью »

Насколько естественен естественный язык? Представляем датасет RuCoLA

2022-05-24 в 9:02, admin, рубрики: github, natural language processing, open source, Исследования и прогнозы в IT, корпус текстов, лидерборд, лингвистика, машинное обучение, открытые данные

В последние годы в области NLP произошла настоящая революция: огромные нейросети, предобученные на сотнях гигабайт текстов, бьют все известные рекорды качества. Но обладают ли такие нейросети чутьём на «естественность» текста, которое есть у носителей языка? Оценка предложения по внутреннему чутью в лингвистике получила название приемлемости; умение давать подобную оценку — ещё один шаг на пути к общему пониманию языка. Чтобы узнать, насколько хорошо нейросети для русского языка справляются с этой задачей, мы публикуем RuCoLA (Russian Corpus of Linguistic Acceptability) — датасет русскоязычных предложений, размеченных по бинарной шкале приемлемости. Это совместный труд команды исследователей и NLP-разработчиков из SberDevices, ABBYY, Yandex Research, Huawei Noah’s Ark Lab и Факультета компьютерных наук ВШЭ. Также мы открываем лидерборд на данных RuCoLA, чтобы любой желающий мог проверить способности своих моделей или поучаствовать в развитии методов для оценки приемлемости.
Читать полностью »

ЕГРЮЛ, доходы и расходы, налоги, количество сотрудников в XML и JSON бесплатно

2022-02-08 в 4:37, admin, рубрики: api, big data, json, XML, бесплатно, Блог компании ITSOFT, доходы и расходы, ЕГРЮЛ, Законодательство в IT, налоги, налоговая, открытые данные, среднесписочная численность, финансы в IT, фнс

Налоговая отдаёт данные ЕГРЮЛ по организации в виде PDF. Посредники за автоматический доступ по API хотят денег. На многих сайтах часть данных закрыто, часть функций недоступны бесплатно, и полно рекламы.

Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «открытые данные»

Оголяем «данные» и что из этого вышло

Зачем это нужно?

Как сделать так, чтобы ваши открытые данные были никому не интересны

Данные: какие про вас собирают, а какие от вас закрывают?

Dolly 2 — открытый аналог ChatGPT со свободной лицензией

(Пере)запускаем отделение Creative Commons в России! Участвуйте и помогайте

Сервис для оперативной оценки стоимости своих навыков на рынке труда

Введение

Кратко об OData

Содержание

Интервью с создателями Organic Maps — открытых мобильных карт на основе OpenStreetMap

Насколько естественен естественный язык? Представляем датасет RuCoLA

ЕГРЮЛ, доходы и расходы, налоги, количество сотрудников в XML и JSON бесплатно

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «открытые данные»

Зачем это нужно?

Введение

Содержание

Новости

Актуальные темы

Архив