Главная

Рубрика «обработка данных»

Эксперимент по ускорению SQLite

2025-01-10 в 13:01, admin, рубрики: ruvds_перевод, sqlite, базы данных, бессерверные вычисления, исследования в it, обработка данных, оптимизация, периферийный вычисления

SQLite быстра, но можно ли сделать её ещё быстрее? Исследователи из Университетов Хельсинки и Кембриджа задались этим вопросом и опубликовали работу Serverless Runtime / Database Co-Design With Asynchronous I/O. В ней они продемонстрировали возможность 100-кратного снижения времени задержки, и ниже я в общих чертах эту их работу прокомментирую.

Речь пойдёт об исследовании возможностей Limbo — переписанной на Rust версии SQLite.Читать полностью »

GPT: Революция или Апокалипсис

2024-12-13 в 15:53, admin, рубрики: gpt, аналитик данных, нейросети, обработка данных, оптимизация запросов, очистка данных, современные технологии, тренды, хитрости программирования, человек vs компьютер

Введение

Статей о GPT написано уже немало, и многие знакомые мне аналитики заявляют, что ни разу не использовали его возможности. Ввиду этого, я хочу подробно раскрыть эту тему, предоставив практические примеры и доказательства эффективности.

Читать полностью »

Миф о чистых данных: почему ваш аналитик похож на сапёра

2024-12-01 в 10:16, admin, рубрики: data quality, визуализация данных, витрина данных, данные, обработка данных, очистка данных, ошибки в бизнесе, подготовка данных, целостность данных

Представьте: вы — аналитик данных, перед вами — гора необработанных данных, и каждый неверный шаг может привести к катастрофическим последствиям для бизнеса. Звучит как сценарий фильма-катастрофы? К сожалению, для многих аналитиков это повседневная реальность.

Часто, начиная проект по бизнес-аналитике, заказчик заявляет: «У нас идеально чистые данные, просто заходите и визуализируйте!» Эта фраза, увы, часто предвещает долгие часы кропотливой работы по очистке, обогащению и агрегации данных — настоящее разминирование информационного поля.

Читать полностью »

Создаём свой реестр данных на основе ФГИС «Аршин». Часть 1 — добавляем данные в PostgreSQL и сокращаем размер БД

2024-10-19 в 8:15, admin, рубрики: pandas, postgresql, sqlalchemy, АРШИН, обработка данных, реестр данных

Всем привет. Этот практический цикл статей рассчитан на начинающих. Я решил поделиться своим опытом создания реестра данных на основе государственного. Данные будут храниться в базе данных PostgreSQL, доступ к ним будет осуществляться через Fast API. В текущей статье займёмся загрузкой данных в базу и уменьшением её размеров.

Введение

Нам предстоит работать с данными о результатах поверки средств измерений, которые будем загружать из раздела сайта «Результаты поверок СИ Читать полностью »

Проблемы защиты персональных данных в мире искусственного интеллекта

2024-09-17 в 4:18, admin, рубрики: ml, защита данных пользователей, обработка данных, персональные данные

Искусственный интеллект сейчас, по большому счету, везде. В любой отрасли нам говорят о том, что в ней используются нейросети, машинное обучение и другие направления ИИ. Не стали исключением и системы, связанные с обработкой персональных данных пользователей. В этой статье мы поговорим о том, как связаны искусственный интеллект и защита персональных данных.

Риски при обработке данных ИИ

Читать полностью »

Итоги ICDAR-2024: Как и зачем нужно делать распознавание объяснимым

2024-09-11 в 8:26, admin, рубрики: icdar, ocr, OCR-технологии, ИИ, обработка данных, обработка изображений, распознавание документов, распознавание паспорта, распознавание речи, репортаж

Встречи в рамках ICDAR имеют первостепенную значимость для научного сообщества по всему миру. Источник: сайт ICDAR. — *Встречи в рамках ICDAR имеют первостепенную значимость для научного сообщества по всему миру. Источник:* *сайт ICDAR*.

Почему ICDAR?

Море, солнце, ~~пляж~~Читать полностью »

Прекратите клепать базы данных

2023-12-05 в 22:07, admin, рубрики: sql, клиент, микроменеджмент, обработка данных, сервер

В жизни каждого инженера‑фронтендера наступает момент, когда осознаёшь: далее не обойтись без кэширования данных из API. Всё может начаться с самых невинных вещей: сохраняем предыдущую страницу с данными, чтобы кнопка «Назад» срабатывала мгновенно; реализуем простенькую логику отмены действия или обеспечиваем слияние нескольких состояний от различных запросов к API. Но все мы знаем, чем такое кончается. Один за другим возникают запросы на новые фичи, и вскоре мы уже не покладая рук реализуем кэши данных, индексы для работы вручную, оптимистические мутации и рекурсивную инвалидацию кэша.

Читать полностью »

Анализ статей Хабрахабр

2021-10-09 в 15:53, admin, рубрики: Алгоритмы, визуализация, визуализация данных, обработка данных, парсинг, поиск закономерностей, Программирование, статистика, хабрахабр

Решила повторить исследование, сделанное в 2017 году и посмотреть, что изменилось за 5 лет. Ссылка на предыдущую статью Анализ статей Хабрахабр и Geektimes. Дизайн сайта изменился, поэтому делала все в jupyter python, а не wolfram mathematica. Далеко не все графики удалось воспроизвести заново. Получился анализ более чем 260000 статей.

Результаты обработки данных

Пользователи iFunny ежедневно загружают в приложение около 100 000 единиц контента, среди которого не только мемы, но и расизм, насилие, порнография и другие недопустимые вещи.

Читать полностью »

Публикации RSS | Комментарии RSS

https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js

Информация

Обсуждаемое

Рекомендуем

Рубрика «обработка данных»

Эксперимент по ускорению SQLite

GPT: Революция или Апокалипсис

Введение

Миф о чистых данных: почему ваш аналитик похож на сапёра

Создаём свой реестр данных на основе ФГИС «Аршин». Часть 1 — добавляем данные в PostgreSQL и сокращаем размер БД

Введение

Проблемы защиты персональных данных в мире искусственного интеллекта

Риски при обработке данных ИИ

Итоги ICDAR-2024: Как и зачем нужно делать распознавание объяснимым

Почему ICDAR?

Прекратите клепать базы данных

Анализ статей Хабрахабр

Результаты обработки данных

Анализ хабов

Дообучаем готовую нейросеть для классификации данных

Как классифицировать данные без разметки

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «обработка данных»

Введение

Введение

Риски при обработке данных ИИ

Почему ICDAR?

Результаты обработки данных

Анализ хабов

Новости

Актуальные темы

Архив