Рубрика «Администрирование баз данных» - 4

Яндекс выложил в опенсорс YDB

2022-04-19 в 8:59, admin, рубрики: github, open source, Yandex, ydb, Администрирование баз данных, базы данных, Блог компании Яндекс, высокая производительность, открытый код, СУБД

Сегодня мы выложили в опенсорс систему управления базами данных YDB — плод многолетнего опыта Яндекса в разработке систем хранения и обработки данных. Исходный код, документация, SDK и все инструменты для работы с базой опубликованы на GitHub под лицензией Apache 2.0. Развернуть базу можно как на собственных, так и на сторонних серверах — в том числе в любых облачных сервисах.

Яндекс выложил в опенсорс YDB - 1

YDB решает задачи в одной из самых критичных областей — позволяет создавать интерактивные приложения, которые можно быстро масштабировать по нагрузке и по объёму данных. Мы разрабатывали её, исходя из ключевых требований к сервисам Яндекса. Во-первых, это катастрофоустойчивость, то есть возможность продолжить работу без деградации при отключении одного из дата-центров. Во-вторых, это масштабируемость на десятки тысяч серверов на чтение и на запись. В-третьих, это строгая консистентность данных.

В посте я расскажу об истории развития технологий баз данных, о том, зачем использовать YDB, как её применяют текущие пользователи и какие плюсы для всех несёт выход в опенсорс. А во второй половине поста поговорим о разных вариантах развёртывания.
Читать полностью »

Альтернатива MapReduce при поиске в распределенной БД

2022-03-29 в 10:42, admin, рубрики: tarantool, Администрирование баз данных, Блог компании VK

Привет, меня зовут Сатбек, я работаю в команде Tarantool. Расскажу, как реализовать в шардированном кластере поиск, скорость которого не зависит от количества мастеров и объёма хранимых данных. Условно назову этот способ индексным слоем:

Опишу общую схему построения поиска.
Приведу пример реализации.
Дам рекомендации по разработке.

В статье я последовательно реализую простой CRUD-сервис с шардированным хранилищем, а также поиск по данным. Это поможет вам лучше понять, когда возникают проблемы с поиском по распределённым данным и как их решает индексный слой.

Читать полностью »

SQL HowTo: разные варианты работы с EAV

2022-03-29 в 7:50, admin, рубрики: eav, ERP-системы, explain.tensor.ru, group by, include, intersect, join, postgresql, sql, sql tips and tricks, Администрирование баз данных, Блог компании Тензор

Соблазн использовать модель EAV (Entity-Attribute-Value) при организации структуры БД весьма велик, особенно когда предметная область заранее плохо известна (или разработчик просто не хочет в нее углубляться). Это ведь так удобно - создать "универсальный" способ описания характеристик объектов, который больше не потребует доработок базы ни при появлении новых типов объектов, ни при возникновении новых атрибутов...

Однако, за любую универсальность приходится платить сложностью и производительностью запросов - так что Читать полностью »

Что в глубинах Data Lake? Строим архитектуру, укладываем слои, распределяем ответственность

2022-03-15 в 12:52, admin, рубрики: big data, data governance, data lake, data mesh, Hadoop, Администрирование баз данных, архитектура, базы данных, Блог компании МТС, хранение данных, хранилища данных, хранилище данных

Привет! Меня зовут Григорий Коваль, я технический руководитель Core Data Lake центра Big Data МТС. Сегодня я расскажу о том, какие слои находятся внутри Data Lake, как построить архитектуру базы данных и чем распределенный Data Mesh-подход отличается от монолитного хранения данных.

Что в глубинах Data Lake? Строим архитектуру, укладываем слои, распределяем ответственность - 1

Для создания Data Lake нужен итерационный подход – agile и все, что с этим связано. Еще необходимо правильно организовать работу команд, синхронизировать их распределить ответственность между участниками. Тогда получится прямая связь между пользователями и людьми, которые развивают витрины данных или домены. В этой статье поговорим о задачах, архитектуре и проблемах развития Data lake, а также обсудим способы решения возникающих проблем, специфику процессов и перспективы развития. Читать полностью »

Особенности проекта Debezium для решения задачи миграции баз данных

2022-03-09 в 7:01, admin, рубрики: Администрирование баз данных, Блог компании ГК ЛАНИТ, консист, консист бизнес групп, Ланит, миграция, миграция бд, миграция данных, Программирование, Тестирование IT-систем

С 2014 года в России реализуется программа импортозамещения, которая распространяется в том числе на программное обеспечение и системы управления базами данных, поднимая вопросы оптимальной миграции. В этой статье мы, специалисты департамента разработки «Консист Бизнес Групп», расскажем про особенности проекта Debezium для обеспечения миграции баз данных с разбором нагрузочного тестирования миграции.

Читать полностью »

Новая возможность защиты данных в MariaDB

2022-01-30 в 10:14, admin, рубрики: acronis, mariadb, Администрирование баз данных, антивирусная защита, Блог компании Acronis, защита данных, информационная безопасность, резервное копирование

Читать полностью »

Борьба с TOAST или будущее JSONB в PostgreSQL

2022-01-23 в 21:26, admin, рубрики: high performance, highload, json, jsonb, postgres, postgresql, postgresql performance, toast, Администрирование баз данных, бенчмарки, Блог компании Конференции Олега Бунина (Онтико), высокая производительность, исследования в it, хранилища данных

В PostgreSQL есть два типа данных: JSON и JSONB. Первый формат является текстовым хранилищем, в котором json хранится "as is", второй — бинарным, в нем ключи отсортированы (сначала по длине ключа, а потом по его названию), дубликаты удалены, а пробелы удалены. Этот SQL-запрос иллюстрирует различие между JSON и JSONB:

Читать полностью »

Настройка PostgreSQL под Linux

2021-11-23 в 8:05, admin, рубрики: lsFusion, open source, postgresql, администрирование linux-систем, Администрирование баз данных, Администрирование БД

Время от времени приходится слышать мнение от некоторых системных администраторов, а также некоторых 1С-разработчиков, что установка, настройка и поддержка PostgreSQL под Linux очень сложна. Что гораздо дешевле покупать лицензии Windows и Microsoft SQL Server, чем нанимать высококвалифицированных администраторов, которые будут администрировать все эти open-source системы.

Читать полностью »

Как я на порядок ускорил переподключение к мастер-узлу в Redis Sentinel

2021-11-17 в 9:19, admin, рубрики: Go, redis, Sentinel, Администрирование баз данных, Блог компании Флант, Серверное администрирование, системное администрирование

Не так давно, развернув в Kubernetes уже привычный инфраструктурный компонент в виде кластера Redis Sentinel + redis-sentinel-proxy, мы столкнулись с интересными проблемами. При тестировании времени переключения мастера выяснилось, что оно составляет полторы минуты. Это очень долго.

Как я на порядок ускорил переподключение к мастер-узлу в Redis Sentinel - 1

Читать полностью »

MySQL в Docker не может писать slow-логи в -dev-stderr

2021-09-10 в 8:20, admin, рубрики: docker, mariadb, mysql, slow log, Администрирование баз данных, Блог компании Флант, системное администрирование

Прим. перев.: в процессе поиска решения проблемы с логированием медленных запросов MySQL наткнулся на довольно познавательную статью. Её автор не только в деталях описывает своё расследование, которое может оказаться полезным для начинающих администраторов, но и попутно пробуждает чувства ностальгии по эпохе VT100.

Краткое содержание:

MySQL работает под пользователем mysql без root-прав.
Контейнер Docker использует Alpine, само собой. А как иначе?
Попытка сделать так, чтобы пользователи без root-прав могли записывать в /dev/stderr и /dev/stdout, похоже, провалилась.
Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «Администрирование баз данных» - 4

Яндекс выложил в опенсорс YDB

Альтернатива MapReduce при поиске в распределенной БД

SQL HowTo: разные варианты работы с EAV

Что в глубинах Data Lake? Строим архитектуру, укладываем слои, распределяем ответственность

Особенности проекта Debezium для решения задачи миграции баз данных

Новая возможность защиты данных в MariaDB

Борьба с TOAST или будущее JSONB в PostgreSQL

Настройка PostgreSQL под Linux

Как я на порядок ускорил переподключение к мастер-узлу в Redis Sentinel

MySQL в Docker не может писать slow-логи в -dev-stderr

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «Администрирование баз данных» - 4

Новости

Актуальные темы

Архив