
Всем привет! Это Миша Степнов, руководитель центра R&D Big Data в МТС Диджитал.
Сегодня все говорят о цифровой трансформации и внедрении искусственного интеллекта в бизнес-процессы. Но многие забывают, что ИИ без данных не бывает. Именно качественные, актуальные и правильно структурированные данные определяют успех проекта в области машинного обучения и глубокого анализа.
Чтобы модели не «предвзято учились» и не «выдавали мусор», нужно обеспечивать непрерывные R&D-процессы по управлению данными: от сбора и очистки до хранения и быстрых итераций над ними. И тут возникает важное понятие AI Ready Data: все, что касается доступности данных, их формата и актуальности, должно быть продумано заранее и поддерживаться на высоком уровне качества.
Умение грамотно управлять данными — это уже не «хороший тон», а конкурентное преимущество. Но как прокачивать навыки работы с ними? Один из способов — читать правильную литературу. Так что в этом посте поделюсь списком книг о базовых принципах реляционных баз данных и SQL, продвинутых инструментах и языках программирования и многом другом. Забирайте в закладки, а при желании дополняйте подборку в комментариях.
Введение в системы баз данных
Автор: Кристофер Дейт

Фундаментальный труд, который подойдет студентам, разработчикам, инженерам данных и всем, кто хочет глубже разобраться в принципах реляционных баз данных.
Дейт подробно разбирает теоретические и практические аспекты работы с системами управления базами данных (СУБД). Рассматривает основы реляционной модели, нормализацию данных, взаимодействие с SQL, принципы транзакций, индексацию и оптимизацию запросов. Много внимания уделяется логической организации данных. Автор объясняет, почему БД работают именно так, а не иначе.
В отличие от большинства книг по SQL, именно эта дает более глубокое понимание архитектуры и концепций СУБД. Так что издание будет полезно не только для программистов, но и для архитекторов и аналитиков.
Сильные стороны книги:
-
Глубина проработки темы: книга охватывает не только практику, но и принципы проектирования баз данных, помогая понять их изнутри.
-
Фундаментальные знания: многие идеи, изложенные Дейтом, остаются актуальными независимо от конкретных технологий и СУБД.
-
Последовательная подача материала: книга написана по принципу «от простого к сложному». Так что можно начать с нуля и постепенно перейти к комплексным темам.
«Введение» — отличный выбор для всех, кто хочет понять внутреннее устройство и логику работы баз СУБД.
Путеводитель по базам данных
Автор: Владимир Комаров

«Путеводитель» будет полезен для ИТ-специалистов, которые хотят глубже разобраться в устройстве современных систем управления базами данных (СУБД). Книга пригодится тем, кто только начинает использовать базы данных, и профи, которые хотят расширить свои знания.
Что внутри? Владимир Комаров подробно объясняет, как работают базы данных, в чем их ключевые отличия и какие задачи они решают. В книге рассматриваются реляционные и NoSQL-базы, вопросы индексирования, репликации, транзакций, шардирования и масштабирования. Автор объясняет, какие механизмы лежат в основе MySQL, PostgreSQL, MongoDB, Redis и других систем. Это не просто справочник по SQL-запросам, а руководство по выбору и оптимизации баз данных для конкретных сценариев. Книга насыщена примерами и иллюстрациями, что помогает лучше усвоить материал.
Сильные стороны книги:
-
Глубокий технический разбор: автор приводит большое количество информации по внутреннему устройству СУБД. Так что читателю будет относительно просто разобраться в принципах работы технологий.
-
Доступность изложения: несмотря на техническую сложность темы, написано доступным языком. Скучно не будет.
Я бы рекомендовал книгу всем, кто хочет понять, как работают СУБД, и научиться эффективно использовать их возможности в своих проектах.
MySQL по максимуму. 4-е издание
Авторы: Сильвия Ботрос и Джереми Тинли

Книга предназначена для инженеров, которые хотят улучшить свой опыт работы с MySQL. Она будет полезна и начинающим, и опытным специалистам.
Авторы предлагают проверенные стратегии масштабируемой эксплуатации MySQL с применением современной архитектуры и новейших инструментов и практик. Охватывают все аспекты работы с MySQL: от постановки целей уровня обслуживания и проектирования схем до настройки сервера, операционной системы и оборудования. Разбирают масштабирование приложений с помощью репликации, балансировку нагрузки, обеспечение высокой доступности и отказоустойчивости.
В издании учтены последние достижения в области облачного и самостоятельного
Сильные стороны:
-
Практическая направленность: авторы показывают конкретные шаги и методы, которые можно сразу внедрить в работу.
-
Актуальность: обновленное издание учитывает последние тенденции и технологии в области MySQL.
-
Глубокий технический разбор: составители детально объясняют внутреннее устройство MySQL и стратегии ее масштабирования.
Книга станет ценным ресурсом для тех, кто планирует научиться эффективно использовать MySQL-возможности в своих проектах.
Нечеткое сопоставление данных в SQL
Автор: Джим Лемер

Отличная книга для всех, кто работает с базами данных и регулярно сталкивается с проблемой дубликатов, грязных данных и несовпадающих записей. Полезна разработчикам, аналитикам, администраторам БД, и всем, кто хочет научиться чистить и сопоставлять данные прямо в SQL.
Джим Лемер рассказывает, как находить дубликаты, сравнивать данные из разных источников и исправлять ошибки в записях с помощью SQL. В книге объясняются методы нечеткого сопоставления строк, исправления опечаток, разные форматы имен и адресов, а также поиск похожих записей без точного совпадения. Автор показывает практические техники работы с текстом, парсингом и извлечением данных, которые помогают улучшать качество данных и делать аналитику точнее.
Сильные стороны книги:
-
Решает реальные проблемы: как находить ошибки в данных, очищать их и правильно объединять разрозненные записи.
-
Работающие примеры: все методы можно сразу применять в SQL, без сложных внешних инструментов.
-
Подходит для любых сфер: независимо от того, банковские это базы, маркетинговые списки или клиентские данные, книга помогает работать с несовершенными данными.
Если вы сталкиваетесь с дубликатами, очисткой БД или необходимостью сопоставлять разнородные данные, эта книга поможет разобраться, как делать это эффективно и без лишних сложностей.
SQL Server. Наладка и оптимизация для профессионалов
Автор: Дмитрий Короткевич

Книга предназначена в первую очередь для разработчиков и администраторов, которые работают с Microsoft SQL Server. Автор помогает понять, почему, например, база тормозит и как это исправить. Если нужно настроить сервер, оптимизировать запросы, снизить нагрузку на процессор и диск, то здесь есть четкие инструкции и разбор реальных проблем.
Дмитрий Короткевич объясняет, как SQL Server устроен изнутри и что влияет на его производительность. Он рассказывает, как выявлять узкие места — от проблем с диском и памятью до медленных запросов, блокировок и высокой нагрузки на процессор. В книге подробно разбирается, как работают индексы, статистика, кеширование и конкурентный доступ. Автор показывает практические приемы оптимизации: какие настройки менять, как улучшить планы выполнения запросов и что делать, если все работает слишком медленно.
Сильные стороны книги:
-
Объясняет, как SQL Server функционирует: вместо магических «прикрути индекс, и все полетит» — логика и причины проблем.
-
Практика без воды: реальные примеры, разбор узких мест и советы, которые работают.
-
Подходит для всех версий SQL Server: принципы из книги актуальны как для локальных серверов, так и для облачных решений.
Если SQL Server постоянно загружен, запросы тормозят, а сервер работает не так, как хотелось бы, эта книга поможет разобраться, в чем проблема. А еще — настроить базу так, чтобы все летало.
Если читали книги из списка, напишите, как впечатления. И, как уже писал выше, будет здорово, если бы дополните подборку в комментариях.
Автор: Michail_Stepnov