Программа CassandraConf.ru

в 12:01, , рубрики: cassandra, nosql, Администрирование баз данных, базы данных, Блог компании IT-People, конференция, метки: , , , ,

Расписание и тезисы докладов готовы и доступны на сайте CassandraConf.ru. Итак, что нас ждет 9 декабря:
image

Иностранные докладчики:

Jonathan Ellis, cооснователь DataStax и руководитель проекта Apache Cassandra
Apache Cassandra 2.0 and 2.1

This talk will explain why Apache Cassandra is the leading big data NoSQL database, with examples from real-world production use cases such as Adobe, CERN, eBay, Instagram, and Spotify. It will explain the architecture behind Cassandra performance, scalability, and reliability, as well as give an introduction to application data modeling.

At the end of this session you will have an good understanding of role Cassandra plays in modern scale-out architectures. You will also learn about the new features in Cassandra 2.0 and the upcoming 2.1 release.

Axel Liljencrantz, backend developer музыкального сервиса Spotify
Cassandra performance. Underlying details of the compaction strategies

This talk will underlying details of the different compaction strategies with a focus on leveled compaction. Understanding how a specific write pattern will interact with compaction is one of the biggest pieces to understanding Cassandra performance.

Ruth Stryker, Technical Trainer в DataStax
CQL and the DataStax Java Driver

This is an introductory session to CQL (Cassandra Query Language) and the DataStax Java Driver, suitable for attendees that are new to Cassandra or have a Thrift background but are new to CQL. In this session, you’ll first learn what CQL is, why it was created, how it is used, what CQL and cqlsh commands exist, and how CQL rows relate to Cassandra internal storage rows. Then, you’ll learn what the DataStax Java Driver is for, how to install it, how it works, and how to execute CQL expressions through it.

Aleksey Yeschenko, Apache Cassandra committer, DataStax
Моделирование данных с помощью CQL3

В докладе речь пойдет о временных рядах, коллекциях, вторичных индексах, CAS и пользовательских типах (2.1)

Николай Алименков, Technical Lead в ZoralLabs, тренер в XP Injection
Организация высоконагруженных очередей в Cassandra

Всем известно, что Cassandra представляет собой NoSQL решение для хранения данных. Но часто для обработки этих данных используется система очередей, которая реализуется с помощью других инструментов. За счет этого появляется неконсистентность по данным и дополнительный уровень для поддержания. Так как для одного из наших продуктов все данных хранятся именно в Cassandra, мы разработали свое решение для очереди, которое автоматически приобрело много полезных качеств: масштабирование, высокую доступность, гибкость. Это решение и будет представлено в докладе.

Трек для опытных разработчиков

Олег Анастасьев, ведущий разработчик проекта Одноклассники
Ближе к Cassandra

Способ использования Cassandra немного необычен — мы не используем thrift или нативный протокол, основанный на netty, для того, чтобы работать с Cassandra с использованием только встроенного языка запросов, как с обычной СУБД. Вместо этого, мы объединяем ноду Cassandra в той же JVM с бизнес сервисом хранилища данных. Клиенты используют уже бизнес-ориентированные сетевые запросы для работы с таким хранилищем.
Так мы уменьшаем количество сетевых обращений и трафика. Также, это позволяет нам делать небольшие хаки встроенной логики обработки данных, которые позволяют строить распределенные хранилища данных более эффективно и легко.
В докладе мы расскажем о практическом применении данного подхода на примере трех, самых интересных, хранилищ данных в Одноклассниках.

Ольга Соболева и Кирилл Иванов, СКБ Контур
Обработка транзакций на примере телекоммуникационной компании

В докладе на примере биллинга сотового оператора будет рассмотрена модель сервиса, тесно интегрированного с Кассандрой. Будет рассказано, как менялись требования, как эволюционировала система и как при этом менялась архитектура Кассандры. Доклад будет интересен тем, кто хочет узнать, как решаются проблемы хранения данных при использовании Кассандры.

Иван Бурмистров и Федор Фоминых, СКБ Контур
Строго ориентированная последовательность временных событий

Кассандра – хорошо масштабируемое хранилище данных, в котором все узлы равноправны. Это большой плюс для отказоустойчивости и простоты настройки, однако при такой архитектуре решение некоторых задач усложняется. К такой задаче относится задача сохранения и извлечения объектов в хронологическом порядке. Эту задачу можно решать с помощью временных рядов, которые хорошо реализуются в кассандре (прочитать про них можно, например, тут). Однако классические временные ряды не гарантируют, что в каждый момент времени все клиенты, читающие объекты временного ряда, получат одинаковый результат. Это происходит, потому что время объекта, фигурирующего во временном ряде, определяется клиентом. Поэтому объект с бОльшим временем может записаться раньше. Но бывают ситуации, когда порядок объектов важен, и важно всегда возвращать объекты в одинаковом порядке. В докладе будет рассказана модификация классических временных рядов, лишенная этого недостатка. Доклад будет интересен всем, кому интересны задачи, которые можно решить с помощью кассандры.

Александр Сабинин, Kaspersky Lab
Организация очереди задач для сканирующего робота

В рамках деятельности лаборатории контентной фильтрации существует задача поддержания в актуальном состоянии информации о доменах, посещаемых пользователями продуктов Лаборатории Касперского. База доменов насчитывает несколько десятков миллионов записей и постоянно пополняется. Информация о каждом конкретном сайте определяется специализированными технологиями. Очевидно, что содержимое веб-ресурсов может динамически меняться, и это требует регулярного их пересканирования. По этой причине возникла необходимость выработать определенный набор эвристик расчета интервала пересканирования ресурсов в зависимости от наиболее существенных факторов. Кроме того, есть необходимость оперативно добавлять задания и управлять очередностью их выполнения. Эти факторы не позволяют обойтись фиксированным порядком пересканирования ресурсов и требуют более гибкого подхода.

При анализе существующих решений Cassandra была выбрана как надежное хранилище данных с высокой пропускной способностью и предоставляющее гибкость для дальнейших модификаций данных. О том, как именно Cassandra используется в Лаборатории Касперского и пойдет речь в докладе.

Трек для начинающих разработчиков

Евгений Тихонов, СКБ Контур
Введение в Cassandra

Cassandra – относительно молодое хранилище данных. В своём докладе я хочу немного погрузить слушателей в ее устройство, показать насколько мощным и в тоже время простым является этот инструмент. Из доклада вам станет ясно, как данные распределяются в кластере, как работает координатор запросов и какие процессы протекают в одной ноде при обработке запроса.

Доклад будет полезен новичкам, которые только начали работу с Cassandra, а так же тем, кто хочет вкратце узнать, как в общих чертах работает кластер Кассандры.

Александр Соловьев, ex GridDynamics contractor
Cassandra in e-commerce

В докладе будет описан процесс перехода одного проекта на хранение данных при помощи Cassandra. Для начала мы остановимся на изначальных условиях, в которых решение о переходе было принято high-level архитектура, причины миграции с In-Memory Data Grid на Cassandra, требования к производительности системы, которых мы хотели достичь. Затем будут описаны шаги, которые помогли улучшить производительность (TPS и/или latency). Также я расскажу и о том, что не привело к существенному улучшению, и объясню, почему некоторые наши гипотезы не сработали.

Максим Сычев и Александр Коковин, СКБ Контур
Как мы переезжали на Cassandra

В докладе мы расскажем, почему решили заменить свою систему хранения и почему остановили свой выбор именно на Cassandra. Опишем трудности, с которыми пришлось столкнуться при замене хранилища и способы их решения. Также отдельно остановимся на сценариях использования Cassandra, практикуемых нами в настоящий момент (очередь задач и индексация данных поверх Cassandra).

Евгений Курпилянский, СКБ Контур
Индексирование поверх Cassandra

Cassandra — хорошо масштабируемое, надежное хранилище данных. Однако она не позволяет эффективно выполнять сложные поисковые запросы. На докладе будет рассказано о том, как индексировать данные из Кассандры в SQL-хранилище. Этот подход позволит выполнять произвольные SQL-запросы к вашим данным и при этом сохранит важные свойства вашей системы (такие как масштабируемость, отказоустойчивость и другие)


В финале конференции мы планируем 30 минут на полюбившийся формат Lightning Talks — короткие пятиминутные выступления без ответов на вопросы, где все желающие смогут поделиться своими кейсами использования Cassandra, техническими решениями и наболевшими вопросами. Если уже сейчас понимаете, что вам есть что сказать — пишите на elena@it-people.ru.

После официальной части — afterparty в кафе InSalad (Горького 63). Можно будет пообщаться с братьями по интересам, задать вопросы спикерам в неформальной обстановке. Будет весело!

Итак, еще раз.

9 декабря. с 10.00 до 19.30.
Екатеринбург, Конференц-зал гостиницы Novotel на Энгельса 7.
Расписание и регистрация — на CassandraConf.ru

До встречи :)

p.s. Видеозапись докладов будет в открытом доступе через пару недель после мероприятия.

Автор: elena_voronina

Источник

* - обязательные к заполнению поля


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js