Команда Яндекса сделала очередной шаг навстречу open source сообществу, опубликовав исходный код YTsaurus. Это платформа для хранения и обработки больших данных, с которой работает большинство фирменных сервисов Яндекса.
Опубликованный на GitHub исходный код распространяется под лицензией Apache 2.0. Использовать платформу или доработать её под себя может любой желающий.
Как отмечают в пресс-службе, YTsaurus — отказоустойчивая и легко масштабируемая платформа. В Яндексе она развёрнута на десятках тысяч серверов и обрабатывает экзабайты данных.
Руководитель отдела технологий распределённых вычислений Максим Бабенко рассказал:
Яндекс ведёт разработку YTsaurus — или YT, как мы называем её внутри — с 2010 года. Мы начали строить собственную экосистему для больших данных, потому что ни одно из имевшихся на рынке решений не удовлетворяло всем нашим требованиям. Сейчас YTsaurus — один из ключевых элементов внутренней инфраструктуры Яндекса. Над платформой работают десятки разработчиков, и её возможности постоянно расширяются.