Компания Яндекс заявила, что она вместе с Институтом системного программирования имени В. П. Иванникова РАН и Сеченовским Университетом впервые в России на практике применила федеративное машинное обучение. Его также называют совместным: оно предназначено для проектов, где есть несколько участников с собственными наборами данных (датасетами). Федеративный подход позволяет участникам коллективно обучать нейросети, никому не передавая свои данные.
Сперва модель обучается на каждом из датасетов участников проекта. На центральный сервер передаются не сами датасеты, а результаты их обработки. Именно на них затем обучается глобальная модель. Таким образом, датасеты на протяжении всего процесса обучения не покидают контуры организаций — и никто, кроме владельцев, не может получить к ним доступ. Яндекс отмечает, что в таких проектах смогут участвовать компании из отраслей, где имеют дело с «чувствительной» информацией: например, финансов, медицины или промышленности.
Яндекс, ИСП РАН и Сеченовский Университет Минздрава России, используя федеративный подход, создали нейросеть, которая по данным электрокардиограмм выявляет фибрилляцию предсердий — одну из наиболее распространённых патологий сердца. Для обучения использовались два независимых датасета с электрокардиограммами: от Сеченовского университета и от ИСП РАН. Оба партнёра провели раунды обучения на своей стороне, а затем передали результаты в общий контур.
В будущем воспользоваться федеративным машинным обучением смогут клиенты Yandex Cloud. Новый подход позволит участвовать в совместных проектах организациям, которые раньше не могли сотрудничать из-за рисков, связанных с передачей конфиденциальных данных. В Яндексе считают, что это повысит качество итоговых моделей — чем больше партнёров в проекте, тем больше данных для обучения. Кроме того, федеративный метод будет полезен тем, которых разделяют большие расстояния.