Новая сетевая задачка из необычных.
Вот упрощённая топология:
Имеем опорную сеть, с запущенным MPLS TE. Поверх сети организована услуга VPLS для крупного клиента.
Между маршрутизаторами натянуты TE-Туннели, в которые трафик VPLS заворачивается с помощью политик.
Какое оборудование стоит за нашими маршрутизаторами, можно только догадываться, но мы доверяем их QoS меткам и знаем, что основной тип трафика идёт с метками EF.
Одним чудесным утром всё пропало — два линка, изображённые красным, упали (физически, порвали оптику, например). И как бы логично, что стали недоступны узлы 2 и 3. Но вот странность: вслед за ними клиент стал жаловаться на проблемы с узлом 4 — сервисы тоже перестали работать. После восстановления повреждённых линий всё починилось на всех узлах.
Внимание, знатоки, вопрос: кто виноват и что делать?
Автор: eucariot