В семействе процессоров Intel Atom C2000 присутствует баг, который выводит из строя устройства Cisco и других производителей (точный список продуктов известен для Cisco, но не для других компаний: проверьте, какой чип установлен в вашем оборудовании). Баг действует словно бомба замедленного действия, проявляясь не сразу, а только примерно через 1,5 года активной эксплуатации или позже.
На конференции для инвесторов по итогам IV кв. 2016 года финансовый директор Intel Роберт Свон (Robert Swan) упомянул о проблеме с одним из продуктов в IV кв. 2016 года, что повлияло на финансовые показатели. Финансист не сказал, о каком конкретно продукте говорит. Но всё тайное рано или поздно становится явным.
Роберт Свон сказал инвесторам о «проблеме с качеством», из-за которой «слегка вырос процент отказа изделия при определённых условиях и временных рамках». Для этого пришлось выделить определённый резерв, что немного повлияло на показатели (в IV кв. маржа валовой прибыли снизилась на два процентных пункта до 63%, но баг в процессорах был не единственной причиной, так что нельзя всё списывать только на него). «Мы думаем, что относительно хорошо ограничим его [ущерб] с помощью небольшого изменения в архитектуре, над которым мы работаем вместе с нашими клиентами».
Что же это за баг? Поскольку компания Intel не разглашает информацию, придётся разбираться самостоятельно, но с помощью здравого смысла и логики можно докопаться до истины.
По совпадению, буквально на прошлой неделе компания Cisco опубликовала предупреждение о проблеме с синхронизирующим сигналом (clock signal) в некоторых своих устройствах, в том числе маршрутизаторах, коммутаторах и другом оборудовании. Как стало известно, баг пристутсвует в конкретном компоненте «одного из поставщиков». В результате, в некоторых устройствах синхронизирующий сигнал затухает со временем. По оценке Cisco, все проблемные устройства должны нормально работать в первое время, но постепенно начнут выходить из строя примерно после 18 месяцев эксплуатации. Количество сбоев будет увеличиваться в зависимости от продолжительности эксплуатации. Когда этот конкретный компонент выйдет из строя, устройство перестанет функционировать, его невозможно будет ни включить, ни починить.
Список устройств, которым грозит выход из строя после 18 месяцев эксплуатации:
Оптические сети | FN-64230 | NCS1K-CNTLR |
Маршрутизаторы | FN-64231 | Карты NCS 5500 |
FN-64252 | Промышленные маршрутизаторы с интегрированными сервисами IR809/IR829 | |
FN-64253 | ISR4331, ISR4321, ISR4351 и UCS-E120 | |
Безопасность | FN-64228 | ASA 5506, ASA 5506W, ASA 5506H, ASA 5508 и ASA 5516 |
FN-64250 | Cisco ISA 3000 Industrial Security Appliance | |
Meraki Notification | MX 84 | |
Коммутаторы | FN-64251 | Nexus 9000 Series N9K-C9504-FM-E/N9K-C9508-FM-E/N9K-X9732C-EX |
Meraki Notification | MS350 Series |
Судя по популярности продуктов Cisco, пострадать может большое количество оборудования. Среди сетевиков ходит информация, что менеджеры Cisco уже обзванивают клиентов и проактивно заменяют оборудование, которое ещё пока не вышло из строя.
«Данный компонент используется также другими компаниями», — отметила Cisco в предупреждении, опять же не сообщая название компонента или компанию-поставщика.
Впрочем, о компании-поставщике уже можно было бы догадаться.
В январе 2017 года компания Intel выпустила обновленные спецификации для семейства процессоров Intel Atom C2000, в которых указала на «новую» проблему с синхронизирующим сигналом. Об этом сказано на 34-й странице обновления спецификации в примечании AVR54.
Написано, что межсоединения LPC_CLKOUT0 и/или LPC_CLKOUT1 (выдача Low Pin Count синхронизации шины) могут перестать функционировать. В этом случае устройство больше невозможно будет загрузить, поскольку без синхронизации не работает другая электроника. Указано, что для решения проблемы может быть реализовано исправление на уровне платформы.
Представитель компании Intel объяснил данную проблему как «деградацию элемента микросхемы под высокой нагрузкой после нескольких лет использования». Деградация происходит так часто, что это не соответствует стандартам качества Intel, сказал он.
Нужно заметить, что ни компания Intel, ни компания Cisco до сих пор официально не подтвердили, что проактивная замена устройств Cisco вызвана проблемой с компонентом в Atom С2000, но картина рисуется очень чёткая. Представитель Intel не согласился ни подтвердить, ни опровергнуть эту информацию.
В документации указано, что сбойным компонентом является степпинг B0 в процессорах Atom C2XX, это:
C2308, C2338, C2350, C2358, C2508, C2518, C2530, C2538, C2550, C2558, C2718, C2730, C2738, C2750 и C2758.
Они продаются с 2013 года.
На процессорах Atom C2XX работают многочисленные устройства других производителей, в том числе ASRock Rack (C2550D4I и C2750D4I), Aaeon, Dell, HP, Infortrend, iXsystems (FreeNAS Mini), Lanner, NEC, Newisys, Netgate, Netgear, Quanta, Seagate (NAS Pro), Sophos (UTM firewall SG 125), Supermicro, Synology, ZNYX Networks.
Обидно, если оборудование выйдет из строя как раз после окончания гарантийного срока, как будто это было запланировано.
Автор: alizar