Разработчики и производители процессоров и другой сложной микроэлектроники понимают всю важность сферы искусственного интеллекта и машинного обучения и активно состязаются в том, кто наделит своё новое детище большими возможностями в этой сфере. Заявку на первенство подал стартап Groq, анонсировавший тензорный процессор с невиданным прежде уровнем производительности.
Их новый чип, Tensor Streaming Processor (TSP), стал первым в мире, способным достичь планки 1 Петаопс (PetaOPS, 1015 операций в секунду, обычно целочисленных). Один из основателей стартапа Джонатан Росс (Jonathan Ross) заявил, что разработанная Groq архитектура является быстрейшей на рынке, поскольку даже производители графических процессоров говорили о таких цифрах лишь в будущем времени. Новый процессор создавался с прицелом на максимизацию вычислительных возможностей, поэтому его архитектура имеет ряд любопытных особенностей.
Groq делает ставку на компилятор и этим экономит транзисторный бюджет
Главная из этих особенностей заключается в том, что Groq решила не расходовать драгоценный транзисторный лимит на кеши, планировщики заданий и т. п., поэтому за планирование и реализацию параллелизма отвечает компилятор. Этим TSP напоминает Intel IA64 (Itanium). Но единого устоявшегося рынка в этой сфере, в отличие от x86, нет, поэтому TSP имеет все шансы на успех, благо SDK у Groq имеется, ревизия A0 самого процессора находится в производстве, а образцы уже разосланы партнёрам и заказчикам. Разработчики заявляют, что их архитектура обеспечивает полностью детерминированную работу TSP, что немаловажно для задач реального времени, таких как машинное зрение в системах автопилотов.