Рубрика «cpu» - 8

Здравствуй, мир! Сегодня у нас серия статьей для людей со средними знаниями о работе процессора в которой мы будем разбираться с процессорными архитектурами (у меня спелл чекер ругается на слово Архитектурами/Архитектур, надеюсь я пишу слово правильно), создавать собственную архитектуру процессора и многое другое.

4004

Принимаются любые замечания!

Читать полностью »

Как искусственный интеллект меняет рынок чипов - 1

Менее, чем за 12 часов, три разных человека предложили мне деньги за то, чтобы я час разговаривал с незнакомым человеком по телефону.

Все они сказали, что им понравилась моя статья про то, как Google создаёт новый компьютерный чип для ИИ, и все они упрашивали меня обсудить эту тему с их клиентом. Каждый описал своего клиента как менеджера большого хедж-фонда, но не назвал его имени.

Запросы пришли от так называемых экспертных сетей – исследовательских фирм, связывающих инвесторов с людьми, которые могут помочь первым понять определённые рынки и обеспечить конкурентное преимущество (иногда, судя по всему, через инсайдерскую информацию). Эти экспертные сети желали, чтобы я объяснил, как ИИ-процессор от Google повлияет на рынок чипов. Но сначала они потребовали подписать для них соглашение о неразглашении. Я отказался.
Читать полностью »

Intel добавит в CPU инструкции для глубинного обучения - 1

Некоторые из последних процессоров Intel поддерживают семейство векторных инструкций AVX-512. Они выполняются блоками по 512 бит (64 байта). Преимущество аппаратной поддержки таких больших инструкций в том, что за один такт процессор обрабатывает больше данных.

Если код загружается 64-битными словами (8 байт), то теоретически, если не брать в учёт другие факторы, можно ускорить его выполнение в восемь раз, если использовать инструкции AVX-512.
Читать полностью »

Рынок видео стриминга и онлайн услуг стремительно развивается, что приводит к преобразованию видео контента. Для обеспечения быстрой и качественной съемки FHD и 4K требуется высокая вычислительная мощность. Повысить производительность можно с помощью программируемых пользователями FPGA, специализированных интегральных схем ASIC или GPU. В соответствии с этим компания Intel выпустила серию процессоров E3-1500 v5, основанных на Intel Quick Sync и ориентированных на видео стримминг. Это четырехядерные центральные процессоры Skylake, поддерживающие графику Iris Pro с 72 вычислительными блоками и усовершенствованным встроенным DRAM на 128 МБ.

Процессоры Intel Xeon E3-1500 v5 — новое слово в видео стримминге - 1

Ниже представлена сравнительная характеристика интеловских процессоров E3-1200/1500 v5 Xeon на четырех ядрах, E5-1600/2600 v4 Broadwell на 22 ядра и E7-4600/8800 v3 Haswell на 18 ядрах в одном сокете.

Читать полностью »

Пути технологии неисповедимы. Три месяца назад к нам в Silicon Valley приехал бизнесмен из Украины Александр Романишин. Я пошел с Александром на выставку для разработчиков IoT, где мы встретили Дэвида Гарольда из британской части Imagination Technologies (компании, которая спроектировала PowerVR GPU внутри Apple iPhone).

Александр увидел у Дэвида демо платы MIPS Creator ci40 для «умных ферм», и минут двадцать рассказывал Дэвиду, что все правительство Украины начиная с Порошенко лично желает в порядке нахождения экономического будущего страны скрестить электронные технологии и сельское хозяйство.

Дэвид воспринял все это максимально буквально и сегодня утром я получил от начальника Дэвида письмо, откуда узнал, что они в Великобритании сделали онлайн вебинар по использованию MIPS Creator ci40 для построения системы умной ирригации, и соратники Александра могут зарегистрироваться для этого семинара, который состоится в среду 28 сентября в 11 утра по Silicon Valley / в 21.00 по киевскому времени:

Украинец подсказал британцу сделать вебинар для разработчиков IoT для сельского хозяйства. А мы поговорим о CPU внутри - 1

Украинец подсказал британцу сделать вебинар для разработчиков IoT для сельского хозяйства. А мы поговорим о CPU внутри - 2

По этому поводу я хочу копнуть глубже внутрь чипа и рассказать про историю и особенности процессорного ядра в показываемом в вебинаре устройстве. Внутри MIPS Creator ci40 стоит чип на основе многопоточного двухядерного кластера MIPS interAptiv, продвинутого отпрыска ядра MIPS 24KEc. Последний сейчас переживает вторую молодость внутри только что вышедшего на рынок Omega2, Linux-компьютера ценой $5 размером с почтовую марку. Чем же MIPS interAptiv внутри MIPS Creator ci40 отличается от MIPS 24KEc внутри Omega2 с точки зрения микроахитектуры и как это задевает программиста?
Читать полностью »

Вы думаете, что всё началось с Intel 4004, но всё не так просто

Неожиданная история микропроцессоров - 1
Intel 4-битный 4004

Транзисторы, электронные усилители и переключатели, находящиеся сейчас в центре всего, от карманного радиоприёмника до суперкомпьютера, были изобретены в 1947 году. Ранние прототипы звались биполярными транзисторами, и они всё ещё в ходу. К 1960-м инженеры придумали, как комбинировать несколько биполярных транзисторов на одной интегральной микросхеме. Но из-за их сложной структуры, на схеме могло быть только небольшое их количество. Поэтому, хотя мини-компьютер, созданный на основе биполярных интегральных микросхем, был гораздо меньше ранних компьютеров, ему требовалось несколько плат с сотнями чипов на них.

В 1960-м был показан новый тип транзисторов: транзистор со структурой металл-окисел-полупроводник, МОП-транзистор. Сначала технология не выглядела многообещающей. Они были медленнее, менее надёжными и более дорогими, чем биполярные. Но к 1964-му интегральные микросхемы на МОП-транзисторах уже могли похвастаться большей плотностью и меньшей стоимостью производства, чем биполярные. Сложность интегральных микросхем росла согласно закону Мура, но технология МОП вырвалась вперёд.
Читать полностью »

А ты учел константу в О-большом?
На написание данного поста меня подвигла недавняя публикация этого и вот этого переводов, в которых авторы в интеллигентной форме выражают свое недовольство по поводу того, как O-оценки вычислительной сложности классических, казалось бы, алгоритмов вступили в диссонанс с их практическим опытом разработки. Основным предметом критики послужила модель памяти, в рамках которой эти оценки были получены — она, де, не учитывает особенности иерархической организации по принципу быстродействия, которая имеет место быть в современных вычислительных системах. От чего и произрастают все последующие неприятности. И судя по наблюдаемой реакции благодарных читателей, авторы далеко не одиноки в своем негодовании и желании «наехать» на классиков с их О-большими. Так возможно, действительно стоит отправить на свалку истории выкладки дядек в белых халатах, сделанные ими для ламповых тугодумающих и пышащих жаром машин, и дать дорогу молодым амбициозным моделям, более точно отражающим анатомию современного «железа»?

Читать полностью »

Миф о RAM и O(1) - 1
Городская библиотека Стокгольма. Фото minotauria.

В этой статье я хочу рассказать о том, что оценивать время обращения к памяти как O(1) — это очень плохая идея, и вместо этого мы должны использовать O(√N). Вначале мы рассмотрим практическую сторону вопроса, потом математическую, на основе теоретической физики, а потом рассмотрим последствия и выводы.

Введение

Если вы изучали информатику и анализ алгоритмической сложности, то знаете, что проход по связному списку это O(N), двоичный поиск это O(log(N)), а поиск элемента в хеш-таблице это O(1). Что, если я скажу вам, что все это неправда? Что, если проход по связному списку на самом деле O(N√N), а поиск в хеш-таблице это O(√N)?

Не верите? Я вас сейчас буду убеждать. Я покажу, что доступ к памяти это не O(1), а O(√N). Этот результат справедлив и в теории, и на практике. Давайте начнем с практики.

Измеряем

Давайте сначала определимся с определениями. Нотация “О” большое применима ко многим вещам, от использования памяти до запущенных инструкций. В рамках этой статьи мы O(f(N)) будет означать, что f(N) — это верхняя граница (худший случай) по времени, которое необходимо для получения доступа к N байтов памяти (или, соответственно, N одинаковых по размеру элементов). Я использую Big O для анализа времени, но не операций, и это важно. Мы увидим, что центральный процессор подолгу ждет медленную память. Лично меня не волнует, что делает процессор пока ждет. Меня волнует лишь время, как долго выполняется та или иная задача, поэтому я ограничиваюсь определением выше.Читать полностью »

Мы в «ИТ-ГРАД» рассказываем в своем блоге об интересных технологиях в области виртуализации, например, недавно мы говорили об облачных ERP-системах, а также о виртуальных GPU.

Сегодня мы углубимся в «железную тематику» и поговорим о кэше процессора.

«Особенности памяти»: Что общего у кэша процессора и офисного клерка - 1

/ фото Isaac Bowen CC
Читать полностью »

В браузере Opera появился режим энергосбережения - 1
Время работы аккумулятора (чч:мм). Тесты проведены компанией Opera на ноутбуках Lenovo X250, Core i7-5600U, 16 ГБ ОЗУ и Dell XPS 13, 16 ГБ ОЗУ, под Windows 10 64бит в режиме высокой производительности

На dev-канале вышла новая версия браузера Opera, в которой реализован энергосберегающий режим. Это первый из популярных браузеров с такой функцией. В зависимости от конфигурации компьютера и других факторов, браузер продлевает время работы ноутбука при просмотре веб-страниц на несколько десятков процентов.
Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js