vak: (Улыбка)
Serge Vakulenko ([personal profile] vak) wrote2016-10-13 10:44 am
Entry tags:

MIPS I6500

Новая разработка нашей конторы, ядро MIPS I6500, будет применяться в самодвижущихся тележках, в частности Тесла.



Мультикластерная организация позволяет разместить на одном кристалле до 64-х кластеров по 6 ядер, каждое из которых имеет по 4 потока. В сумме на таком чипе можно будет запустить 64*6*4 = 1536 линуксов. :)

Из прочих существенных ништяков там есть аппаратная виртуализация и SIMD.

За последние три года мне тоже довелось приложить руку к этому проекту - в области технологии верификации и разработки образцовой референтной функциональной модели процессора. А Юра [livejournal.com profile] panchul, так даже успел вписать туда пару сотен строчек RTL кода.

[identity profile] vit-r.livejournal.com 2016-10-13 06:37 pm (UTC)(link)
На чём это можно программировать так чтобы работало как система, а не как полторы тысячи линуксов?
ext_646638: (Default)

[identity profile] rdia.livejournal.com 2016-10-13 07:06 pm (UTC)(link)
Т.е. это такая супервидеокарта получается?

[identity profile] pappadeux.livejournal.com 2016-10-16 09:57 pm (UTC)(link)
нет, вопрос, кяп, был в том, похоже ли это на современные видекарты со, скажем, 2048 threads, типа Nvidia 980
ext_646638: (Default)

[identity profile] rdia.livejournal.com 2016-10-13 07:15 pm (UTC)(link)
> В этом ядре каждая нитка архитектурно выглядит как изолированный процессор MIPS с автономным MMU. Внешние прерывания можно настраивать и маршрутизировать через отдельный блок GIC. В том числе и для виртуальных машин. MMU тоже виртуализируется.

Для такой машины Linux неадекватен, а просится что-то вроде VM/370.

Кстати, вот вы там всякие Эрланги на этой штуке пускать не думали?
ext_646638: (Default)

[identity profile] rdia.livejournal.com 2016-10-13 07:50 pm (UTC)(link)
> Нынче это называется модным словом "гипервизор".

Над ним всё равно тяжёлый линукс бегает, а не легкое CMS.

[identity profile] b0p0h0k.livejournal.com 2016-10-14 12:21 am (UTC)(link)
Это "нынче модное" слово мы на Эльбрусе-Б использовали 25 лет назад (ДВС).

[identity profile] vit-r.livejournal.com 2016-10-13 07:17 pm (UTC)(link)
Это полторы тысячи линуксов. Интересно, есть ли системы, работающие как параллельные на высоком уровне.

[identity profile] pappadeux.livejournal.com 2016-10-16 09:17 pm (UTC)(link)
Cray Linux Environment

сотни тысяч процессоров

[identity profile] vit-r.livejournal.com 2016-10-16 09:37 pm (UTC)(link)
По-моему, это извращение.

[identity profile] pappadeux.livejournal.com 2016-10-16 09:49 pm (UTC)(link)
в смысле?

а что им (Cray, ...) делать?

проблема не только (и не столько) в ОС, но нужен же и весь userspace

[identity profile] ufm.livejournal.com 2016-10-13 07:47 pm (UTC)(link)
А межпроцессорное взаимодействие какое? Что-то типа send/receive msg есть, или как обычно, вручную?

[identity profile] rbs-vader.livejournal.com 2016-10-14 04:55 am (UTC)(link)
Это очень хорошая, годная разработка.

[identity profile] pappadeux.livejournal.com 2016-10-16 09:15 pm (UTC)(link)
> на одном кристалле

и каков будет размер этого кристалла?

[identity profile] pappadeux.livejournal.com 2016-10-17 04:36 am (UTC)(link)
в смысле, у вас прикидок/разводки под, скажем, 14нм процесс нет?

Архитектурное…

[identity profile] tacit murky (from livejournal.com) 2016-11-11 03:54 am (UTC)(link)
Эхем. Итак, мы имеем возможность запихать на кристалл 384 хомячка. А сами они что могут? Я верно полагаю, что векторы 128-битные? И что основные ФУ тоже? И что вещественных ФУ 2 — сумматор и умножитель? (Потому что про аппаратный FMADD на штатных МИПСах я не слышал, хотя команда такая у вас есть.) Насколько они конвейерны при вычислении векторов с HP, SP и DP? В этом главный цимес — сколько флопов за такт в пике может дать ядро на разных точностях. Вообще, было бы неплохо увидеть все времянки (темпы и задержки — TP & latencies) хотя бы для вычислительных команд.

Re: Архитектурное…

[identity profile] tacit murky (from livejournal.com) 2016-11-11 11:27 pm (UTC)(link)
•1) Т.е. половинная (16-битная) точность для плавучки (HP) не реализована? А где же обещанная поддержка IEEE-754 для них?
•2) Я нисколько не сомневался в наличии команд слитого умножения-сложения. Сомнения были в том, как они исполняются — на двух раздельных ФУ (умножитель и сумматор) без экономии тактов (по сравнению с двумя отдельными командами) или на спец-ФУ. Под FMADD я имел ввиду Float MADD.
•3) Выходит, что ядро может исполнять только одну вещественную команду за такт. Но если это FMADD, то она даст 2 операции/такт при работе с DP (64 бита) и 4 для SP (32 бита). Верно? Однако весьма странно иметь полноконвейерное умножение для DP у столь простого ядра. Я пока не видел ни одного другого ядра (из мелких-экономных) с матрицей умножителя хотя бы в 53*53 бита (не считая ядер для Intel MIC, которые меньше чем на 100 Вт не выпускаются).
•4) Как достучаться до вашего маркетинга? Я уже написал Юрию, но он пока молчит. Он мне года 1,5 назад показывал документацию для Warrior P5600 до её выхода — я сходу нашёл там несколько ошибок.