Dhrystone на Эльбрусе-4С
2015-05-27 22:57Появилась некоторая информация про реальную скорость Эльбруса-4С. Подробности в ветке: http://1500py470.livejournal.com/119026.html?thread=1141490#t1141490
Вкратце, тест Dhrystone на 800-мегагерцовом Эльбрусе-4С показывает скорость 2.67 MDPS.
Для сравнения, я померял на своем домашнем аймаке (2.7 GHz Intel Core i5), получается 28.4 MDPS. То есть если пересчитать по частоте, 800-мегагерцовый Эльбрус работает примерно как 250-мегагерцовый Intel i5.
Мои исходники Dhrystone здесь: https://code.google.com/p/vak-opensource/source/browse/trunk/#trunk%2Futilities%2Fdhrystone
Попробуйте скомпилировать и запустить у себя, для сравнения.
P.S. MDPS = Million Dhrystones Per Second.
P.P.S. Чтобы получить DMIPS, нужно измеренное значение умножить на 569. Я поправил исходники теста, теперь он все правильно печатает. То есть реальный DMIPS Эльбруса равен 1520, что примерно соответствует процессору Pentium III с частотой 1000 МГц. Таблица результатов здесь: http://www.roylongbottom.org.uk/dhrystone%20results.htm
Вкратце, тест Dhrystone на 800-мегагерцовом Эльбрусе-4С показывает скорость 2.67 MDPS.
Для сравнения, я померял на своем домашнем аймаке (2.7 GHz Intel Core i5), получается 28.4 MDPS. То есть если пересчитать по частоте, 800-мегагерцовый Эльбрус работает примерно как 250-мегагерцовый Intel i5.
Мои исходники Dhrystone здесь: https://code.google.com/p/vak-opensource/source/browse/trunk/#trunk%2Futilities%2Fdhrystone
Попробуйте скомпилировать и запустить у себя, для сравнения.
P.S. MDPS = Million Dhrystones Per Second.
P.P.S. Чтобы получить DMIPS, нужно измеренное значение умножить на 569. Я поправил исходники теста, теперь он все правильно печатает. То есть реальный DMIPS Эльбруса равен 1520, что примерно соответствует процессору Pentium III с частотой 1000 МГц. Таблица результатов здесь: http://www.roylongbottom.org.uk/dhrystone%20results.htm

no subject
Date: 2015-05-29 00:10 (UTC)Хорошо конечно, если матрица 200х200.
А если она NxM?
Про асинхронность и мультипроцессорность даже не упоминаю.
no subject
Date: 2015-05-29 00:26 (UTC)no subject
Date: 2015-05-29 00:37 (UTC)Опыт Итаниума и СССР наставляет нас, что состояния в этом графе (а по большому счету и сам граф) не могут быть удовлетворительно прогнозированы 5-летним планом.
no subject
Date: 2015-05-29 00:47 (UTC)А берутся они из других тредов. Ну так в обычном процессоре для эффективной реализации этого приходится SMT городить, а в этом хватит и block-level.
не могут быть удовлетворительно прогнозированы 5-летним планом
Да хорош уже, пора бы и с матчастью ознакомиться.
no subject
Date: 2015-05-29 01:37 (UTC)Ясно, что для статического планирования это сразу застрелиться.
Я, проявляя доброту, вел речь про исполнение команд из текущего потока.
Execute-ahead, так сказать.
> пора бы и с матчастью ознакомиться
Так матчасть такова: USSR, Itanium. RIP.
Понятно, что причин был комплекс, тем не менее обещания "повышения производительности
труда" решительно не материализовались.no subject
Date: 2015-05-29 02:00 (UTC)no subject
Date: 2015-05-29 02:30 (UTC)Должен также сказать, что высказанное мною сомнение в успешности акций компании "Статическое планирование" представляется мне очень простым, и если на него нет столь же простого и короткого ответа, то я скорее всего буду и дальше воздерживаться от приобретение данного вида акций.
no subject
Date: 2015-05-29 02:31 (UTC)no subject
Date: 2015-05-29 02:33 (UTC)конкретными -- значит конкретно по вопросу, а не "как конкретный пацан"
Должен также сказать, что высказанное мною сомнение в успешности акций компании "Статическое планирование" представляется мне очень простым, и если на него нет столь же простого и короткого ответа, то я скорее всего буду и дальше воздерживаться от приобретение данного вида акций.
Извините за само-цитирование.
no subject
Date: 2015-05-29 02:38 (UTC)It is well known that exposed-pipe static scheduling yields near-perfect code with minimal power – except when there is a miss in the cache. In a conventional VLIW, a miss stalls the whole machine, whereas an out-of-order architecture can sometimes find other useful operations to execute while waiting on the memory hierarchy. The Mill uses a novel load instruction that tolerates load misses as well as hardware out-of-order approaches can do, while avoiding the need for expensive load buffers and completely avoiding false aliasing. In addition, store misses are impossible on a Mill, and a large fraction of the memory traffic of a conventional processor can be omitted entirely.
no subject
Date: 2015-05-29 03:11 (UTC)Тем не менее, я не поленился, и открыл powerpoint по ссылке.
"This isn't a load problem. It's a speculation problem".
Whoa!
То есть динамическое планирование у них всё-таки есть, только называется статическим планированием?
Воистину, "чем демократия отличается от народной демократии".
no subject
Date: 2015-05-29 03:33 (UTC)Лучше начать с самого начала и смотреть видео, а не powerpoint.
no subject
Date: 2015-05-29 01:51 (UTC)Но дело даже не в высокой степени динамики.
Даже чисто статически компилятор Итаниума генерит код, который выполняет в среднем чуть больше 2-х инструкций за такт, из шести возможных.
no subject
Date: 2015-05-29 02:10 (UTC)no subject
Date: 2015-05-29 02:17 (UTC)http://www.amazon.com/Itanium-Architecture-Programmers-Understanding-Processors/dp/0131013726/
Mill штука многообещающая. На какой они сейчас стадии? Есть ли Си-компилятор и программный симулятор? Хотя бы прототип.
no subject
Date: 2015-05-29 02:24 (UTC)Приходи 10 июня http://www.meetup.com/SFBay-Association-of-C-C-Users/events/218992453/ - узнаешь.
no subject
Date: 2015-05-29 03:19 (UTC)Идею-то я понимаю и ценю, но хочется дождаться реализации. Дьявол в деталях обычно.
no subject
Date: 2015-05-29 03:39 (UTC)no subject
Date: 2015-05-29 02:32 (UTC)no subject
Date: 2015-05-29 03:13 (UTC)