Dhrystone на Эльбрусе-4С
2015-05-27 22:57Появилась некоторая информация про реальную скорость Эльбруса-4С. Подробности в ветке: http://1500py470.livejournal.com/119026.html?thread=1141490#t1141490
Вкратце, тест Dhrystone на 800-мегагерцовом Эльбрусе-4С показывает скорость 2.67 MDPS.
Для сравнения, я померял на своем домашнем аймаке (2.7 GHz Intel Core i5), получается 28.4 MDPS. То есть если пересчитать по частоте, 800-мегагерцовый Эльбрус работает примерно как 250-мегагерцовый Intel i5.
Мои исходники Dhrystone здесь: https://code.google.com/p/vak-opensource/source/browse/trunk/#trunk%2Futilities%2Fdhrystone
Попробуйте скомпилировать и запустить у себя, для сравнения.
P.S. MDPS = Million Dhrystones Per Second.
P.P.S. Чтобы получить DMIPS, нужно измеренное значение умножить на 569. Я поправил исходники теста, теперь он все правильно печатает. То есть реальный DMIPS Эльбруса равен 1520, что примерно соответствует процессору Pentium III с частотой 1000 МГц. Таблица результатов здесь: http://www.roylongbottom.org.uk/dhrystone%20results.htm
Вкратце, тест Dhrystone на 800-мегагерцовом Эльбрусе-4С показывает скорость 2.67 MDPS.
Для сравнения, я померял на своем домашнем аймаке (2.7 GHz Intel Core i5), получается 28.4 MDPS. То есть если пересчитать по частоте, 800-мегагерцовый Эльбрус работает примерно как 250-мегагерцовый Intel i5.
Мои исходники Dhrystone здесь: https://code.google.com/p/vak-opensource/source/browse/trunk/#trunk%2Futilities%2Fdhrystone
Попробуйте скомпилировать и запустить у себя, для сравнения.
P.S. MDPS = Million Dhrystones Per Second.
P.P.S. Чтобы получить DMIPS, нужно измеренное значение умножить на 569. Я поправил исходники теста, теперь он все правильно печатает. То есть реальный DMIPS Эльбруса равен 1520, что примерно соответствует процессору Pentium III с частотой 1000 МГц. Таблица результатов здесь: http://www.roylongbottom.org.uk/dhrystone%20results.htm

no subject
Date: 2015-05-28 09:38 (UTC)Примерно та же, что EPIC?
Вроде бы опыт с EPIC-ом выясил, что статическое планирование -- дело дохлое, и писать под него компиляторы -- тоже дело дохлое.
(И авторы Pentium Chronicles злорадно указывают, что они с самого начала это говорили.)
Любопытно, что это вроде бы должен был быть урок выясненный ещё после Multiflow, но те видимо обанкротились по более драматическим причинам, так что под юбку тогда никто не успел толком заглянуть.
no subject
Date: 2015-05-28 16:45 (UTC)Mill Computing не согласен.
no subject
Date: 2015-05-28 19:46 (UTC)Такими темпами пожалуй выяснится, что у этого mill-а ещё и кэш имеется.
no subject
Date: 2015-05-28 21:50 (UTC)no subject
Date: 2015-05-28 23:18 (UTC)А откуда оно об этом может знать?
Потому что пятилетний план так предсказывает?
Вообще же, есть полезный закон больших чисел.
Например СССР был большим, и благодаря этому большому N мы сейчас хорошо знаем, что тотально-государственный социализм работает неважно.
Аналогичным же большим проектом был Itanium -- там тоже старались, сильно и долго, но преимущества
социализмастатического планирования так миру и не явили.P.S. Употребленная аналогия между статическим планированием и госсоциализмом -- это не просто образ.
no subject
Date: 2015-05-28 23:57 (UTC)Например СССР был большим...
Зачем пользоваться сомнительными аналогиями, если можно ознакомиться, и критиковать не огульно, а детально?
(Disclaimer: мой единственный интерес - что Mill Computing будет нашим клиентом, когда дело дойдет до верификации хардвера.)
no subject
Date: 2015-05-29 00:10 (UTC)Хорошо конечно, если матрица 200х200.
А если она NxM?
Про асинхронность и мультипроцессорность даже не упоминаю.
no subject
Date: 2015-05-29 00:26 (UTC)no subject
Date: 2015-05-29 00:37 (UTC)Опыт Итаниума и СССР наставляет нас, что состояния в этом графе (а по большому счету и сам граф) не могут быть удовлетворительно прогнозированы 5-летним планом.
no subject
Date: 2015-05-29 00:47 (UTC)А берутся они из других тредов. Ну так в обычном процессоре для эффективной реализации этого приходится SMT городить, а в этом хватит и block-level.
не могут быть удовлетворительно прогнозированы 5-летним планом
Да хорош уже, пора бы и с матчастью ознакомиться.
no subject
Date: 2015-05-29 01:37 (UTC)Ясно, что для статического планирования это сразу застрелиться.
Я, проявляя доброту, вел речь про исполнение команд из текущего потока.
Execute-ahead, так сказать.
> пора бы и с матчастью ознакомиться
Так матчасть такова: USSR, Itanium. RIP.
Понятно, что причин был комплекс, тем не менее обещания "повышения производительности
труда" решительно не материализовались.no subject
Date: 2015-05-29 02:00 (UTC)no subject
Date: 2015-05-29 02:30 (UTC)Должен также сказать, что высказанное мною сомнение в успешности акций компании "Статическое планирование" представляется мне очень простым, и если на него нет столь же простого и короткого ответа, то я скорее всего буду и дальше воздерживаться от приобретение данного вида акций.
no subject
Date: 2015-05-29 02:31 (UTC)no subject
Date: 2015-05-29 02:33 (UTC)конкретными -- значит конкретно по вопросу, а не "как конкретный пацан"
Должен также сказать, что высказанное мною сомнение в успешности акций компании "Статическое планирование" представляется мне очень простым, и если на него нет столь же простого и короткого ответа, то я скорее всего буду и дальше воздерживаться от приобретение данного вида акций.
Извините за само-цитирование.
no subject
Date: 2015-05-29 02:38 (UTC)It is well known that exposed-pipe static scheduling yields near-perfect code with minimal power – except when there is a miss in the cache. In a conventional VLIW, a miss stalls the whole machine, whereas an out-of-order architecture can sometimes find other useful operations to execute while waiting on the memory hierarchy. The Mill uses a novel load instruction that tolerates load misses as well as hardware out-of-order approaches can do, while avoiding the need for expensive load buffers and completely avoiding false aliasing. In addition, store misses are impossible on a Mill, and a large fraction of the memory traffic of a conventional processor can be omitted entirely.
no subject
Date: 2015-05-29 03:11 (UTC)Тем не менее, я не поленился, и открыл powerpoint по ссылке.
"This isn't a load problem. It's a speculation problem".
Whoa!
То есть динамическое планирование у них всё-таки есть, только называется статическим планированием?
Воистину, "чем демократия отличается от народной демократии".
(no subject)
From:no subject
Date: 2015-05-29 01:51 (UTC)Но дело даже не в высокой степени динамики.
Даже чисто статически компилятор Итаниума генерит код, который выполняет в среднем чуть больше 2-х инструкций за такт, из шести возможных.
no subject
Date: 2015-05-29 02:10 (UTC)no subject
Date: 2015-05-29 02:17 (UTC)http://www.amazon.com/Itanium-Architecture-Programmers-Understanding-Processors/dp/0131013726/
Mill штука многообещающая. На какой они сейчас стадии? Есть ли Си-компилятор и программный симулятор? Хотя бы прототип.
no subject
Date: 2015-05-29 02:24 (UTC)Приходи 10 июня http://www.meetup.com/SFBay-Association-of-C-C-Users/events/218992453/ - узнаешь.
no subject
Date: 2015-05-29 03:19 (UTC)Идею-то я понимаю и ценю, но хочется дождаться реализации. Дьявол в деталях обычно.
no subject
Date: 2015-05-29 03:39 (UTC)no subject
Date: 2015-05-29 02:32 (UTC)no subject
Date: 2015-05-29 03:13 (UTC)