Берем простой, хотя и нетривиальный си-шный код, и сравниваем количество получившихся машинных команд. Компилятор GCC 4.1.2, оптимизация -O1. Исходный код такой:
unsigned long rot13_hash (unsigned char *str, unsigned int len)
{
unsigned long hash = 0;
while (len-- > 0) {
hash += *str++;
hash -= (hash << 13) | (hash >> 19);
}
return hash;
}
Результаты:
Архитектура | Команд в цикле | Всего команд |
---|
ARM | 6 | 13 |
Thumb | 8 | 17 |
MIPS32 | 9 | 17 |
Intel 386 | 9 | 25 |
MIPS16 | 10 | 17 |
Blackfin | 11 | 22 |
Для MIPS и Blackfin компилятор не догадался заменить два арифметических сдвига на один циклический. Предположим, мы исправили компилятор. Тогда получится так:
Архитектура | Команд в цикле | Всего команд |
---|
ARM | 6 | 13 |
MIPS32 | 7 | 15 |
MIPS16 | 8 | 15 |
Thumb | 8 | 17 |
Blackfin | 8 | 19 |
Intel 386 | 9 | 25 |
Хорошо видно, насколько архитектура Intel 386, она же Pentium, проигрывает RISC-процессорам.
no subject
Date: 2007-05-25 10:17 (UTC)Легенда про четыре команды на такт возникла из того, что в Pentium 4 АЛУ работает по обоим фронтам синхросигнала. И таких АЛУ аж два. Реально померять что-то не представляется возможным, слишком всё замешано в кучу с трансляцией, VLIW, кэшами и т.п. Можно рассуждать только статистически. Из каких-то бенчмарков я слышал цифру про ~1 такт на команду, но отстаивать не берусь.