vak: (Default)
Serge Vakulenko ([personal profile] vak) wrote 2007-05-25 10:17 am (UTC)

С оптимизацией по размеру количество команд в цикле увеличивается до 10. Из них два перехода. Интеловские инженеры, конечно, гении, не буду спорить. Во внутреннем представлении последний jmp можно вообще убрать, если для каждой команды хранить адрес следующей.

Легенда про четыре команды на такт возникла из того, что в Pentium 4 АЛУ работает по обоим фронтам синхросигнала. И таких АЛУ аж два. Реально померять что-то не представляется возможным, слишком всё замешано в кучу с трансляцией, VLIW, кэшами и т.п. Можно рассуждать только статистически. Из каких-то бенчмарков я слышал цифру про ~1 такт на команду, но отстаивать не берусь.

Post a comment in response:

This account has disabled anonymous posting.
If you don't have an account you can create one now.
HTML doesn't work in the subject.
More info about formatting

If you are unable to use this captcha for any reason, please contact us by email at support@dreamwidth.org