Почему же у них Rs и Ly получились быстрее? Они, конечно, схалтурили, не приведя ассемблерного кода, то так или иначе, для быстрого умножения на относительно хорошую константу можно соорудить массивно параллельное дерево из leal и subl, которое будет быстрее команды mull.
Думаю, дело в микроархитектуре конкретного процессора. Atom или что там было. Умножение может иметь свой пайплайн, работающий параллельно со сложениями. А сдвиг идет последовательно, в том же пайплайне что и сложения. Или еще какая заморочка.
no subject
Date: 2014-04-13 23:13 (UTC)no subject
Date: 2014-04-14 04:16 (UTC)no subject
Date: 2014-04-14 04:20 (UTC)no subject
Date: 2014-04-14 18:18 (UTC)