Чтобы выяснить, что можно улучшить минимумом средств, без превращения процессора в монстра с аппаратно реализованной двоичной рекомпиляцией в регистровую архитектуру, нужно сначала сделать тактово-аккуратную модель и узнать, какой, собственно, процент тактов занимает работа исключительно АУ - потому что от ускорения АУ, если львиную долю времени оно работает с совмещением выполнения других действий, толку не будет: если оно окажется "слишком быстрым", оно начнет простаивать.
Если, не дай бог, окажется, например, что заметное время тратится на приведение переносов после сложения и умножения, и что добавлением цепей быстрого переноса (грубо, с дюжину-другую ТЭЗов) его можно было бы сократить, ускорив машину процентов на 5-7, будет смешно.
no subject
Date: 2024-05-31 15:55 (UTC)Если, не дай бог, окажется, например, что заметное время тратится на приведение переносов после сложения и умножения, и что добавлением цепей быстрого переноса (грубо, с дюжину-другую ТЭЗов) его можно было бы сократить, ускорив машину процентов на 5-7, будет смешно.