Эхем. Итак, мы имеем возможность запихать на кристалл 384 хомячка. А сами они что могут? Я верно полагаю, что векторы 128-битные? И что основные ФУ тоже? И что вещественных ФУ 2 — сумматор и умножитель? (Потому что про аппаратный FMADD на штатных МИПСах я не слышал, хотя команда такая у вас есть.) Насколько они конвейерны при вычислении векторов с HP, SP и DP? В этом главный цимес — сколько флопов за такт в пике может дать ядро на разных точностях. Вообще, было бы неплохо увидеть все времянки (темпы и задержки — TP & latencies) хотя бы для вычислительных команд.
Архитектурное…
Date: 2016-11-11 03:54 (UTC)