Векторы 128 битные, состоят из 2-х double, 4-х float, восьми short int или 16-ти байтовых целых.
FPU 64-битный, выполняет две инструкции за такт: одну "длинную" и одну "короткую". Длинная это умножение или сложение, коротная - логическая, целочисленное деление (для SIMD) или запись в память.
Целочисленные и FP инструкции multiply-add имеются давно, начиная с архитектуры MIPS R2 (2002 год). Это команды типа MADD, MADD.D, MADD.S и т.п. Даже в микроконтроллере PIC32 есть целочисленный MADD. Инструукции типа FMADD это _fused_ multiply-add, имеется только в расширении SIMD.
Все инструкции конвейеризованы и могут выполняться в установившемся режиме за 1 такт. Зависит от смеси инструкций, естественно. Все времянки, темпы и задержки можно спросить в нашем маркетинге.
Re: Архитектурное…
Date: 2016-11-11 19:34 (UTC)FPU 64-битный, выполняет две инструкции за такт: одну "длинную" и одну "короткую". Длинная это умножение или сложение, коротная - логическая, целочисленное деление (для SIMD) или запись в память.
Целочисленные и FP инструкции multiply-add имеются давно, начиная с архитектуры MIPS R2 (2002 год). Это команды типа MADD, MADD.D, MADD.S и т.п. Даже в микроконтроллере PIC32 есть целочисленный MADD. Инструукции типа FMADD это _fused_ multiply-add, имеется только в расширении SIMD.
Все инструкции конвейеризованы и могут выполняться в установившемся режиме за 1 такт. Зависит от смеси инструкций, естественно. Все времянки, темпы и задержки можно спросить в нашем маркетинге.