vak: (Default)
[personal profile] vak
"FP64, FP32, FP16, BFloat16, TF32, and other members of the Zoo"



Библиотека Си++, реализующая плавающие числа с произвольным размером экспоненты и мантиссы: https://github.com/oprecomp/FloatX

К примеру, BFloat16 реализуется как тип float<8,7>. Размер экспоненты равен 8, размер мантиссы - 7.

Date: 2022-11-04 03:28 (UTC)
spamsink: (Default)
From: [personal profile] spamsink
bfloat16 удобен с точки зрения преобразования <-> float32, но для разных вычислений могут пригодиться и числа с 6 или 7 битами порядка. 3⏨38 кажется многовато, а 6.5⏨4 - маловато.

Date: 2022-11-04 22:32 (UTC)
spamsink: (Default)
From: [personal profile] spamsink
Немонотонность на w=5 очень удивительна.