Date: 2022-04-12 17:02 (UTC)
sab123: (Default)
From: [personal profile] sab123
Я тут, кстати, поэкспериментировал с таким, и выходит, что использовать короткие числа для тренинга невозможно - мелкие градиенты теряются. Это только модифицировать уже тренированную модель. Но и там проблемы, поскольку коэффициенты норовят вылазить из дмапазона [-1, 1].

Date: 2022-04-13 00:02 (UTC)
perdakot: (Default)
From: [personal profile] perdakot
Я думал это хоть про vector quantization, а тут какое-то совсем копетанство.