Умные товарищи упростили веса нейронных сетей до троичной логики, и доказывают, что для языковых моделей это самое то, что надо.
"Scalable MatMul-free Language Modeling"
"By constraining the weights to the set {−1, 0, +1} and applying additional quantization techniques, MatMul operations are replaced with addition and negation operations."
Исходники на Гитхабе: github.com/ridgerchu/matmulfreellm
"Scalable MatMul-free Language Modeling"
"By constraining the weights to the set {−1, 0, +1} and applying additional quantization techniques, MatMul operations are replaced with addition and negation operations."
Исходники на Гитхабе: github.com/ridgerchu/matmulfreellm

no subject
Date: 2024-06-28 21:04 (UTC)Ха, действительно - при большой размерности почти пофиг.
no subject
Date: 2024-06-29 05:43 (UTC)no subject
Date: 2024-06-29 11:09 (UTC)Диод двоичен, триод троичен.
На чём Сетунь работала? На лампах?
no subject
Date: 2024-06-29 11:14 (UTC)