vak: (Default)
[personal profile] vak
Умные товарищи упростили веса нейронных сетей до троичной логики, и доказывают, что для языковых моделей это самое то, что надо.

"Scalable MatMul-free Language Modeling"

"By constraining the weights to the set {−1, 0, +1} and applying additional quantization techniques, MatMul operations are replaced with addition and negation operations."

Исходники на Гитхабе: github.com/ridgerchu/matmulfreellm

Date: 2024-06-28 21:04 (UTC)
juan_gandhi: (Default)
From: [personal profile] juan_gandhi

Ха, действительно - при большой размерности почти пофиг.

Date: 2024-06-29 05:43 (UTC)
x86128: (Default)
From: [personal profile] x86128
Осталось только придумать стабильный троичный транзистор

Date: 2024-06-29 11:09 (UTC)
juan_gandhi: (Default)
From: [personal profile] juan_gandhi

Диод двоичен, триод троичен.

На чём Сетунь работала? На лампах?

Date: 2024-06-29 11:14 (UTC)
x86128: (Default)
From: [personal profile] x86128
Давно читал про Сетунь. Вроде бы было две версии. Первая на каких-то хитрых но медленных элементах на основе феритовых колечек, а практическая версия кодировала трит двумя линиями, на которых двоичный сигнал.