Entry tags:
Куй дипсика пока горячо
Раз уж публика увлеклась новомодной нейронной сетью DeepSeek, коллеги решили запустить её на нашем чипе. Причём с очень приличной производительностью: больше 30 токенов в секунду. Общее потребление системы не превышает 10 ватт.
no subject
no subject
Это дистиллированная модель, маленькая. Большая в этот чип вряд ли влезет.
no subject
no subject
Когда-нибудь наши application инженеры сделают, тогда я и скажу результат.
no subject
no subject
no subject
Время анализа промпта от 0.67 до 2.50 секунд.
no subject
no subject
эмерджентные свойства модели (тот самый интеллект) начинаются с 70B,как я понимаю
no subject
no subject