vak: (Робот 1)
[personal profile] vak
Раз уж публика увлеклась новомодной нейронной сетью DeepSeek, коллеги решили запустить её на нашем чипе. Причём с очень приличной производительностью: больше 30 токенов в секунду. Общее потребление системы не превышает 10 ватт.

Date: 2025-02-18 20:30 (UTC)
juan_gandhi: (Default)
From: [personal profile] juan_gandhi
О ни фига себе! Вот это отличный бенчмарк! А сколько на большой модели deepseek уйдёт на вычисление 2*3-1?

Date: 2025-02-18 23:31 (UTC)
sobriquet9: (Default)
From: [personal profile] sobriquet9

Это дистиллированная модель, маленькая. Большая в этот чип вряд ли влезет.

Date: 2025-02-19 12:43 (UTC)
juan_gandhi: (Default)
From: [personal profile] juan_gandhi
А, ну да. Ну ладно. Меня позабавило, что на моём маке он минут так десять размышлял, в процессе излагая, как он это будет вычислять.

Date: 2025-02-18 21:09 (UTC)
spamsink: (Default)
From: [personal profile] spamsink
Это скорость чего - анализа промпта или генерации ответа?

Date: 2025-02-18 22:16 (UTC)
spamsink: (Default)
From: [personal profile] spamsink
Вещь!

Date: 2025-02-19 08:59 (UTC)
mikerrr: (Default)
From: [personal profile] mikerrr
1.5B - это ж ни о чем,
эмерджентные свойства модели (тот самый интеллект) начинаются с 70B,как я понимаю

Date: 2025-02-19 09:56 (UTC)
mikerrr: (Default)
From: [personal profile] mikerrr
Тут я с вами не согласен