vak: (Робот 1)
Serge Vakulenko ([personal profile] vak) wrote2025-02-18 12:07 pm

Куй дипсика пока горячо

Раз уж публика увлеклась новомодной нейронной сетью DeepSeek, коллеги решили запустить её на нашем чипе. Причём с очень приличной производительностью: больше 30 токенов в секунду. Общее потребление системы не превышает 10 ватт.
juan_gandhi: (Default)

[personal profile] juan_gandhi 2025-02-18 08:30 pm (UTC)(link)
О ни фига себе! Вот это отличный бенчмарк! А сколько на большой модели deepseek уйдёт на вычисление 2*3-1?
sobriquet9: (Default)

[personal profile] sobriquet9 2025-02-18 11:31 pm (UTC)(link)

Это дистиллированная модель, маленькая. Большая в этот чип вряд ли влезет.

juan_gandhi: (Default)

[personal profile] juan_gandhi 2025-02-19 12:43 pm (UTC)(link)
А, ну да. Ну ладно. Меня позабавило, что на моём маке он минут так десять размышлял, в процессе излагая, как он это будет вычислять.
spamsink: (Default)

[personal profile] spamsink 2025-02-18 09:09 pm (UTC)(link)
Это скорость чего - анализа промпта или генерации ответа?
spamsink: (Default)

[personal profile] spamsink 2025-02-18 10:16 pm (UTC)(link)
Вещь!
mikerrr: (Default)

[personal profile] mikerrr 2025-02-19 08:59 am (UTC)(link)
1.5B - это ж ни о чем,
эмерджентные свойства модели (тот самый интеллект) начинаются с 70B,как я понимаю
mikerrr: (Default)

[personal profile] mikerrr 2025-02-19 09:56 am (UTC)(link)
Тут я с вами не согласен