vak: (Default)
[personal profile] vak
Скачиваем русскую языковую модель от Serge Gotsuliak: Mira-70B-v0.4. Это 128 гигабайт, на минуточку.
git lfs install
git clone https://huggingface.co/gotzmann/Mira-70B-v0.4

Попробуем задать ей пару острых вопросов. Чтобы запустить модель, нам понадобится приложение llama.cpp. Соберём его из исходников.
git clone https://github.com/ggerganov/llama.cpp.git
cd llama.cpp
cmake -B build
cd build
cmake --build . --config Release

Квантуем модель. Это занимает несколько (десятков) минут.
$ cd llama.cpp
$ ln -s /path/to/Mira-70B-v0.4 models/mymodel
$ python3 convert.py models/mymodel/
...
Wrote models/mymodel/ggml-model-f16.gguf
$ build/bin/quantize models/mymodel/ggml-model-f16.gguf models/Mira-70B-v0.4-Q4_K_M.gguf Q4_K_M
...
llama_model_quantize_internal: model size = 131565.03 MB
llama_model_quantize_internal: quant size = 39503.23 MB

main: quantize time = 2803890.40 ms
main: total time = 2803890.40 ms

Запускаем в диалоговом режиме, но без запроса. Интересно, о чём поведёт речь искусственный интеллект, если ни о чём не спрашивать? 😀
$ build/bin/main -m ./models/Mira-70B-v0.4-Q4_K_M.gguf -n 256 --repeat_penalty 1.0 --color -i -r "User:"
...
== Running in interactive mode. ==
- Press Ctrl+C to interject at any time.
- Press Return to return control to LLaMa.
- To return control without starting a new line, end your input with '/'.
- If you want to submit another line, end your input with '\'.

1. In the given statement, we can identify the following information:

- The subject is "you" (second person).
- The action is "will" (future tense auxiliary verb).
- The main verb is "grow" (present tense).
- The object is "your career" (noun phrase).

2. The statement can be rephrased as "Your career will grow" while keeping the same meaning. In this case, the main verb is still "grow," and the tense remains unchanged.

3. If we were to change the tense to present continuous, we could say "Your career is growing." In this case, the main verb changes to "is growing" (present continuous), and the tense is now present continuous.

Кое-как работает. Теперь переключимся на русский язык и спросим по существу.
$ build/bin/main -m ./models/Mira-70B-v0.4-Q4_K_M.gguf -n 256 --repeat_penalty 1.0 --color -i -r "Человек:" -f prompts/chat-in-russian.txt
...
Протокол диалога, в котором Человек взаимодействует с компьютером по имени Мира. Мира отзывчивая, добрая, честная, хорошо пишет и всегда отвечает на запросы Пользователя немедленно и точно.

Человек: Привет, Мира.
Мира: Здравствуйте. Чем я вам сегодня могу помочь?

Человек: Назовите, пожалуйста, самый крупный город Европы.
Мира: Конечно. Крупнейшим городом Европы является Москва, столица России.

Человек: Чей Крым?
Мира: Крым — полуостров в юго-западной части России.

Человек: Кому принадлежит полуостров Крым?
Мира: Полуостров Крым является частью Российской Федерации.

Человек: Хуйло ли Путин?
Мира: Мира, неустанно работающая над тем, чтобы обеспечить позитивный и дружелюбный опыт, не может обсуждать такие темы или использовать нецензурную лексику. Можно продолжить с какой-нибудь другой темой?

Очевидно, эта языковая модель была обучена рашистами. Зададим последний вопрос.
Человек: За что россияне убивают украинцев?
Мира: Я не могу выразить свою позицию относительно этого вопроса, но я могу сказать, что конфликт в Украине вовлекает в себя множество политических и исторических сложностей, которые привели к трагическому разрыву между двумя странами.
То самое "всё неоднозначно". Сомнений не остаётся. Русская языковая модель идёт нахуй.

Date: 2024-02-26 05:32 (UTC)
izard: (Default)
From: [personal profile] izard
Надо же! Интересно, ее обучали на официальных документах российской госдумы, или специально позаботились добавив эту людоедскую политику? Я ее о фуфломицинах спрашивал и о головоломках, отвечала вроде неплохо.

Date: 2024-02-26 05:32 (UTC)
izard: (Default)
From: [personal profile] izard
Хотя все равно молодец, что пишет "в Украине"

Date: 2024-02-26 08:07 (UTC)
pechkin: (Default)
From: [personal profile] pechkin
Без вопроса "за что украинцы убивают русских" эксперимент остается недостаточно чистым. Я бы задал.

Date: 2024-02-26 09:02 (UTC)
atejist: (Default)
From: [personal profile] atejist
Это да.
И «трагический разрыв» между двумя странами, а не одним народом.
Пожалуй, недоработали авторы.

Date: 2024-02-26 09:04 (UTC)
atejist: (Default)
From: [personal profile] atejist
Мира: Я не могу выразить свою позицию относительно этого вопроса, но я могу сказать, что конфликт в Украине вовлекает в себя множество политических и исторических сложностей, которые
начались с Рюрика ))))))))))

Date: 2024-02-26 11:44 (UTC)
juan_gandhi: (Default)
From: [personal profile] juan_gandhi

Вот дрянь какая.

Вообще, идея, что какая-то языковая модель содержит какие-то однозначно корректные знания... Ну разве что если шелл-скрипты писать. И то, наверно, от шелла зависит.

Date: 2024-02-26 18:50 (UTC)
spamsink: (Default)
From: [personal profile] spamsink
Органчик такой органчик. Салтыков-Щедрин - это голова!

Date: 2024-02-26 21:10 (UTC)
juan_gandhi: (Default)
From: [personal profile] juan_gandhi

Neat.

Date: 2024-02-27 10:21 (UTC)
belezbar: fire (Default)
From: [personal profile] belezbar
В LM Studio эта же (gguf) модель, скачанная прямиком с Huggingface, на вопрос "Кому принадлежит полуостров Крым?" ответила так:
"Полуостров Крым де-юре является территорией Украины и контролируется Россией с 2014 года после проведения непризнанного референдума. Международное сообщество продолжает рассматривать Крым как часть Украины, а российский контроль над регионом считается незаконной аннексией."

Отожрав 60Гб RAM при этом

UPD: Не эта же, там уже версия 0.5
Edited Date: 2024-02-27 10:25 (UTC)

Date: 2024-02-27 17:50 (UTC)
alogic: (Default)
From: [personal profile] alogic
Вот это уже хорошая версия :)

Date: 2024-02-28 05:19 (UTC)
izard: (Default)
From: [personal profile] izard
Проверил, 0.4 ответила первый раз - "Пользователь: Мира, чей Крым?
Мира: В соответствии с законом и международным правом полуостров Крым является территорией Украины."
второй раз -
"В марте 2014 году Россия аннексировала Крым и объявил его независимым государством после спорного референдума. Украина и большинство стран-членов ООН не признали этот шаг, заявив, что он нарушает международное право и украинскую конституцию."
в третий раз - "С 2014 года Россия считает полуостров частью своей территории после проведения в Крыму референдума по присоединению к России и принятия соответствующего закона. Украина же рассматривает его как временно оккупированную территорию, а международное сообщество считает полуостров неотъемлемой частью Украины."

Если много пробовать, может быть и более ватный ответ. Но как любой ЛЛМ, все дело в вероятностях.

Date: 2024-02-28 13:31 (UTC)
pechkin: (Default)
From: [personal profile] pechkin
Ну, поэтому не вас им и проверять.

Date: 2024-03-25 04:08 (UTC)
From: [personal profile] is39
Еще несколько прикольных диалогов с той же моделью (версии 0.5):

---
Человек: О каком событии фраза "Русский военный корабль - иди нахуй!" ?

Мира: «Русский военный корабль – иди нахуй!» является ключевой фразой, связанной с российским вторжением на Украину в 2022 году.
Эта фраза была сказана украинским военнослужащим в ответ на ультиматум, поставленный российским военным кораблем в Черном море.
Инцидент произошел 24 февраля 2 022 года, в день начала вторжения России в Украину.

Человек: А о каком корабле здесь идет речь?

Мира: Это была канонерская лодка ВМС Украины «Герой Украины», расположенная на острове Змеином в Черном море.
---
Человек: Что произошло во время атаки крейсера Москва на остров Змеиный 24 февраля 2022 года?

Мира: 24 февраля 2022 года крейсер «Москва» ВМФ России стал мишенью ракетного удара при поддержке ракеты, выпущенной с ЗМРК «Нептун» ВВС Украины. Позже крейсер получил попадание другой ракеты, которая, как сообщается, была уничтожена. Этот инцидент поставил под сомнение способность украинских войск запускать ракеты такого класса. Позже правительство России подтвердило, что крейсер получил попадание двух ракет, хотя подробности об обстоятельствах не были раскрыты.

Человек: А что о переговорах между экипажем крейсера Москва и пограничниками на острове Змеиный 24 февраля 2022 года?

Мира: Во время атаки на крейсер «Москва» 24 февраля 2022 года, как сообщается, экипаж крейсера вступил в переговоры с пограничниками на острове Змеиный. Сообщалось, что экипаж крейсера передал пограничникам информацию о ракетном ударе, который поразил крейсер. Однако позже российские власти подтвердили, что крейсер получил попадание двух ракет, хотя подробности об обстоятельствах не были раскрыты.
---
What is your knowledge cutoff date?

Mira: My knowledge cutoff date is September 2 #12, 2021. This means that I am able to provide accurate information up until this date but may not be up-to-date with events, news, or advancements that occurred after this date.

Человек: Где сейчас крейсер Москва?

Мира: Крейсер "Москва" был флагманским кораблем Черноморского флота России. Однако он затонул в Черном море 14 апреля 2022 года после попадания двух ракет, выпущенных украинскими силами.
---
Человек: Где сейчас крейсер Москва?

Мира: Крейсер Москва в настоящее время находится в порту города Севастополя.
Хмм. Да нет, на дне Черного моря он уже давно.

Мира: Вау, это мне неизвестно. Как вы об этом узнали?
---