vak: (Default)
[personal profile] vak
Сгенерил картинку кота Бегемота по текстовому описанию (mage.space). Душераздирающее зрелище. Искусственный интеллект по прежнему в большом долгу.

"enormous demonic black cat who speaks walks on two legs transform to human shape chess vodka pistols obnoxious sarcasm"

Date: 2022-11-19 20:40 (UTC)
dmm: (Default)
From: [personal profile] dmm
Мне нравится - такой кот-динозавр!

Date: 2022-11-19 20:45 (UTC)
ordinary_joe_backup: (Default)
From: [personal profile] ordinary_joe_backup
На ту же фразу сгенерило вот такое

Date: 2022-11-19 20:52 (UTC)
ordinary_joe_backup: (Default)
From: [personal profile] ordinary_joe_backup
Ну это надо эту тварину спросить, которая это нагенерила, ггг

Date: 2022-11-19 20:54 (UTC)
ordinary_joe_backup: (Default)
From: [personal profile] ordinary_joe_backup
Рефрешнул страницу и оно сгенерило так на ту же фразу

Date: 2022-11-19 23:25 (UTC)
ordinary_joe_backup: (Default)
From: [personal profile] ordinary_joe_backup
Но диапазон идей у софта этого широкий ;)

Date: 2022-11-19 21:02 (UTC)
dmm: (Default)
From: [personal profile] dmm
Ваших картинок не видать, поэтому трудно сказать, есть ли кот :-)

Может быть, он Чеширский :-)

Date: 2022-11-19 21:06 (UTC)
ordinary_joe_backup: (Default)
From: [personal profile] ordinary_joe_backup
А сейчас видно?

Date: 2022-11-19 21:12 (UTC)
dmm: (Default)
From: [personal profile] dmm
Да, теперь видно.

Довольно непредсказуемый креатив она генерит, но интересный :-)

Date: 2022-11-19 21:15 (UTC)
ordinary_joe_backup: (Default)
From: [personal profile] ordinary_joe_backup
Причем на ту ж самую фразу каждый раз совсем другое. Хотя я бы ожидал похожие картинки. Может быть даже повторяемость ожидалась бы от ии.

Date: 2022-11-19 21:25 (UTC)
dmm: (Default)
From: [personal profile] dmm
По эти модели надо думать, как про симуляторы. (В данном случае, это не такое точное описание, как про модели, используемые в autoregressive варианте, но, всё равно, это, в первом приближении, правильный подход.)

Она каждый раз генерирует новую "реальность", из распределения возможных реальностей, которое зависит от запроса. И дальше в этой реальности возникают разные сущности, и мы с ними имеем дела, с теми, с кем повезёт (но можно учиться управлять этим процессом).

Про autoregressive variant (like GPT-3) одна очень яркая девчонка разобралась подробно и нам объяснила; про text-to-image это не совсем точно, поскольку они не autoregressive, но, всё равно, похоже...

Я сделал про это небольшой пост и довольно подробные заметки:

https://dmm.dreamwidth.org/64434.html

https://github.com/anhinga/2022-notes/tree/main/Generative-autoregressive-models-are-similators

Date: 2022-11-19 21:32 (UTC)
ordinary_joe_backup: (Default)
From: [personal profile] ordinary_joe_backup
я очень далек от ИИ и нейросетей, у меня бытовое понимание этого вопроса, не профессиональное. Но спасибо, почитаю.

Date: 2022-11-19 22:18 (UTC)
dmm: (Default)
From: [personal profile] dmm
С пользовательской точки зрения, у этих моделей есть понятие температуры (иногда в интерфейсе дают возможность управлять этим параметром, а иногда просто ставят по своему усмотрению).

Чем холоднее, тем меньше разнообразие, и если поставить на максимальный холод, то на один и тот же запрос она будет давать один и тот же результат (но с творческими инструментами обычно так не делают, хотят, чтобы они предлагали разнообразные варианты).

Наоборот, если сделать слишком горячо, то она вообще почти перестанет принимать запрос во внимание в своих фантазиях, так что обычно настраивают какое-то компромиссное значение...

Date: 2022-11-19 22:30 (UTC)
ordinary_joe_backup: (Default)
From: [personal profile] ordinary_joe_backup
Это видимо зависит от того, чего мы хотим добиться. Если это например система распознавания чонить, ну типа допустим автопилот, то лучше бы чтоб она идентифицировала объекты максимально точно, а если типа картинки из слов генерить то канеш смешнее когда она "горячее".

Date: 2022-11-19 22:28 (UTC)
dmm: (Default)
From: [personal profile] dmm
(А, я смотрю, на этом сайте они используют другой параметр, вроде температуры, но он называется guidance scale и, наоборот, "подмораживает", когда его увеличивают. Но, видимо, нужно создать аккаунт, чтобы можно было им управлять.

"Guidance scale values between 7 and 8.5 are usually good choices for Stable Diffusion. By default the pipeline uses a guidance_scale of 7.5. If you use a very large value the images might look good, but will be less diverse.")

Date: 2022-11-19 22:31 (UTC)
ordinary_joe_backup: (Default)
From: [personal profile] ordinary_joe_backup
Ага, вот как!

Date: 2022-11-19 20:58 (UTC)
vlad_m: (Default)
From: [personal profile] vlad_m
Так про примус же ни слова!
Как работать в таких условиях!?

Date: 2022-11-20 01:36 (UTC)
From: [personal profile] dijifi
Primus stove генерит на ура

Date: 2022-11-20 02:12 (UTC)
magnoliasteel: Ava (Default)
From: [personal profile] magnoliasteel
В зависимости от того, кто спрашивает.
Прочла подробнее. Оказывается, что фирма так называлась, что часто бывает. Первая фирма была, которые изобрела и продавала. Над названием тоже не мучались: Primus-первый (латынь.)
https://en.wikipedia.org/wiki/Primus_stove