vak: (Default)
[personal profile] vak
Народ предлагает новый язык rulex для регулярных выражений. Старый язык regex уже достал: в нём никто ничего не понимает. :)

Новый язык гораздо более дружественный для человека. В нём незначащие пробелы, есть комментарии и переменные. Пример с переменными:
let operator = '+' | '-' | '*' | '/';
let number = '-'? [digit]+;

number (operator number)*
Ещё один пример: проверка паролей. Вот регулярное выражение, проверяющее, что в строке есть как минимум одна большая буква, одна маленькая, одна цифра, один знак препинания и всего не меньше восьми символов. Попробуйте разобраться.
^(?=[\S\s]*?\d)(?=[\S\s]*?\p{Ll})(?=[\S\s]*?\p{Lu})(?=[\S\s]*?[\pP\pS])[\S\s]{8}
То же самое на новом языке rulex:
<%
(>> [cp]* [digit])
(>> [cp]* [Ll])
(>> [cp]* [Lu])
(>> [cp]* [P S])
[cp]{8}
Введение в язык: introduction

Полное описание языка: rulex-rs.github.io/docs

Date: 2022-06-07 03:13 (UTC)
juan_gandhi: (Default)
From: [personal profile] juan_gandhi

Ха, имеет смысл. На перле когда-то регулярки можно было писать вполне нормальные (с комментариями) - но то перл.

А этот же должен в регулярку и компилироваться.

Edited Date: 2022-06-07 03:16 (UTC)

Date: 2022-06-07 08:04 (UTC)
norian: (Default)
From: [personal profile] norian
зачем его компилять в регулярку когда можно сразу в какой-нть ллвм

Date: 2022-06-07 10:56 (UTC)
juan_gandhi: (Default)
From: [personal profile] juan_gandhi

Регулярка интерпретируется везде, и в джаве, и в шелле, и в джаваскрипте.

Date: 2022-06-07 11:44 (UTC)
norian: (Default)
From: [personal profile] norian
интерпретаторы медленные, джава скорее всего компиляет в байткод, а ллвм тот же байткод только в профиль

Date: 2022-06-14 22:36 (UTC)
From: [personal profile] ichthuss
Речь о том, что если эту штуку транспайльнуть в обычные регулярки, то их потом можно засунуть в любой язык, не дожидаясь, пока разработчики этого любого языка воплотят регулярки новомодные.

Date: 2022-06-07 04:15 (UTC)
From: [personal profile] iamjaph
Но ведь "[\S\s]" - это просто ".", а "*?" - это просто "*"!

^(?=.*\d)(?=.*\p{Ll})(?=.*\p{Lu})(?=.*[\pP\pS]).{8}

На perl можно включить режим "незначащие пробелы и комментарии":

^
(?=.*\d)
(?=.*\p{Ll})
(?=.*\p{Lu})
(?=.*[\pP\pS])
.{8}

Edited Date: 2022-06-07 04:20 (UTC)

Date: 2022-06-07 11:23 (UTC)
kondybas: (Default)
From: [personal profile] kondybas
У \S и \s есть некоторые нюансы с новой строкой, *? от просто * отличается нежадностью.

Date: 2022-06-07 13:01 (UTC)
From: [personal profile] iamjaph
Так в rulex варианте нет слова lazy!

Новая строка для проверки пароля?
Кстати нюанс, с новой строкой, в перл также регулируется модификатором.

Я о том, что сравнение необъективное.

Date: 2022-06-07 06:40 (UTC)
ordinary_joe_backup: (Default)
From: [personal profile] ordinary_joe_backup
а вот давно пора!

Date: 2022-06-07 06:40 (UTC)
mikerrr: (Default)
From: [personal profile] mikerrr
о! наконец-то!

Date: 2022-06-07 07:59 (UTC)
norian: (Default)
From: [personal profile] norian
хде-то что-то большое сдохло наверно

потому как регекспы идеологически не совпадают ни с декларативными, ни с функциональными йазыками и с сиквелом тоже и моск должен переключацца каждый раз заново и помнить что все эти бэкслэши значат

ну и всякие L и S тоже по хорошему надо заменить на [upper] [lower] [special], чо место жалеть

и добавить предикат [exists] который находит N паттернов и вываливаецца, ну и булеву логику

((>> [exists] [digit] [3]) &
(>> [exists] [upper]) &
(>> [exists] [lower] [2])) |
((>> [exists] [special]) &
[count>=]{8})
Edited Date: 2022-06-07 08:19 (UTC)

Date: 2022-06-07 10:58 (UTC)
juan_gandhi: (Default)
From: [personal profile] juan_gandhi

Есть же разница между регулярными языками и контекстно-свободными. Какая еще булева логика, какие предикаты...

Date: 2022-06-07 11:43 (UTC)
norian: (Default)
From: [personal profile] norian
туда уже булева логика воткнута как AND связка, осталось только её повернуть лицом к

Date: 2022-06-07 16:02 (UTC)
juan_gandhi: (Default)
From: [personal profile] juan_gandhi

Если скобки добавить, то язык будет нерегулярный.

Date: 2022-06-07 18:24 (UTC)
doldonius: (Default)
From: [personal profile] doldonius
"Существует 10 несовместимых стандартов. Давайте придумаем стандарт, который устроит всех!"

Date: 2022-06-07 19:09 (UTC)
doldonius: (Default)
From: [personal profile] doldonius
Ага. Вот, стало быть, откуда это.

Date: 2022-06-14 22:39 (UTC)
From: [personal profile] ichthuss
Для тех, кто вставляет XKCD без alt-текста, в аду... А, ладно.

Date: 2022-06-15 16:08 (UTC)
From: [personal profile] dijifi
На бескурсорных платформах все норм. Жмите на капу, переходите по линку, и будет вам счастье.