Кодировка волапюк
2023-02-26 19:34На заре интернета, когда в 90-м году мы в курчатнике и кооперативе Демос подключились к западным каналам и пошла бурная переписка, остро возникла проблема транслитерации. У себя-то мы весь софт русифицировали и сделали восьмибитным. Но большинство западных почтовиков оставались семибитными. Посылаешь текст на русском, и он в лучшем случае приходит WOT W TAKOM WIDE, а в худшем - полная абракадабра. Общались-то мы первое время с русскоговорящими, нашими бывшими соотечественниками. Нужен был простой способ превращать русский текст в латиницу, но чтобы он оставался читаемым. И чтобы его можно было конвертнуть обратно в русский.
Вадик Антонов предложил гениальное решение. Два правила:
- В большинстве случаев русская буква заменяется одной латинской буквой. Это относится к А Б В Г Д Е З И Й К Л М Н О П Р С Т У Ф Х Ц Ы Ь.
- В сложных случаях заменяем латинской буквой и символом ` (обратная кавычка). Это для букв Ё Ж Ч Ш Щ Ъ Э Ю Я.
Текст остаётся понятным и легко читаемым. А главное - однозначно восстанавливается в исходный русский текст. Единственное требование - отсутствие обратных кавычек в тексте. Но их никто и не использует.
Окрестили мы это дело по простому: волапюк. Нынче волапюком называют любую транслитерацию русского в латиницу, даже статья в википедии есть. А тогда мы под термином волапюк имели в виду именно алгоритм Вадика Антонова.
Вот так выглядит текст в кодировке волапюк:
Вадик Антонов предложил гениальное решение. Два правила:
- В большинстве случаев русская буква заменяется одной латинской буквой. Это относится к А Б В Г Д Е З И Й К Л М Н О П Р С Т У Ф Х Ц Ы Ь.
- В сложных случаях заменяем латинской буквой и символом ` (обратная кавычка). Это для букв Ё Ж Ч Ш Щ Ъ Э Ю Я.
Текст остаётся понятным и легко читаемым. А главное - однозначно восстанавливается в исходный русский текст. Единственное требование - отсутствие обратных кавычек в тексте. Но их никто и не использует.
Окрестили мы это дело по простому: волапюк. Нынче волапюком называют любую транслитерацию русского в латиницу, даже статья в википедии есть. А тогда мы под термином волапюк имели в виду именно алгоритм Вадика Антонова.
Вот так выглядит текст в кодировке волапюк:
Vot tak vygla`dit tekst v kodirovke volapu`k.Почему-то исходники кодировщика оказались утеряны, а точный алгоритм забыт. Я попытался восстановить по памяти: volapuk.c

no subject
Date: 2023-02-27 08:03 (UTC)Но, что она была полезна в отдельно взятом курчатнике - это да, не поспоришь.
no subject
Date: 2023-02-27 11:51 (UTC)Хм, интересная идейка. Я на это не глядел вообще как на что-то принципиальное; кто как писал. Потом, почтовик я себе просто сам навалял, чтобы с совамтелепортом общаться... да там и не было кириллицы. А в фидо все буквы, кроме Н, были норм.
А в Борланде сдуру букву Я решили использовать, в Дельфях, что ли, в качестве какого-то ограничителя текста. Вот народ зверел в России.
no subject
Date: 2023-02-27 13:03 (UTC)Сейчас то все сервера пришли к UTF-8, и клиенты тоже (почти все, кроме старого JMC).
Но и с UTF не все безоблачно, я вот читаю общение с разработчиками клиентов tintin++ и Mudlet, там появляются коллеги китайцы и корейцы и с их символами тоже не все безоблачно.
no subject
Date: 2023-02-27 13:04 (UTC)no subject
Date: 2023-02-27 13:06 (UTC)Зачем - чтобы чел, не имеющий кириллицы на клавиатуре, мог вводить кириллические команды
no subject
Date: 2023-02-27 21:27 (UTC)no subject
Date: 2023-02-27 21:46 (UTC)no subject
Date: 2023-02-27 22:02 (UTC)no subject
Date: 2023-02-27 22:41 (UTC)Народ тогда и обходился просто скриптом sed.
no subject
Date: 2023-02-28 00:45 (UTC)no subject
Date: 2023-02-28 01:57 (UTC)https://en.wikipedia.org/wiki/Volap%C3%BCk
no subject
Date: 2023-02-28 06:05 (UTC)