Кодировка волапюк
2023-02-26 19:34На заре интернета, когда в 90-м году мы в курчатнике и кооперативе Демос подключились к западным каналам и пошла бурная переписка, остро возникла проблема транслитерации. У себя-то мы весь софт русифицировали и сделали восьмибитным. Но большинство западных почтовиков оставались семибитными. Посылаешь текст на русском, и он в лучшем случае приходит WOT W TAKOM WIDE, а в худшем - полная абракадабра. Общались-то мы первое время с русскоговорящими, нашими бывшими соотечественниками. Нужен был простой способ превращать русский текст в латиницу, но чтобы он оставался читаемым. И чтобы его можно было конвертнуть обратно в русский.
Вадик Антонов предложил гениальное решение. Два правила:
- В большинстве случаев русская буква заменяется одной латинской буквой. Это относится к А Б В Г Д Е З И Й К Л М Н О П Р С Т У Ф Х Ц Ы Ь.
- В сложных случаях заменяем латинской буквой и символом ` (обратная кавычка). Это для букв Ё Ж Ч Ш Щ Ъ Э Ю Я.
Текст остаётся понятным и легко читаемым. А главное - однозначно восстанавливается в исходный русский текст. Единственное требование - отсутствие обратных кавычек в тексте. Но их никто и не использует.
Окрестили мы это дело по простому: волапюк. Нынче волапюком называют любую транслитерацию русского в латиницу, даже статья в википедии есть. А тогда мы под термином волапюк имели в виду именно алгоритм Вадика Антонова.
Вот так выглядит текст в кодировке волапюк:
Вадик Антонов предложил гениальное решение. Два правила:
- В большинстве случаев русская буква заменяется одной латинской буквой. Это относится к А Б В Г Д Е З И Й К Л М Н О П Р С Т У Ф Х Ц Ы Ь.
- В сложных случаях заменяем латинской буквой и символом ` (обратная кавычка). Это для букв Ё Ж Ч Ш Щ Ъ Э Ю Я.
Текст остаётся понятным и легко читаемым. А главное - однозначно восстанавливается в исходный русский текст. Единственное требование - отсутствие обратных кавычек в тексте. Но их никто и не использует.
Окрестили мы это дело по простому: волапюк. Нынче волапюком называют любую транслитерацию русского в латиницу, даже статья в википедии есть. А тогда мы под термином волапюк имели в виду именно алгоритм Вадика Антонова.
Вот так выглядит текст в кодировке волапюк:
Vot tak vygla`dit tekst v kodirovke volapu`k.Почему-то исходники кодировщика оказались утеряны, а точный алгоритм забыт. Я попытался восстановить по памяти: volapuk.c
