Юникод победил
2008-04-03 16:37Восьмибитные кодировки умирают на глазах. Большинство современных операционных систем изначально настроено на хранение текстов в Unicode UTF-8. Периодически по жизни приходится решать задачу перекодирования старых архивов.
Вручную залезать в каждый файл и "на глаз" определять кодировку несколько утомительно. Благо, эту задачу можно автоматизировать: известен алгоритм распознавания по парам соседних букв.
Вот простая утилита toutf, решающая данную задачу.
Вручную залезать в каждый файл и "на глаз" определять кодировку несколько утомительно. Благо, эту задачу можно автоматизировать: известен алгоритм распознавания по парам соседних букв.
Вот простая утилита toutf, решающая данную задачу.
