vak: (Default)
[personal profile] vak
Восьмибитные кодировки умирают на глазах. Большинство современных операционных систем изначально настроено на хранение текстов в Unicode UTF-8. Периодически по жизни приходится решать задачу перекодирования старых архивов.

Вручную залезать в каждый файл и "на глаз" определять кодировку несколько утомительно. Благо, эту задачу можно автоматизировать: известен алгоритм распознавания по парам соседних букв.

Вот простая утилита toutf, решающая данную задачу.