Доброе утро.
В Сбт, 03.09.2005, в 14:39, Alexander пишет:
> KOI 8 это устаревший формат, который силами "старателей" жив до сих
> пор (ну не такой в русском языке алфавит "АБЦДЕФГ", маразм). И создаёт
> путаницу. Но между 1251 и KOI 8 особо большой разницы нет.
Не совсем маразм, текст KOI-8 за счет этого довольно успешно читается,
если обнулить старший бит. Учитывая года появления этого стандарта, это
весьма было актуально. Тем более, что это реально ничему не мешает.
Другое дело, что наборы дополнительных символов (не относящихся к
кириллице), у них разные и иногда это может играть свою роль.
Вообще же, выбор между cp1251 и koi8-r, ИМХО, стоит вести отталкиваясь
от того, что больше ценно конкретно для вас - лучшая поддержка Windows
или лучшая поддержка российского сообщества пользователей GNU/Linux (и
других свободных систем), где KOI8-R давно является стандартом.
Другое дело, что я считаю, что российское сообщество отдельными местами
слишком уж цепляется за уходящий поезд KOI8-R. Периодически
встречающиеся рекомендации по переводу свежих Fedora Core и SuSE на
использование KOI8-R давно уже пора объявить вредительскими.
> Для меня вопрос между 1251 и UTF8. Но чтобы определится нужно узнать
> больше о UTF. Например, почему 8. То есть понять в общих чертах что
> за зверь, а не просто "мне название нравится". Я понимаю что это юникод,
> но и юникодов тоже много.
К сожалению, нет ссылок на толковые документы на русском по вопросам
Unicode. Если вкратце, то у UTF-8 перед другими юникодами есть одно
большое преимущество - полная совместимость с ASCII. Отличительная
особенность UTF-8 - символы кодируются _переменным_ количеством байт, от
1 до 4 (в ранних версиях стандарта было до 6). Русский алфавит находится
в пространстве двухбайтовых, а вот различные восточные иероглифы уже
кодируются как трех- и четырехбайтовые.
UTF16, использующийся в Windows, применяет двухбайтовое кодирование вне
зависимости от языка, за счет чего несовместим с ASCII.
Есть и 32-разрядный Unicode, который, как я понимаю, используется в
качестве референсного, поскольку в тот же UTF16 входят не все возможные
символы.
> Вот только какая будет цена перехода и стоит ли оно того ?
Все зависит от конкретного случая, если система уже стоит, а уж тем
более, стоит давно, то может оно того и не стоит. Но, повторюсь,
современные системы с этим проблем практически не имеют, не считая
экзотичных вещей, вроде уже упоминавшегося здесь zsh.
> То есть вопрос - а почему UTF 8 ?
Это лучшее решение языковых проблем в GNU/Linux. Поддерживается как
разработчиками Linux, так и разработчиками GNU.
--
Roman
,---------------------------. ,--------------------------.
/ http://www.3os.ru/ V http://www.osrc.info/ \ .o.
\ mailto: rik@3*****.ru ^ mailto: rik@o*****.info / ..o
`---------------------------' `--------------------------' ooo
gpg --recv-keys 0xE5E055C3 --keyserver hkp://subkeys.pgp.net
-*Название листа "Linux: разрешение вопросов, перспективы и общение";
Написать в лист: mailto:comp.soft.linux.discuss-list@subscribe.ru
Адрес правил листа http://subscribe.ru/catalog/comp.soft.linux.discuss/rules
Номер письма: 21279; Возраст листа: 771; Участников: 1403
Адрес сайта рассылки: http://www.linuxrsp.ru
Адрес этого письма в архиве: http://subscribe.ru/archive/comp.soft.linux.discuss/msg/430004