Кодировки за и против
Здравствуйте !
Подскажите пожалуста какую кодировку лучше использовать в Линукс
CP1251, KOI или UTF8
и почему?
С уважением Игорь Тарасюк
За последние 60 дней ни разу не выходила
Сайт листа:
http://www.linuxrsp.ru
Открыт:
25-07-2003
Пре-модерация: Нет
Адрес для писем в лист: comp.soft.linux.discuss-list@subscribe.ru
Адрес
модератора: comp.soft.linux.discuss-owner@subscribe.ru
Здравствуйте !
Подскажите пожалуста какую кодировку лучше использовать в Линукс
CP1251, KOI или UTF8
и почему?
С уважением Игорь Тарасюк
несколько раз, да в живот, в живот....
-*Название листа "Linux: разрешение вопросов, перспективы и общение";
Написать в лист: mailto:comp.soft.linux.discuss-list@subscribe.ru
Адрес правил листа http://subscribe.ru/catalog/comp.soft.linux.discuss/rules
Номер письма: 21234; Возраст листа: 769; Участников: 1404
Адрес сайта рассылки: http://www.linuxrsp.ru
Адрес этого письма в архиве: http://subscribe.ru/archive/comp.soft.linux.discuss/msg/428548
несколько раз, да в живот, в живот....
-*Название листа "Linux: разрешение вопросов, перспективы и общение";
Написать в лист: mailto:comp.soft.linux.discuss-list@subscribe.ru
Адрес правил листа http://subscribe.ru/catalog/comp.soft.linux.discuss/rules
Номер письма: 21235; Возраст листа: 769; Участников: 1404
Адрес сайта рассылки: http://www.linuxrsp.ru
Адрес этого письма в архиве: http://subscribe.ru/archive/comp.soft.linux.discuss/msg/428551
В Чтв, 01/09/2005 в 16:27 +0400, Roman I Khimov пишет:
KOI8-R тоже
А с каких пор в Linux-овых ФС стала какое-то значение играть кодировка
(в смысле не ФС-ное это дело).
Если нужны одновременно русский, ангийслкий, китайский, иврит и др.
то UTF-8 единсственный вариант. Но для большинства пользователей
прекрасно подойдет и KOI8-R
Все ли? А zsh там уже нормально с UTF-8 работает?
Общий вывод: с KOI8-R проблем не будет. С UTF-8 могут быть. ИМХО если
вам не нужно работать с кучей языков одновременно? то лучше - KOI8-R.
-*Название листа "Linux: разрешение вопросов, перспективы и общение";
Написать в лист: mailto:comp.soft.linux.discuss-list@subscribe.ru
Адрес правил листа http://subscribe.ru/catalog/comp.soft.linux.discuss/rules
Номер письма: 21237; Возраст листа: 769; Участников: 1404
Адрес сайта рассылки: http://www.linuxrsp.ru
Адрес этого письма в архиве: http://subscribe.ru/archive/comp.soft.linux.discuss/msg/428560
Доброе утро.
В Чтв, 01.09.2005, в 18:44, Max Vasin пишет:
Копните архивы LKML, это так. И очень жаль, что это не дело ФС,
поскольку в отсутствие "языкатых" опций монтирования с нестандартными
кодировками приходится маяться (BTW, в этом смысле Joliet на голову выше
Rockridge на CD, хоть последний и является стандартом в отличие от
первого). Ext3 позволяет использовать разные кодировки, но все это уже
нестандартно.
Дело в том, что UTF-8 позволяет вообще не думать о языках, а KOI8
работает только до тех самых замечательных пор, пока не приходится с их
разнообразием иметь дело и вот тогда начинается секс...
--
Roman
,---------------------------. ,--------------------------.
/ http://www.3os.ru/ V http://www.osrc.info/ \ .o.
\ mailto: rik@3*****.ru ^ mailto: rik@o*****.info / ..o
`---------------------------' `--------------------------' ooo
gpg --recv-keys 0xE5E055C3 --keyserver hkp://subkeys.pgp.net
-*Название листа "Linux: разрешение вопросов, перспективы и общение";
Написать в лист: mailto:comp.soft.linux.discuss-list@subscribe.ru
Адрес правил листа http://subscribe.ru/catalog/comp.soft.linux.discuss/rules
Номер письма: 21240; Возраст листа: 769; Участников: 1404
Адрес сайта рассылки: http://www.linuxrsp.ru
Адрес этого письма в архиве: http://subscribe.ru/archive/comp.soft.linux.discuss/msg/428646
В Чтв, 01/09/2005 в 20:48 +0400, Roman I Khimov пишет:
С этим никто не спорит. Но вот я привык к zsh, а работать мне приходится
с текстами на русском и английском (и только!). Смысла переходить на
UTF-8 не вижу.
-*Название листа "Linux: разрешение вопросов, перспективы и общение";
Написать в лист: mailto:comp.soft.linux.discuss-list@subscribe.ru
Адрес правил листа http://subscribe.ru/catalog/comp.soft.linux.discuss/rules
Номер письма: 21245; Возраст листа: 770; Участников: 1404
Адрес сайта рассылки: http://www.linuxrsp.ru
Адрес этого письма в архиве: http://subscribe.ru/archive/comp.soft.linux.discuss/msg/428813
В сообщении от 1125565985 секунд после начала Эпохи Igor написал(а):
Все зависит от того для чего вам Линукс, как вы с ним работаете и какие
приложения используете. Ну и конечно, где вы эту кодировку применяете.
В Линукс вам ничто не мешает хранить, редактировать и отображать файлы
в различных кодировках, именовать файлы в различных кодировках,
одновременно выполнять несколько приложений с различными установками
локали. В общем полная свобода!
On Fri, 2 Sep 2005 05:36:20 +0300
Konstantin Korikov <lostcl***@u*****.fm> wrote:
Спасибо всем откликнувшимся
Линукс хочу использовать под рабочку (под сервером он у меня давно
вертится). Надоел Windows вкрай - ресурсув жрет много (а с
антивирусом так вообще беда, особенно AVP как вцепится что нибуть
огромное проверять ;-( ) . Вот и на счeт свободы я с Вами полностью
согласен.
Но я скорее всего выберу UTF - он по умолчанию поддерживается в
дистрах (FC то точно, хочу попробовать еще SuSe), и мало что в
будущем понадобится.
Вот еще вопросик. У меня не серваке кодировка СР1251. Так исторически
сложилось, что samba кодирует в KOI8-R. Соответственно кирилица
отображается не лутшим образом. Как можно отобразить названия файлов и
каталогов в читабельном виде ?
--
С уважением
Игорь Тарасюк
А что мешает прописать нужные кодировки в опциях монтирования?
codepage=<то, что снаружи на сервере (а то samba-сервер тоже умеет
преобразовывать кодировки)>, iocharset=<то, что на Вашей машине>
-*Название листа "Linux: разрешение вопросов, перспективы и общение";
Написать в лист: mailto:comp.soft.linux.discuss-list@subscribe.ru
Адрес правил листа http://subscribe.ru/catalog/comp.soft.linux.discuss/rules
Номер письма: 21259; Возраст листа: 770; Участников: 1404
Адрес сайта рассылки: http://www.linuxrsp.ru
Адрес этого письма в архиве: http://subscribe.ru/archive/comp.soft.linux.discuss/msg/429186
В сообщении от 1125642840 секунд после начала Эпохи Igor написал(а):
Хороший выбор. Однако, могут возникнуть небольшие проблемки со старым
(морально, и не только) софтом. Но если вы используете в основном
современные графические среды, то беспокоится не о чем.
Ну это можно исправить. Существующие имена файлов, которые в KOI8-R,
можно перекодировать в СР1251, используя convmv например. После чего
подправить конфигурационный файл Samba, и указать чтобы он кодировал
имена файлов в СР1251 (что-то типа `unix charset = СР1251', для
Samba 3.X).
Если просто отобразить:
$ ls |iconv -f KOI8-R
Как менять локаль лишь для приложения?
В Сбт, 03/09/2005 в 23:47 +0700, Strong пишет:
LANG=чего-там-нужно команда
-*Название листа "Linux: разрешение вопросов, перспективы и общение";
Написать в лист: mailto:comp.soft.linux.discuss-list@subscribe.ru
Адрес правил листа http://subscribe.ru/catalog/comp.soft.linux.discuss/rules
Номер письма: 21312; Возраст листа: 772; Участников: 1405
Адрес сайта рассылки: http://www.linuxrsp.ru
Адрес этого письма в архиве: http://subscribe.ru/archive/comp.soft.linux.discuss/msg/430715
On Sat, 03 Sep 2005 23:47:44 +0700
Strong wrote:
Запускать надо так:
LC_ALL="ru_RU.cp1251" /usr/bin/app
--
Vladimir Rusinov aka B.
http://location.org.ru/
-*Название листа "Linux: разрешение вопросов, перспективы и общение";
Написать в лист: mailto:comp.soft.linux.discuss-list@subscribe.ru
Адрес правил листа http://subscribe.ru/catalog/comp.soft.linux.discuss/rules
Номер письма: 21332; Возраст листа: 773; Участников: 1405
Адрес сайта рассылки: http://www.linuxrsp.ru
Адрес этого письма в архиве: http://subscribe.ru/archive/comp.soft.linux.discuss/msg/431216
А "LANG=чего-там-нужно команда" здесь при чём?
On 9/5/05, Strong <s-stro***@m*****.ru> wrote:
Здесь есть такая (полезная иногда) особенность:
языковые настройки определяются несколькими переменными окружение
(набираем команду locale и любуемся). Так вот, LANG установит те из
них, которые явно не указаны (т.е. неопределены), а LC_ALL насильно
сделает так, как будто все они имеют одно значение (именно значение
LC_ALL. Зачем может понабобиться устанавливать некоторые параметры
локализации? Вот пример:
Формат чисел в локали ru_RU предполагает, что дробная часть
отделяется запятой. Иногда это может привести к проблемам. Тогда можно
в стартовом файле шелла установить LC_NUMERIC=C, а при запуске
программ указывать LANG=страна. Страна не будет в этом случае влиять
на формат чисел.
On Mon, 05 Sep 2005 22:23:56 +0700
Strong wrote:
LANG=locale_name может установить не все параметры locale.
LC_ALL означает, что сообщения программы будут полностью локализированы:
переведены на заданный язык (если перевод найдется), даты, цифры и ден.
еденицы будут выведены в соотвествии с национальными стандартами.
Сделайте
locale
и вы увидите все переменные оболочки, которые устанавливают локаль.
Можно сделать так, чтобы сообщения выводились на русском, но даты при
этом были бы стандартными. Вот например мой locale:
LANG=ru_RU.koi8r
LC_CTYPE="ru_RU.koi8r"
LC_NUMERIC=POSIX
LC_TIME="ru_RU.koi8r"
LC_COLLATE="ru_RU.koi8r"
LC_MONETARY="ru_RU.koi8r"
LC_MESSAGES=POSIX
LC_PAPER="ru_RU.koi8r"
LC_NAME="ru_RU.koi8r"
LC_ADDRESS="ru_RU.koi8r"
LC_TELEPHONE="ru_RU.koi8r"
LC_MEASUREMENT="ru_RU.koi8r"
LC_IDENTIFICATION="ru_RU.koi8r"
LC_ALL=
Как видно, LC_NUMERIC услановлено в POSIX. Я это сделал из-за того, что
при ru_RU разделитель десятичных дробей - запятая, а не точка, к которой
я привык.
Кроме того, LC_MESSAGES также POSIX, так что в большинстве приложений у
меня нерусский (, а стандартный зашитый в прорамму) язык сообщений.
LC_ALL не установлен, т.к. его установка переопределила бы все остальные
LC_* и LANG
--
Vladimir Rusinov aka B.
http://location.org.ru/
-*Название листа "Linux: разрешение вопросов, перспективы и общение";
Написать в лист: mailto:comp.soft.linux.discuss-list@subscribe.ru
Адрес правил листа http://subscribe.ru/catalog/comp.soft.linux.discuss/rules
Номер письма: 21338; Возраст листа: 773; Участников: 1405
Адрес сайта рассылки: http://www.linuxrsp.ru
Адрес этого письма в архиве: http://subscribe.ru/archive/comp.soft.linux.discuss/msg/431356
Доброе утро.
В Чтв, 01.09.2005, в 13:13, Igor пишет:
Только UTF8.
1) Международный стандарт
2) Стандартная кодировка для Ext3.
3) Никаких проблем с различными языками.
Из минусов - неготовность до сих пор некоторых компонент GNU/Linux
работать с ней. Впрочем, если берете практически любой современный
дистрибутив вроде SuSE или Fedora Core, то оно все равно - дистрибьюторы
аккуратно все сглаживают.
[Эх, тут бы еще пнуть Subscribe за неподдержку UTF8...]
--
Roman
,---------------------------. ,--------------------------.
/ http://www.3os.ru/ V http://www.osrc.info/ \ .o.
\ mailto: rik@3*****.ru ^ mailto: rik@o*****.info / ..o
`---------------------------' `--------------------------' ooo
gpg --recv-keys 0xE5E055C3 --keyserver hkp://subkeys.pgp.net
-*Название листа "Linux: разрешение вопросов, перспективы и общение";
Написать в лист: mailto:comp.soft.linux.discuss-list@subscribe.ru
Адрес правил листа http://subscribe.ru/catalog/comp.soft.linux.discuss/rules
Номер письма: 21232; Возраст листа: 769; Участников: 1404
Адрес сайта рассылки: http://www.linuxrsp.ru
Адрес этого письма в архиве: http://subscribe.ru/archive/comp.soft.linux.discuss/msg/428447