Отправляет email-рассылки с помощью сервиса Sendsay

За 2009-10-22

Re: сбой кодировки?

> > А зачем koi-8r сейчас?
>
> затем, что это стандарт для русской кириллицы в internet.
>
> Множество служебных и программистских приложений, сайтов по прежнему
> работают только с KOI8-R. Пересобрать их конечно можно, но это лишний гемор
> (раз) и после этого ваш русский перестает работать у тех у кого другая
> кодировка (можно export LANG делать конечно).
> а вот зачем 1251 сейчас и прочие однобайтные кодировки? =)
> Заставьте майкрософт использовать локаль utf8 вместо самопридуманной cp1251,
> а так же всех девелоперов переписать свой софт, движки и контенты сайтов,
> МСВС и прочие продукты снова получить сертификации ФСТЭК, переписать кучу
> rfc и тогда только будет счастье.
>
> Решение задачи ( iconv ) предложено и рабочее. C однобайтовыми кодировками
> работаем и работать будем не один год, если не десяток лет.

Вот лучше бы не так.

Недоразумение в виде несовместимых национальных кодировок и интернет-страниц,
на которых могли отображаться буквы
только двух алфавитов (один из которых обязательно латиница) кануло в лету и
стандартом является Юникод.

Переход был мучительным, но он давно состоялся и сегодня все нормальные дистрибутивы
и все нормальные
сайты используют UTF8. Это уже даже не предмет обсуждения. Национальные кодировки
канули в лету - Вы что-то упустили.

Это по-вашему не стандарт ? :

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="ru" lang="ru">
<head>
<meta http-equiv="Content-Language" content="ru" />
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />

-*Название листа "Linux: разрешение вопросов, перспективы и общение";
Написать в лист: mailto:comp.soft.linux.discuss-list@subscribe.ru
Адрес правил листа http://subscribe.ru/catalog/comp.soft.linux.discuss/rules
Номер письма: 36525; Возраст листа: 2281; Участников: 1401
Адрес сайта рассылки: http://www.linuxrsp.ru
Адрес этого письма в архиве: http://subscribe.ru/archive/comp.soft.linux.discuss/msg/925343

   2009-10-22 20:18:54 (#925343)

Re: сбой кодировки?

On 22.10.09 14:24, "Alexey" <Sleeping.Daem***@m*****.ru> wrote:

> On Thursday 22 October 2009 14:14:46 igor zaitsev wrote:
>> Всем доброго дня.
>>
>> не уверен в корректности формулировки сабжа :( Более пространно:
>> есть простой текстовый файл в кодировке cp1251, редактирую его в
>> gedit, всё нормально, но если я пытаюсь его сохранить в кодировке
>> koi8r? то получаю сообщение "Недопустимая последовательность байтов
>> для преобразования содержится во входной строке", ну и файл в нужной
>> кодировке не сохраняется.
>>
>> вопрос: как можно найти тот фрагмент файла, что содержит "недопустимую
>> последовательность байтов"?
>
> Есть такое.
> Просто некоторые символы с cp1251 попадают на "запрещёные" символы koi8
> А зачем koi-8r сейчас?

затем, что это стандарт для русской кириллицы в internet.

Множество служебных и программистских приложений, сайтов по прежнему
работают только с KOI8-R. Пересобрать их конечно можно, но это лишний гемор
(раз) и после этого ваш русский перестает работать у тех у кого другая
кодировка (можно export LANG делать конечно).
а вот зачем 1251 сейчас и прочие однобайтные кодировки? =)
Заставьте майкрософт использовать локаль utf8 вместо самопридуманной cp1251,
а так же всех девелоперов переписать свой софт, движки и контенты сайтов,
МСВС и прочие продукты снова получить сертификации ФСТЭК, переписать кучу
rfc и тогда только будет счастье.

Решение задачи ( iconv ) предложено и рабочее. C однобайтовыми кодировками
работаем и работать будем не один год, если не десяток лет.

-*Название листа "Linux: разрешение вопросов, перспективы и общение";
Написать в лист: mailto:comp.soft.linux.discuss-list@subscribe.ru
Адрес правил листа http://subscribe.ru/catalog/comp.soft.linux.discuss/rules
Номер письма: 36524; Возраст листа: 2281; Участников: 1401
Адрес сайта рассылки: http://www.linuxrsp.ru
Адрес этого письма в архиве: http://subscribe.ru/archive/comp.soft.linux.discuss/msg/925313

   2009-10-22 19:50:37 (#925313)

Re: сбой кодировки?

recode -f 1251..koi8r filename.txt

-*Название листа "Linux: разрешение вопросов, перспективы и общение";
Написать в лист: mailto:comp.soft.linux.discuss-list@subscribe.ru
Адрес правил листа http://subscribe.ru/catalog/comp.soft.linux.discuss/rules
Номер письма: 36521; Возраст листа: 2281; Участников: 1401
Адрес сайта рассылки: http://www.linuxrsp.ru
Адрес этого письма в архиве: http://subscribe.ru/archive/comp.soft.linux.discuss/msg/925151

   2009-10-22 15:48:16 (#925151)

Re: сбой кодировки?

igor zaitsev wrote:
> Всем доброго дня.
>
> не уверен в корректности формулировки сабжа :( Более пространно:
> есть простой текстовый файл в кодировке cp1251, редактирую его в
> gedit, всё нормально, но если я пытаюсь его сохранить в кодировке
> koi8r? то получаю сообщение "Недопустимая последовательность байтов
> для преобразования содержится во входной строке", ну и файл в нужной
> кодировке не сохраняется.
>
> вопрос: как можно найти тот фрагмент файла, что содержит "недопустимую
> последовательность байтов"?
>
>
Я почти уверена, что в тексте знак "No" есть, которого в кои-8 нету :)
Поищите по нему, наверняка других и не будет.

Юлия.

-*Название листа "Linux: разрешение вопросов, перспективы и общение";
Написать в лист: mailto:comp.soft.linux.discuss-list@subscribe.ru
Адрес правил листа http://subscribe.ru/catalog/comp.soft.linux.discuss/rules
Номер письма: 36520; Возраст листа: 2281; Участников: 1401
Адрес сайта рассылки: http://www.linuxrsp.ru
Адрес этого письма в архиве: http://subscribe.ru/archive/comp.soft.linux.discuss/msg/925136

   2009-10-22 15:36:11 (#925136)

Re: сбой кодировки?

On Thursday 22 October 2009 14:14:46 igor zaitsev wrote:
> Всем доброго дня.
>
> не уверен в корректности формулировки сабжа :( Более пространно:
> есть простой текстовый файл в кодировке cp1251, редактирую его в
> gedit, всё нормально, но если я пытаюсь его сохранить в кодировке
> koi8r? то получаю сообщение "Недопустимая последовательность байтов
> для преобразования содержится во входной строке", ну и файл в нужной
> кодировке не сохраняется.
>
> вопрос: как можно найти тот фрагмент файла, что содержит "недопустимую
> последовательность байтов"?

Есть такое.
Просто некоторые символы с cp1251 попадают на "запрещёные" символы koi8
А зачем koi-8r сейчас?

   2009-10-22 14:26:02 (#925093)

Re: сбой кодировки?

В Thu, 22 Oct 2009 13:14:46 +0400
igor zaitsev <zin.***@b*****.ru> пишет:

> есть простой текстовый файл в кодировке cp1251, редактирую его в
> gedit, всё нормально, но если я пытаюсь его сохранить в кодировке
> koi8r? то получаю сообщение "Недопустимая последовательность байтов
> для преобразования содержится во входной строке", ну и файл в нужной
> кодировке не сохраняется.
>
> вопрос: как можно найти тот фрагмент файла, что содержит "недопустимую
> последовательность байтов"?
>

Я бы поступил следующим образом:

iconv -fcp1251 -tkoi8-r <файл в кодировке cp1251> > <файл в кодировке koi8-r>

В <файл в кодировке koi8-r> сохранится содержимое до "плохого" байта.
Таким образом его можно выявить.