Отправляет email-рассылки с помощью сервиса Sendsay

[TC] Результаты сканирования и неправильная кодировка

Здравствуйте, уважаемые подписчики рассылки! Довольно часто мне придётся сталкиваться
со сканированием текстов, и вот вчера это было сделано первый раз. Скажу вам,
что сканировала текст не я. Я просто дала листок человеку и он сделал это. Я
не знаю, с помощью каких программ это делалось, но у меня есть результат.
Текст двуязычный, на Украинском и Английском языках. Украинская, тоесть кириллическая
часть текста, читается нормально, а вот с латиницей возникают проблемы. Часть
читается хорошо, а часть - ужасно. Вот несколько строк для примера:

Who is who in the la\v? ir YOLI Ш'е pгosecLlted Гог zi сгil11е il1 Вгit~lil1,
УОLl 11ЫУ тес[ tl1c f'оl!о\viпg people dшil1g YOLlГ pl'OCCSS tlнощ;ll [11е СOLlгts:

Magistrates. Magis1тres ,Н'е IJпраid jLldges LISLшllу

То есть встречаются и английские слова, хоть и не всегда с нужными буквами, и
какие-то абсолютно непонятные сочетания цифр и символов. При открытии в ворде
такого документа как кодированный текст, первой кодировкой стоит турецкая windows.
Я перепробовала несколько вариантов, во всех я вижу эти строки.

Скажите пожалуйста, что сейчас можно сделать с этим текстом, чтобы прочитать
его? И что нужно делать при сканировании, чтобы таких проблем не возникало в
будущем?

Всем спасибо за ответы и помощь.

С уважением и наилучшими пожеланиями Анастасия, Киев.
mailto:anastasiya_***@m*****.ru
ICQ: 596892544

Ответить   Sat, 25 Sep 2010 08:41:35 +0300 (#1221192)

 

Ответы:

Здравствуйте участники рассылки.

Здравствуйте, Miriada.

Вы писали 25 сентября 2010 г., 8:41:35:

в

Miriada ,сделать теперь с этим текстом, врятли
что удастся, причина такого распознования,
неправильно выставлен язык распознования,
необходимо было выстовить англо-украинский,
чтобыло выстовлено неизвестно, хотя украинский
при распозновании явно участвовал, если вам
необходимо распозновать отсканированые
документы, вам нужна программа
ABBYYFineReader10.

Ответить   zvezdochet Sat, 25 Sep 2010 09:09:38 +0300 (#1221201)

 

Hello zvezdochet,

Saturday, September 25, 2010, 9:09:38 AM, you wrote:

Похоже английский тоже участвовал. Там просматриваются правильно
распознанные английские фразы.

Ответить   Sat, 25 Sep 2010 18:37:22 +0300 (#1223579)

 

Здравствуйте вам, Miriada!
Несколько слов по теме "[TC] Результаты сканирования и неправильная кодировка":

Пользуюсь пока девятым файнридером, до десятки просто никак не дойдут
руки. Где-то там я включал настройку "автоопределение языка".
Смешанные тексты сканирую довольно часто, без нареканий.

Ответить   Sat, 25 Sep 2010 16:57:15 +0300 (#1221499)

 

Здравствуйте, уважаемые подписчики!

У меня после распознавания десятым файнридером получается следующая
петрушка:
: ШЖ'ОАЫВЕДЬ ,л-
KANNlA ИO-DMК H f.fSfS . p.,
ШШНЯ МУДРЫХЪ, ; .
.и.*-'".- v. . . * * ' '
у..-- . описанная . V*.
неизв13стнымЪ Шевалье на Фран<< цузкомЪ язык*В, а на НФмецхий
; переведена I* А<< М<< С*
-1- . .. ' ' *.'* * *. ' fS ; <<fS .* fS fS . ^ fS .
Ёто tie Искусство одцнЬ быраъЪ кЪ концу ;

Все настройки стоят по- умолчанию. Как- то, язык распознавания русский и
английский и текст тоже русский.
Adobe reader в режиме прослушивания читает нормально.
Видимо что- то с кодировками, а где и что подкрутить не пойму.
Помогите, пожалуйста, разобраться с этим делом!

Ответить   Sat, 25 Sep 2010 21:04:57 +0600 (#1221532)