[TC] Результаты сканирования и неправильная кодировка
Здравствуйте, уважаемые подписчики рассылки! Довольно часто мне придётся сталкиваться
со сканированием текстов, и вот вчера это было сделано первый раз. Скажу вам,
что сканировала текст не я. Я просто дала листок человеку и он сделал это. Я
не знаю, с помощью каких программ это делалось, но у меня есть результат.
Текст двуязычный, на Украинском и Английском языках. Украинская, тоесть кириллическая
часть текста, читается нормально, а вот с латиницей возникают проблемы. Часть
читается хорошо, а часть - ужасно. Вот несколько строк для примера:
Who is who in the la\v? ir YOLI Ш'е pгosecLlted Гог zi сгil11е il1 Вгit~lil1,
УОLl 11ЫУ тес[ tl1c f'оl!о\viпg people dшil1g YOLlГ pl'OCCSS tlнощ;ll [11е СOLlгts:
Magistrates. Magis1тres ,Н'е IJпраid jLldges LISLшllу
То есть встречаются и английские слова, хоть и не всегда с нужными буквами, и
какие-то абсолютно непонятные сочетания цифр и символов. При открытии в ворде
такого документа как кодированный текст, первой кодировкой стоит турецкая windows.
Я перепробовала несколько вариантов, во всех я вижу эти строки.
Скажите пожалуйста, что сейчас можно сделать с этим текстом, чтобы прочитать
его? И что нужно делать при сканировании, чтобы таких проблем не возникало в
будущем?
Всем спасибо за ответы и помощь.
С уважением и наилучшими пожеланиями Анастасия, Киев.
mailto:anastasiya_***@m*****.ru
ICQ: 596892544
Здравствуйте участники рассылки.
Здравствуйте, Miriada.
Вы писали 25 сентября 2010 г., 8:41:35:
в
Miriada ,сделать теперь с этим текстом, врятли
что удастся, причина такого распознования,
неправильно выставлен язык распознования,
необходимо было выстовить англо-украинский,
чтобыло выстовлено неизвестно, хотя украинский
при распозновании явно участвовал, если вам
необходимо распозновать отсканированые
документы, вам нужна программа
ABBYYFineReader10.