On Sun, 10 Apr 2005 12:33:21 +0300
Matvey <mathw***@l*****.ru> wrote:
> Привет всем!
>
> Есть русский pdf, надо его конвертировать в текст.
> pdftotext из xpdf выдает примерно такое:
> 9. 9.1. . ' ( ), . g
> , , ,, ' . g , . g , ,
> , ' ' . g ' , , ,
> . g , , , . ' g ' (') , ()
> . ' , , () . g - . 210 ..
>
> С английским все ОК. Кто виноват, что делать?
$ pdftotext --help
Usage: pdftotext [options] <PDF-file> [<text-file>]
-enc <string> : output text encoding name
pdftotext -enc KOI8-R file.pdf file.txt
Но результат, жуть. хотя текст выводит.
Буду рад, если помог.
В. Ковалев
-*Название листа "Linux: разрешение вопросов, перспективы и общение";
Написать в лист: mailto:comp.soft.linux.discuss-list@subscribe.ru
Адрес правил листа http://subscribe.ru/catalog/comp.soft.linux.discuss/rules
Номер письма: 17759; Возраст листа: 625; Участников: 1365
Адрес сайта рассылки: http://www.linuxrsp.ru
Адрес этого письма в архиве: http://subscribe.ru/archive/comp.soft.linux.discuss/msg/348326