Отправляет email-рассылки с помощью сервиса Sendsay

[TC] FineReader

Здравствуйте!
Если у кого есть конкретные вопросы по использованию Finereader 7 и 8 - задавайте,
отвечу. Никакие особые тонкие настройки не требуются. В чем, конкретнее возникающая
проблема?
Что же касается чтения распознанного текста джозом в ворде - тут я помочь
не могу, джозом не пользуюсь. Но на всякий случай проверьте с помощью чьего-нибудь
зрения, что там вообще распозналось. Может, там и читать-то нечего, одни columns
и прочий мусор. Так бывает в 7-й версии, если она ворованная.

dima***@0*****.il
Дмитрий

Ответить   Sat, 24 Dec 2005 12:12:28 +0200 (#493684)

 

Ответы:

Дмитрий, здравствуйте!

Для меня так и осталось загадкой, как из pdf извлечь текст, а не распозновать?
Восьмой ридер это позволяет делать, но я никак не могу понять что нужно нажимать
и где. Подскажите пожалуйста.

С уважением,
Матроскин
mailto:matroskin_mosc***@m*****.ru
icq:250909688
http://matroskinshouse.narod.ru

Ответить   Sat, 24 Dec 2005 13:19:21 +0300 (#493688)

 

Здравствуйте, matroskin.

Вы писали 24 декабря 2005 г., 13:19:21:

Там на вкладке "распознавание" в настройках есть соответствующие
радиокнопки - извлечь текст из pdf или распознать. Только у меня
ничего толком не получилось текст получается отвратительным что при
той, что при другой настройки. Да и разницы во времени обработки я не
обнаружил. Извлекать текст, по-моему, стоит непосредственно из
акробата. Там всё быстро получается. Да и текст именно тот, что есть в
файле, а не интерпретация fine reader'а. Единственно только, у меня в
таком тексте оказывались пропущены некоторые слова. Так что - что так,
что эдак - а нормального текста из pdf получить у меня не получалось.
Правда, это касалось только книг по программированию. А обычные тексты
распознаются более или менее нормально.

Ответить   Sat, 24 Dec 2005 14:05:47 +0300 (#493696)

 

Original Message > Для меня так и осталось загадкой, как из pdf извлечь текст, а не

Здравствуйте!
На мой взгляд, лучше всего воспользоваться распознаванием. Файл -->
Открыть PDF/изображение. Затем, "Распознать все". Распознает идеально. Затем

сохраняете в Word и делаете с ним все, что хотите.
Второй вариант - использование специальной программы Adobe PDF
Translator.
Третий вариант - в Adobe Reader выбираем Файл -- Сохранить как текст. Но

в этом случае теряется форматирование и если оно было сложное (с таблицами,
комменториями к картинкам, сносками, различными стоблцами), то мы получаем
кашу.
Кроме того, некоторые файлы pdf защищены паролем и их распознать не
удастся.
Замечу, что мне не знакомы проблемы, описанные Михаилом Духониным. У
меня все работает гладко. Возможно, причиной проблем являются эксперименты с

настройками.

Дмитрий

Ответить   Sat, 24 Dec 2005 17:50:48 +0200 (#493774)

 

Здравствуйте, Dmitri.

Вы писали 24 декабря 2005 г., 18:50:48:

с

С настройками я действительно экспериментировал, но уже после первых
неудачных опытов. А вы распознавали книги именно по программированию,
где много всякого рода листингов, участков кода и пр. Именно на таких
текстах у меня проблемы, да к тому же, судя по всему, не только у
меня. Да и какие настройки могут кардинально ухудшить качество
распознавания?

Ответить   Sat, 24 Dec 2005 19:58:47 +0300 (#493840)