Здравствуйте, Ivbera.
Вы писали 17 декабря 2007 г., 17:20:03:
> А вот об этом не могли бы рассказать подробнее? Какие программы, по
> Вашему мнению, для сканирования лучше, чем Fine Reader?
Я предпочитаю сканировать в фотошопе, потому что сразу после
сканирования можно сделать правку.
Если сканируется сразу много, например, книга, то хочется использовать
программу, которая по нажатию одной клавиши отсканирует и запишет файл
с нужным именем в нужном формате. Я пользовал для этого ACDSee
(Файнридер так тоже умеет), но мне не очень понравилось. В случае
возникновения брака его становится сложно исправить. Поэтому сканирую
в фотошопе.
Далее, все пакетные преобразования делаю через ACDSee, обрезку тоже в
ней, но не пакетную, а индивидуально каждой страницы, по шаблону. Так
получается качественнее, хотя и немного геморно. Плюс, если надо
где-то подчистить грязь, то это в фотошопе. Дополнительно настраиваю в
Document Express порог преобразования из серого в битональный, и
дополнительно играюсь со сжатием (степень сжатия очень сильно влияет
на качество).
Сканирую в grey 300 dpi. Если сразу сканировать в lineart (черно-белое
изображение), то потом не остаётся возможности для манёвра при
подчистке мусора.
При сжатии в djvu файлы преобразовываю в tiff со сжатием lzv. Если без
lzv, то djvu может сглючить.
Текстовый слой не делаю, т.к. не всегда под рукой есть файнридер, к
тому же OCR без спеллчека (а именно такой, не корректированный текст и
можно подшить в текстовый слой) мало интересен, хотя это и полезная вешь.
Теперь о времени. Вообще тут простой принцип: чем меньше времени
потратил, тем лучше, но не сильно в ущерб качеству. Скорость
сканирования очень сильно зависит от сканера, на хорошем сканере можно
"отжать" 100 сканов в час. Если на один скан помещается разворот
книги, т.е. 2 стр, то это 200 стр в час. "Причёсывание" сканов
(просмотр с целью обнаружения ошибок сканирования, обрезка,
преобразование формата и пр.) и собственно сжатие - примерно 1-2 часа
на книгу в 500 стр.
Ну ещё надо не тормозной компьютер и много места для временных файлов
- примерно 2 ГБ на книгу в 500 стр.
Для сканирования книг лучше пользовать CCD сканер, у CIS малая глубина
резкости. Вначале следует прикинуть, возможно ли так укладывать книгу
чтобы потом можно было обойтись без обрезки. Если да, то лучше так и
сделать - это сэкономит массу времени. Если нет, тогда при выделении
зоны для сканирования можно не жадничать и оставить большие поля, они
всё равно потом отрежутся, зато книгу можно будет укладывать менее
тщательно. Книгу лучше стараться укладывать без большого поворота,
т.к. поворот потом будет не исправить, а электронная книга, у которой
каждая страница наклонена под своим углом, смотрится не очень.
При этом стоит учесть, что книга может быть обрезана не ровно, и если
такую книгу укладывать краем к краю сканера, то из-за косой обрезки
сканы могут оказаться с наклоном. Хотя небольшой наклон допустим, вот
30 градусов - это уже много :-).
Отдельно стоит сказать про наименование отсканированных книг. Мне
очень импонирует система, принятая в "Колхозе" (kolkhoz, электронная
библиотека научной литературы "Колхоз" (lib.homelinux.org)). Сейчас
сайт у них вроде как издох, но колхоз также есть на DVD дисках, и там
есть файлик с системой наименований книг. Если интересно, попробую
кого-нибудь попросить этот файлик прислать.