Отправляет email-рассылки с помощью сервиса Sendsay

[TC] Сохранение в DJVU

Почтеннейшие господа!
Скажите, пожалуйста, а каким макаром можно сохранить результаты сканирования
в DJVU формат? Может, плагинчик какой к Fine reader для этой цели имеется? Как
это делается и насколько это ресурсоемкий процесс? Заранее буду всем весьма признателен.
Всех вам благ.

Ответить   Mon, 17 Dec 2007 13:34:30 +0200 (#711330)

 

Ответы:

Здравствуйте, Denis.

Вы писали 17 декабря 2007 г., 14:34:30:

Смотря что вы сканируете. Как правило, в djvu сжимают отсканированные
книги.

Основных программ две - Djvu Solo и DjVu Document Express
Enterprise 5.1. Первая проще, но и настроек меньше.

Собственно, неплохая инструкция лежит на
http://lib.mexmat.ru/helpdesk.php , на этой же странице приведено
краткое описание форматов электронных книг.
Прямая ссылка на инструкцию - http://lib.mexmat.ru/misc/files/dmvn-scan-faq.pdf

Я не полностью согласен с приведёнными в ней рекомендациями, в
частности, считаю, что djvu оптимизирован для разрешения 300 dpi, и
выставлять 600 dpi - излишество, к тому же при этом падает
производительность сканера.

К тому же я не сторонник сканирования и обработки изображений в
файнридере, для этого есть более подходящие программы.

Также я вручную настраиваю профили в Document Express, иначе иногда
можно получить на выходе дрянь.

Ответить   Mon, 17 Dec 2007 16:35:42 +0300 (#711365)

 

Доброе время суток, уважаемые участники рассылки и Yegor!

В письме от 17 декабря 2007 г., 15:35:42 мне довелось прочесть:

А вот об этом не могли бы рассказать подробнее? Какие программы, по
Вашему мнению, для сканирования лучше, чем Fine Reader?

Ответить   Mon, 17 Dec 2007 16:20:03 +0200 (#711375)

 

Здравствуйте, Ivbera.

Вы писали 17 декабря 2007 г., 17:20:03:

Я предпочитаю сканировать в фотошопе, потому что сразу после
сканирования можно сделать правку.

Если сканируется сразу много, например, книга, то хочется использовать
программу, которая по нажатию одной клавиши отсканирует и запишет файл
с нужным именем в нужном формате. Я пользовал для этого ACDSee
(Файнридер так тоже умеет), но мне не очень понравилось. В случае
возникновения брака его становится сложно исправить. Поэтому сканирую
в фотошопе.

Далее, все пакетные преобразования делаю через ACDSee, обрезку тоже в
ней, но не пакетную, а индивидуально каждой страницы, по шаблону. Так
получается качественнее, хотя и немного геморно. Плюс, если надо
где-то подчистить грязь, то это в фотошопе. Дополнительно настраиваю в
Document Express порог преобразования из серого в битональный, и
дополнительно играюсь со сжатием (степень сжатия очень сильно влияет
на качество).

Сканирую в grey 300 dpi. Если сразу сканировать в lineart (черно-белое
изображение), то потом не остаётся возможности для манёвра при
подчистке мусора.

При сжатии в djvu файлы преобразовываю в tiff со сжатием lzv. Если без
lzv, то djvu может сглючить.

Текстовый слой не делаю, т.к. не всегда под рукой есть файнридер, к
тому же OCR без спеллчека (а именно такой, не корректированный текст и
можно подшить в текстовый слой) мало интересен, хотя это и полезная вешь.

Теперь о времени. Вообще тут простой принцип: чем меньше времени
потратил, тем лучше, но не сильно в ущерб качеству. Скорость
сканирования очень сильно зависит от сканера, на хорошем сканере можно
"отжать" 100 сканов в час. Если на один скан помещается разворот
книги, т.е. 2 стр, то это 200 стр в час. "Причёсывание" сканов
(просмотр с целью обнаружения ошибок сканирования, обрезка,
преобразование формата и пр.) и собственно сжатие - примерно 1-2 часа
на книгу в 500 стр.

Ну ещё надо не тормозной компьютер и много места для временных файлов
- примерно 2 ГБ на книгу в 500 стр.

Для сканирования книг лучше пользовать CCD сканер, у CIS малая глубина
резкости. Вначале следует прикинуть, возможно ли так укладывать книгу
чтобы потом можно было обойтись без обрезки. Если да, то лучше так и
сделать - это сэкономит массу времени. Если нет, тогда при выделении
зоны для сканирования можно не жадничать и оставить большие поля, они
всё равно потом отрежутся, зато книгу можно будет укладывать менее
тщательно. Книгу лучше стараться укладывать без большого поворота,
т.к. поворот потом будет не исправить, а электронная книга, у которой
каждая страница наклонена под своим углом, смотрится не очень.
При этом стоит учесть, что книга может быть обрезана не ровно, и если
такую книгу укладывать краем к краю сканера, то из-за косой обрезки
сканы могут оказаться с наклоном. Хотя небольшой наклон допустим, вот
30 градусов - это уже много :-).

Отдельно стоит сказать про наименование отсканированных книг. Мне
очень импонирует система, принятая в "Колхозе" (kolkhoz, электронная
библиотека научной литературы "Колхоз" (lib.homelinux.org)). Сейчас
сайт у них вроде как издох, но колхоз также есть на DVD дисках, и там
есть файлик с системой наименований книг. Если интересно, попробую
кого-нибудь попросить этот файлик прислать.

Ответить   Mon, 17 Dec 2007 19:26:45 +0300 (#711438)