Здравствуйте, Михаил Духонин.
> Файнридер при конвертации в TXT сохраняет колонтитулы. Обычно это, как раз, номер страницы и название главы/части/рубрики или ещё чего-нибудь.
> Так что на 255 страницу перейти, как раз, не проблема. Просто забиваешь эту цифру в поиск и вуаля...
Это если в читаемой книге не слишком много чисел, на что в целом ряде научных дисциплин рассчитывать не приходится: от истории с датами до экономики с количественными показателями. Да и в целом способ не очень-то консистентный.
> А ещё лично мне очень удобно найти нужную главу в оглавлении и через тот же поиск быстро к ней перейти.
Вообще-то по текстовому слою PDF тоже можно искать, да и оглавление там может быть именно активируемыми ссылками.
Кроме того, OCR теряет символы, типа бесконечности или принадлежности множеству, тогда как в оригинальном текстовом слое они вполне могут сохраниться, если PDF генерировался из какого-нибудь LaTeX. Именно поэтому всегда полезно сначала попробовать работать с оригинальным текстовым слоем. Возможно он окажется информативнее, чем результат OCR.
> Но если в тексте много кода - приходится по мере чтения его постоянно править.
Книги по программированию обычно имеют либо полноценную электронную версию, либо отдельно распространяемые файлы листингов. Лучше поискать их, чем мучаться.
> Ещё тяжело читать, если в книге бОльшую часть страницы занимают подстраничные ссылки...
Опять же, это как раз случай работы с научными изданиями. То есть то, с чего мы и начали.
> В общем, в своё время я перепробовал кучу вариантов конвертации и чтения PDF, ничего удобнее по совокупности всех обстоятельств, чем конвертация в TXT файнридером, не нашёл.
По-моему у вас просто уже выработался стокгольмский синдром по отношению к своим костылям и закрепившимся плохим привычкам.
Я бы посоветовал посмотреть или освежить знакомство с PDF Transformer, если нужна работа с учётом оригинальной нумерации страниц, а листинги и вовсе брать в отдельно распространяемом электронном варианте.
Ну а художественную, беллетристическую или публицистическую литературу можно читать как угодно, но там и нумерация страниц обычно не нужна, если только сама литература не является объектом исследования.
Успехов. Никита.