>> Интернет, а система Google в результатах поиска предлагает этот же файл и
-
лд> Внимание
>> - его же, в том числе, в формате: HTM.
>> Это Google делает всегда для pdf файла - о чем сообщает в "голове" страницы,
лд> Увы. Воспользовался я вашим советом, и вот что получилось.
лд> site:http://sociology.net.ru/journal/archiv/J1-end2004.pdf
Запрос должен быть таким: cache:http://sociology.net.ru/journal/archiv/J1-end2004.pdf
Если же вы нашли файл через гугл, то там прямо в результатах бывает
ссылка "В виде HTML".
Правда в случае ЖССА это не сработало (проверил), т. е. по каким-то
причинам эти файлы гугл не проиндексировал (может из-за той же проблемы
с кодировкой?)
Если текст копируется правильно, то на мощной машине можно выделить его весь
и
скопировать в ворд.
В качестве альтернативы, в 8 FineReader'е есть готовые "Сценарии", например
"распознать и сохранить в файл", т. е. поставил и ушёл. Долго, но не
хлопотно. Боюсь, что в случае с кривой кодировкой ничего не придумать,
кроме как распознавать заново.
Хотя. Взял на удачу один из более старых номеров (за 2000 год), сохранённый
текст нашёлся в рамблере (ссылка под результатом поиска: "восстановить текст")
(но не в гугле и не в яндексе). (Не знаю, какая
там команда, я просто скопировал фразу из текста и поискал её в кавычках.)
Ищите и обрящете :)) Замечу в скобках, что рамблер уже систематически находит
больше, чем
яндекс (если отбросить "нестрогие соответствия").