pdf2HTML
здраствуйте.
Такой вопрос:
чем можно преобразовать pdf-файл в html ?
заранее спасибо.
За последние 60 дней ни разу не выходила
Сайт листа:
http://www.linuxrsp.ru
Открыт:
25-07-2003
Пре-модерация: Нет
Адрес для писем в лист: comp.soft.linux.discuss-list@subscribe.ru
Адрес
модератора: comp.soft.linux.discuss-owner@subscribe.ru
здраствуйте.
Такой вопрос:
чем можно преобразовать pdf-файл в html ?
заранее спасибо.
eladar wrote:
http://sourceforge.net/projects/pdftohtml/
A voobshe:
http://www.google.com/search?sourceid=mozclient&ie=utf-8&oe=utf-8&q=pdf2HTML
SY Yura
-*Название листа "Linux: разрешение вопросов, перспективы и общение";
Написать в лист: mailto:comp.soft.linux.discuss-list@subscribe.ru
Адрес правил листа http://subscribe.ru/catalog/comp.soft.linux.discuss/rules
Номер письма: 21696; Возраст листа: 790; Участников: 1423
Адрес сайта рассылки: http://www.linuxrsp.ru
Адрес этого письма в архиве: http://subscribe.ru/archive/comp.soft.linux.discuss/msg/441667
i586-PoltawerKozak-linux-gnu)
On Wed, 21 Sep 2005 21:16:09 +0300
abba <ab***@k*****.net> wrote:
если есть исходники у формате TeX то latex2html
если текст чужой, то pdf2txt а потом ручками в html,
но то глупий труд, потому что, в txt будут включен
колонтитул страниц, нумерация страниц, пробел между
страницами.
-*Название листа "Linux: разрешение вопросов, перспективы и общение";
Написать в лист: mailto:comp.soft.linux.discuss-list@subscribe.ru
Адрес правил листа http://subscribe.ru/catalog/comp.soft.linux.discuss/rules
Номер письма: 21706; Возраст листа: 791; Участников: 1423
Адрес сайта рассылки: http://www.linuxrsp.ru
Адрес этого письма в архиве: http://subscribe.ru/archive/comp.soft.linux.discuss/msg/441864
В сообщении от 1127326569 секунд после начала Эпохи abba написал(а):
Name : pdftohtml Relocations: (not relocatable)
Version : 0.36 Vendor: (none)
Release : 4 Build Date: Fri Apr 8 15:56:54 2005
Install Date: Thu Sep 22 10:40:42 2005 Build Host: extras64
Group : Applications/Text Source RPM: pdftohtml-0.36-4.src.rpm
Size : 649482 License: GPL
Signature : DSA/SHA1, Mon Apr 11 08:44:49 2005, Key ID 82ed95041ac70ce6
URL : http://pdftohtml.sourceforge.net/
Summary : PDF to HTML converter
Description :
PDFTOHTML converts Portable Document Format (PDF) files to HTML
format. This release converts text and links. Bold and italic face are
preserved, but high level HTML structures ( like lists or tables ) are
not yet generated. Images are ignored ( but you can extract them from
the PDF file using pdfimages, distributed with the Xpdf package ).
The current version is tested on Linux and Solaris 2.6
On Wed, Sep 21, 2005 at 21:16 +0300, abba wrote:
pdftohtml
--
С Уважением Максим Шаптала
Linux forever
-*Название листа "Linux: разрешение вопросов, перспективы и общение";
Написать в лист: mailto:comp.soft.linux.discuss-list@subscribe.ru
Адрес правил листа http://subscribe.ru/catalog/comp.soft.linux.discuss/rules
Номер письма: 21723; Возраст листа: 794; Участников: 1428
Адрес сайта рассылки: http://www.linuxrsp.ru
Адрес этого письма в архиве: http://subscribe.ru/archive/comp.soft.linux.discuss/msg/443382
всем спасибо, тема закрыта.
В Чтв, 22/09/2005 в 08:52 +0300, Max пишет:
-*Название листа "Linux: разрешение вопросов, перспективы и общение";
Написать в лист: mailto:comp.soft.linux.discuss-list@subscribe.ru
Адрес правил листа http://subscribe.ru/catalog/comp.soft.linux.discuss/rules
Номер письма: 21742; Возраст листа: 795; Участников: 1439
Адрес сайта рассылки: http://www.linuxrsp.ru
Адрес этого письма в архиве: http://subscribe.ru/archive/comp.soft.linux.discuss/msg/444664
Hello abba,
Wednesday, September 21, 2005, 10:16:09 PM, you wrote:
Если PDF закрыт для обратного экспорта, то, по-моему, ничем. Есть
правда геморный метод через FineReader, когда он пытается распознать
любой PDF, правда сам я этот способ не проверял...