[TC] Конвертер.
Добрый день уважаемые участники листа.
Столкнулся с такой задачей. Есть больше 300 файлов в формате html, их
надо конвертировать в текстовый формат, но те утилиты, которые я
использовал, некоректно их обрабатывают. Есть ли такие программы,
которые бы правильно форматировали текст при конвертации и могли бы
работать в пакетном режиме? Я использовал программу htmstrip, она
делает строки нормальной длины, но игнорирует переносы строк. Может
быть, я не совсем правильно и понятно выражаюсь, тогда я приведу
пример. В тексте имеются диалоги, то есть строки начинающиеся со знака
тире в начале строки. Когда просматриваешь html файл в word, там всё
нормально, но после конвертации в текстовый формат вышеупомянутой
утилитой, диалоги встречаются где попало. Как можно решить эту задачу?
Ведь переделывать каждый файл вручную через word - отнимет массу
времени. Буду Вам очень благодарен за помощь.
Добрый день, Штефуряк.
Я сейчас попробовал, вроде всё нормально, может дело в настройках, а
может разная разметка html.
Если есть желание пришлите мне файлик я попробую с настройками, которые у
меня.
--
С уважением, Сергей.