Re: HTML
Anton K Davidenko wrote:
>On Mon, 11 Apr 2005 22:38:10 +0400
>andrew <and_h***@f*****.ru> wrote:
>
>
>
>>Здравствуйте!
>>А есть ли какие-нибудь неинтерактивные анализаторы HTML?
>>Надо, например, из кждой страницы вырезать заголовки H1 и текст под ними
>>в отдельные файлы.
>>(каждый в отдельный файл)
>>Что в таких случаях делают?
>>
>>
>
>можно awk, можно grep
>например:
>$cat *.html |grep "<h1>" > h1.txt
>$less h1.txt
>
>
Если быть честным до конца, задача целиком включает в себя полный разбор
части страницы. Потому хотелось бы узнать о более продвинутых средствах.
Хотя, вероятно, всё же придётся либо учить перл, либо писать длинные и
неочевидные скрипты на шелле.
-*Название листа "[BSD] Решение вопросов по FreeBSD, OpenBSD и NetBSD";
Написать в лист: mailto:comp.soft.bsd.all-list@subscribe.ru
Адрес правил листа http://subscribe.ru/catalog/comp.soft.bsd.all/rules
Номер письма: 1665; Возраст листа: 404; Участников: 649
Адрес сайта рассылки: http://www.linuxrsp.ru
Адрес этого письма в архиве: http://subscribe.ru/archive/comp.soft.bsd.all/msg/349555