Re: Экспорт новостей
On Tue, 27 Dec 2005 15:29:18 +0200
Vladimir Doubrovski wrote:
> Не сочтите за рекламу. Здесь техническая проблема.
> http://www.trans-m-radio.com/win/index-ru/news/text-news-ru.htm
>
> Нужен PHP или JavaScript который
>
> Закачает страничку с авторскими правами и пр. таким образом:
>
> 1. Уложит страничку между стандартными тегами <html><body> ...
> </body></html>
>
> 2. Закроет открытые <body style="text-align: Justify; font-family:
> Arial, Arial" background="notebook.gif" bgproperties="fixed">
>
> 3. Хорошо бы выделить дату время через регулярное выражение
>
> PS: Другие идеи приветствуются.
> Например: отфильтровать эти body style
Можно попробовать использовать dom.
Коротко: страница загружается в dom-объект и из нее получается xml, к
которому можно применять разлые фишки типа XPath и пр.
Подробнее на zend.com
Недостатки: в php4 по умолчанию dom отключен.