Отправляет email-рассылки с помощью сервиса Sendsay
  Все выпуски  

RusFAQ.ru: Программирование на Delphi


Информационный Канал Subscribe.Ru

РАССЫЛКИ ПОРТАЛА RUSFAQ.RU

/ КОМПЬЮТЕРЫ И ПО / Языки программирования / Delphi

Выпуск № 220
от 27.08.2005, 18:23

Администратор:Калашников О.А.
В рассылке:Подписчиков: 226, Экспертов: 39
В номере:Вопросов: 1, Ответов: 3


Вопрос № 25177: Прива, глубокоуважаемые спецы! У меня проблема: нужно получить html-код страницы без тэгов. С тэгами не получается правильно записать в *.ini и произвести в нём поиск....

Вопрос № 25.177
Прива, глубокоуважаемые спецы! У меня проблема: нужно получить html-код страницы без тэгов. С тэгами не получается правильно записать в *.ini и произвести в нём поиск.
Отправлен: 22.08.2005, 18:22
Вопрос задал: Segor (статус: Посетитель)
Всего ответов: 3
Мини-форум вопроса >>> (сообщений: 0)

Отвечает: Ерёмин Андрей
Здравствуйте, Segor!

Наверное, я неправильно понял вопроса... Что значит "html-код без тегов"? HTML-код и подразумевает наличие тегов... Если речь идёт о том, чтобы получить весь текст страницы, то тут нужно просто пообрезать всё, что ненужно. К сожалению, поделиться конкретным работающим кодом сейчас не могу, но тут всё достаточно просто, поэтому подскажу алгоритм.

Создаём цикл while. Через Pos() находим позицию первого символа "<" (знак "меньше"). Затем находим позицию первого символа ">" (знак "больше"). После этого из строки (которая является полным html-кодом страницы) через Delete() вырезаем этот тег. Всё это производим до тех пор, пока позиция символа "знак 'меньше'" станет равной нулю. Все открывающие теги мы вырезали. После этого делаем тоже самое, но в первом случае ищем пару символов "$lt;/" (знак "меньше" и слеш). Второй случай - тот же знак "больше". И снова вырезаем фрагмент между двумя полученными позициями. В результате получаем чистый текст. Возможно, останутся какие-то тонкости (комментарии например), но тут уже нужно искать другие последовательности символов: "<!--" и "-->". Думаю, описанной мной алгоритм понятен. Удачи!
--
С уважением,
Андрей.

---------
Мышка побежала, xвостиком махнула - cервер упал...
Ответ отправил: Ерёмин Андрей (статус: Практикант)
Отправлен: 22.08.2005, 19:28

Отвечает: sir henry
Здравствуйте, Segor!
Без тэгов это будет уже не код, а обычный текст. :)
Используя TWebBrowser, см приложение.

Приложение:

Ответ отправил: sir henry (статус: Профессор)
Отправлен: 22.08.2005, 20:10
Оценка за ответ: 5

Отвечает: Delphin
Здравствуйте, Segor!
А ты не подумал как все будет выглядеть без тэгов?
Попробуй их удалить. Они все заключены в <> а комментарии в <-- -->.
Вы не написала в чем вы получаете страницу. Запросом на сервер или через браузер?
В чем сложность записи в ini? Вы не описали суть проблеммы а хотите чтобы вам помогли. Вы только написали "у меня не получается"
---------
Обращаться в ICQ: 77778851 или E-Mail: delphinster@gmail.com
Ответ отправил: Delphin (статус: 8-ой класс)
Отправлен: 23.08.2005, 11:23


Отправить вопрос экспертам этой рассылки

Приложение (если необходимо):

* Код программы, выдержки из закона и т.п. дополнение к вопросу.
Эта информация будет отображена в аналогичном окне как есть.

Обратите внимание!
Вопрос будет отправлен всем экспертам данной рассылки!

Для того, чтобы отправить вопрос выбранным экспертам этой рассылки или
экспертам другой рассылки портала RusFAQ.ru, зайдите непосредственно на RusFAQ.ru.


Форма НЕ работает в почтовых программах The BAT! и MS Outlook (кроме версии 2003+)!
Чтобы отправить вопрос, откройте это письмо в браузере или зайдите на сайт RusFAQ.ru.


© 2001-2005, RusFAQ.ru, Россия, Москва. Все права защищены.
Идея, дизайн, программирование, авторское право: Калашников О.А.

Яндекс


Subscribe.Ru
Поддержка подписчиков
Другие рассылки этой тематики
Другие рассылки этого автора
Подписан адрес:
Код этой рассылки: comp.soft.prog.delphiplus
Отписаться
Вспомнить пароль

В избранное