Вопрос № 25177: Прива, глубокоуважаемые спецы! У меня проблема: нужно получить html-код страницы без тэгов. С тэгами не получается правильно записать в *.ini и произвести в нём поиск....
Вопрос № 25.177
Прива, глубокоуважаемые спецы! У меня проблема: нужно получить html-код страницы без тэгов. С тэгами не получается правильно записать в *.ini и произвести в нём поиск.
Отправлен: 22.08.2005, 18:22
Вопрос задал: Segor (статус: Посетитель)
Всего ответов: 3 Мини-форум вопроса >>> (сообщений: 0)
Отвечает: Ерёмин Андрей
Здравствуйте, Segor!
Наверное, я неправильно понял вопроса... Что значит "html-код без тегов"? HTML-код и подразумевает наличие тегов... Если речь идёт о том, чтобы получить весь текст страницы, то тут нужно просто пообрезать всё, что ненужно. К сожалению, поделиться конкретным работающим кодом сейчас не могу, но тут всё достаточно просто, поэтому подскажу алгоритм.
Создаём цикл while. Через Pos() находим позицию первого символа "<" (знак "меньше"). Затем находим позицию первого символа ">" (знак "больше"). После этого из строки (которая является полным html-кодом страницы) через Delete() вырезаем этот тег. Всё это производим до тех пор, пока позиция символа "знак 'меньше'" станет равной нулю. Все открывающие теги мы вырезали. После этого делаем тоже самое, но в первом случае ищем пару символов "$lt;/" (знак
"меньше" и слеш). Второй случай - тот же знак "больше". И снова вырезаем фрагмент между двумя полученными позициями. В результате получаем чистый текст. Возможно, останутся какие-то тонкости (комментарии например), но тут уже нужно искать другие последовательности символов: "<!--" и "-->". Думаю, описанной мной алгоритм понятен. Удачи! --
С уважением,
Андрей.
Ответ отправил: Ерёмин Андрей (статус: Практикант)
Отправлен: 22.08.2005, 19:28
Отвечает: sir henry
Здравствуйте, Segor!
Без тэгов это будет уже не код, а обычный текст. :)
Используя TWebBrowser, см приложение.
Приложение:
Ответ отправил: sir henry (статус: Профессор)
Отправлен: 22.08.2005, 20:10 Оценка за ответ: 5
Отвечает: Delphin
Здравствуйте, Segor!
А ты не подумал как все будет выглядеть без тэгов?
Попробуй их удалить. Они все заключены в <> а комментарии в <-- -->.
Вы не написала в чем вы получаете страницу. Запросом на сервер или через браузер?
В чем сложность записи в ini? Вы не описали суть проблеммы а хотите чтобы вам помогли. Вы только написали "у меня не получается"
--------- Обращаться в ICQ: 77778851 или E-Mail: delphinster@gmail.com
Ответ отправил: Delphin (статус: 8-ой класс)
Отправлен: 23.08.2005, 11:23