[InetQuestion] Вопросы
Здравствуйте.
Помогите, плиз, надо срочно ответы на эти вопросы:
1) Алгоритмы сканирования сети (web-страниц). (какие типы или виды бывают)
2) Где и как физически хранятся сообщения (на форуме)?
3) Каковы возможности PerlScript в этой связи?
4) В связи с чем при автовыборе кодировки отображение страницы все же
реализуется не в той кодировке, в которой надо?
5) Возможности HTML для настройки под конкретный браузер (IE или NN)
Я знаю, что их много, хоть некоторые.
6) Какой рейтинг среди других сервисов интернета занимают конференции? (по
популярности)
7) какой процент среди документов в сети занимают документы, сделанные с
использованием фреймов?
Заранее огромное спасибо.
Hello Евгений,
Если ты про сканирование для поисковых серверов, то всё это происходит
по принципу файла robots.txt , который должен быть в корне сайта и содержать
приблизительно следующее:
User-Agent: *
# robots.txt fot http://твой_сайт.ru
Disallow: /images/ /scripts/ /banners/
Где ты указываешь, что поисковики (все типы роботов - *) могут занести
твой сайт в базу данных, но они НЕ должны сканировать содержимое
каталогов, перечисленных в Disallow строке.
Могу лишь предположить два варианта:
1. начало кода содержит другую кодировку (особенно это бывает
на автоматически-генерируемых сайтах с форумом, архивами и т.д)
2. символы, отвечающие за кодировку (НЕлатинские) находятся слишком далеко от
начала страницы.
Эти настройки "делаются" скриптами. Например, одна и таже функция (к примеру
"разрешение монитора")
может в разных браузерах итерпретироваться по разному, по этому и стоит писать
код, который
имеет разные части, работающие на определённых браузерах)