Отправляет email-рассылки с помощью сервиса Sendsay

Индексация, однако...

Возник интересный спор, хочу проконсультироваться. :-)

Ситуация: на сайте используется mod_rewrite, для организации ЧПУ
(человекоподобных урлов... урел... ну вы поняли :-Р).

У меня сделано так (например):
http://domen.com/news/123/

А вот коллега считает, что так страницы не будут индексироваться, и
желательно делать эдак, с прямым указанием на виртуальные
html-документы:
http://domen.com/news/123.html
Или вообще вот так, чтобы не было директорий:
http://domen.com/news-123.html

Header'ы и прочая хренотень и так, и эдак отдаётся. IMHO, в первом
варианте проблем с индексацией быть не должно. Плюс преимущество:
можно стереть кусок урлы до слэша и увидеть "более верхний" раздел
сайта, если он (сайт) многоуровневый.

Господа и дамы, рассудите, плиз!

WBR, Demetrius



библиотекa сайтостроительства http://www.i2r.ru/static/244/

Ответить   Sat, 19 Nov 2005 17:44:52 +0200 (#477433)

 

Ответы:

19.11.2005 18:44 Вы писали:

У меня также mod_rewrite превращает динамич. ссылки в директории вида
http://site/view/article13/ Все прекрасно индексируется, проблем не
было, но очень хотелось бы о них знать ;)

Ответить   Sat, 19 Nov 2005 18:53:58 +0300 (#477434)

 

Здравствуйте, Дмитрий.

Ситуация обстоит следующим образом:
Что и как реально хранится у Вас на сервере поисковикам абсолютно
фиолетово. Они берут внутренние или внешние ссылки на Ваши страницы и
пытаются их открыть, получают то, что получают и индексируют это
дальше.
Теперь обстоятельства:
1) Некоторые поисковики не любят ссылки с параметрами
(index.php?a=1&b=2). По-моему Рамблер говорит, что проиндексирует не
все эти страницы, а столько, сколько сочтёт нужным.
2) Многие поисковики считают, что страница http://server.ru/news.htm
важнее, чем http://server.ru/news/ Поэтому, возможно, при прочих
равных условиях второе будет расположено ниже в списке найденных
сайтов. Но, думаю, это не столь важно, потому что вряд ли где-то ещё
будет точно такая же страница, чтобы эти "прочие равные" случились.
3) Где-то читал, что гораздо удобнее вообще не пользоваться файлами в
папках, а держать по одному файлу на папку (index). Так, во-первых,
остаётся в тайне, что там реально у Вас за файл: htm, html, php и т.п.
А во-вторых, легче будет переходить с одной платформы на другую.

А вообще, всё это - личные бзыки веб-мастера. А проиндексировано будет
в любом случае всё теми поисковиками, которые пользуются
популярностью. А те, которые не проиндексируют, они и так нафиг никому
не нужны.

Ответить   Andrey Yakushev Sat, 19 Nov 2005 19:48:50 +0300 (#477451)

 

19.11.2005 19:48 Вы писали:

Угу, тут смотрел access log'и - яндекс в день индексирует ~ 700
динамических ссылок форума (благо их там немерено), а rambler - 2-3 :)
Такими темпами он и ко Дню Страшного Суда обернуться не успеет...

К сожалению, тот же Рамблер все еще достаточно популярен. Второй в
Рунете (после Яндекса) или третий (после Яндекса и Гугль.ру) - уж не
знаю точно.

Ответить   Sat, 19 Nov 2005 20:04:15 +0300 (#477461)

 

Здравствуйте, Земсков.

Вот и нахрен такой нужен?

Второй, но его второе место составляет 20,6% всех поисковых переходов.

Ответить   Andrey Yakushev Sat, 19 Nov 2005 20:43:44 +0300 (#477472)

 

19.11.2005 20:43 Вы писали:

Этот вопрос логично задавать тем, кто им пользуется... :) А раз такие
есть, значит нужен.

Имхо это немало.

Ответить   Sat, 19 Nov 2005 20:48:03 +0300 (#477475)

 

Здравствуйте, Земсков.

Лучше посчитать, сколько процентов Рамблер приводит на сайт.
У меня в неделю бывает 1617 уникальных человек, из них 179 - приходят
с Рамблера. А это 11%

У меня весь сайт на урлах с параметрами сделан. И я не страдаю от
нелюбви Рамблера ко мне. :)

Ответить   Andrey Yakushev Sat, 19 Nov 2005 21:03:02 +0300 (#477484)

 

19.11.2005 21:03 Вы писали:

У меня от Рамблера очень мало, очень уж он загадочный. до сих пор понять
не могу, что ему надо (от форума - может, статич. ссылки, а вот от сайта
не знаю).

PS http://seochase.com/viewtopic.php?t=4031

Ответить   Sat, 19 Nov 2005 21:09:13 +0300 (#477490)

 

Да. у меня точно такая же статистика.



библиотекa сайтостроительства http://www.i2r.ru/static/244/

Ответить   Sun, 20 Nov 2005 00:01:18 +0500 (#477515)

 

19.11.2005 22:01 Вы писали:

Не, не задалось у меня с Рамблером подружиться. Смотрю в liveintenet
усредненную статистику за последние 4 недели. ~ 2000 чел. в неделю,
Яндекс - 45%
Google - 34%
Поиск mail.ru - 6.8%
и только потом Rambler - 6.2%
Апорт - 1.8%
Даже с забытого богом MSN - 1.1%

Впрочем, я давно смирился с ситуацией в отношении Рамблера. Раньше было
хуже :D

Ответить   Sat, 19 Nov 2005 22:16:05 +0300 (#477534)

 

Не слушайте вашего "коллегу". Это самый правильный способ!



библиотекa сайтостроительства http://www.i2r.ru/static/244/

Ответить   Sat, 19 Nov 2005 23:58:45 +0500 (#477513)

 

Hello Andrew!

Saturday, November 19, 2005, 8:58:45 PM, you wrote:

Самого правильного способа не бывает. Я скептик. :-)

WBR, Demetrius



библиотекa сайтостроительства http://www.i2r.ru/static/244/

Ответить   Sun, 20 Nov 2005 14:59:29 +0200 (#477808)

 

Человекопонятных :-)

И ссылки давать на "../" на более верхний уровень.
Считается, что никакого вредного эффекта пути "без html" не оказывают.
Но может сказаться ограничение по глубине индексирования - один и тот
же виртуальный раздел сайта по адресу /page1/page2/page3/page4/ может
иметь меньший вес, чем www.sitename.ru/page1-page2-page3-page4.html
так как это "как-бы страница в корневой директории".

Ответить   Sat, 19 Nov 2005 23:17:15 +0300 (#477582)

 

Hello dgstudio!

Saturday, November 19, 2005, 10:17:15 PM, you wrote:

Тьху, вот до чего работа доводит :-D

Лично мне больше нравятся абсолютные, во избежание... Вот, например,
когда я в первый раз набрёл на сайт библиотеки i2r, я оттуда
посохранял на винт статей, а потом не мог вспомнить адрес библиотеки.
А ссылки все показывали на "../". Вот так-то.

О! Вот это наверное и имелось ввиду. Благодарю за дельный пост. :-)

WBR, Demetrius



библиотекa сайтостроительства http://www.i2r.ru/static/244/

Ответить   Sun, 20 Nov 2005 14:58:43 +0200 (#477807)

 

Недостаток юзабилити. На странице должна быть размещена ссылка на
ресурс, другое дело что ее не надо делать в меню. Достаточно вывести
что-нибудь вроде HTTP_HOST в нижней части страницы или в комментариях
в коде.

Ответить   Sun, 20 Nov 2005 16:43:27 +0300 (#477863)

 

Hello dgstudio!

Sunday, November 20, 2005, 3:43:27 PM, you wrote:

То-то оно и Кутуньо (с), коллега. :-)
А не было такой фичи.

WBR, Demetrius



библиотекa сайтостроительства http://www.i2r.ru/static/244/

Ответить   Sun, 20 Nov 2005 20:27:54 +0200 (#477927)

 

Если сохраняли всю страницу через эксплорер, то в коде должна была быть строка
типа saved from с адресом

или поставить в коде <base href="http://сайт.ру">



библиотекa сайтостроительства http://www.i2r.ru/static/244/

Ответить   Sun, 20 Nov 2005 19:56:03 +0300 (#478273)

 

Hello Aleksei!

Sunday, November 20, 2005, 6:56:03 PM, you wrote:

Ан нет, коллега! Я ж тоже не шиком лыт, поэтому посмотрел в код и
увидел следующее (первая строка - пустая):
<!doctype html public "-//W3C//DTD HTML 4.0 Transitional//EN">
<html><head><title>Название_статьи... Библиотека I2R.</title>
<link REL="STYLESHEET" HREF="/i2r.css" TYPE="text/css">
</head>
А дальше сразу тело пошло. Люди добрыя, шо ж это делается-то? 8-()

И такое есть в природе. Но не все об этом знают, как оказалось ;-)

WBR, Demetrius



библиотекa сайтостроительства http://www.i2r.ru/static/244/

Ответить   Mon, 21 Nov 2005 18:57:31 +0200 (#478439)

 

Здравствуйте, Дмитрий.

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<!-- saved from url=(0021)http://www.yandex.ru/ -->
<HTML><HEAD><TITLE>Яндекс</TITLE>
<META http-equiv=Content-Type content="text/html; charset=windows-1251"><LINK

href="http://img.yandex.ru/i/favicon.ico" rel="SHORTCUT ICON">

Может всё-таки шиком лыт?

Ответить   Andrey Yakushev Mon, 21 Nov 2005 20:16:57 +0300 (#478454)

 

Hello Andrey!

Monday, November 21, 2005, 7:16:57 PM, you wrote:

Дык то Яндекс, а то и2р. Найдите 10 отличий :-)

WBR, Demetrius



библиотекa сайтостроительства http://www.i2r.ru/static/244/

Ответить   Mon, 21 Nov 2005 22:10:51 +0200 (#478567)

 

Здравствуйте, Дмитрий.

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<!-- saved from url=(0018)http://www.i2r.ru/ -->
<HTML><HEAD><TITLE>Библиотека ресурсов Интернет индустрии - I2R.
Материалы по темам: Последние новости . ASP - Аренда приложений, Мир
Linux, Программы для бизнеса, Секреты поиска, Карьера, Мобильное,
Реклама, Сети, Консалтинг, Общение в Интернете, чаты, почты, Рынок,
аmazon, Yahoo, ebay, туризм, Фундамент (dns, ftp, http..), Менеджмент,
Подключение к Интернет, провайдеры, модемы, Сайтостроительство,
раскрутка, программирование, дизайн, flash, Электронная
Коммерция</TITLE>
<META http-equiv=Content-Type content="text/html;
charset=windows-1251">

Причём тут ЧТО сохранять? Главное ЧЕМ.
ИЕ6 прекрасно с этим справляется.

Кстати, терпеть не могу сайты с такими титлами. Если вижу в Яндексе -
прохожу мимо. Гораздо интересней увидеть титл со своим запросом. :)

Ответить   Andrey Yakushev Tue, 22 Nov 2005 11:40:10 +0300 (#478787)

 

Hello Andrey!

Tuesday, November 22, 2005, 10:40:10 AM, you wrote:

Мой ИЕ 5.0 справляется отнюдь не хуже. Статьи с других сайтов той же
тематики, которые у меня лежат рядом с искомой, сохранились как
положено. Так может быть это не случайность? Тем более, ваш вариант
сохранённого кода не хуже моего демонстрирует обделённость сайта
мета-тегами.

Полностью согласен. В своей практике придерживаюсь такой методологии.
чтобы каждая страница в титле содержала, ну например такое:
Имя_сайта > Имя_раздела > Имя_статьи (Имя_автора)
А в "ключевых словах", соответственно, ключевые слова самого сайта +
те, что, например, в базе для данной статьи записаны.

WBR, Demetrius



библиотекa сайтостроительства http://www.i2r.ru/static/244/

Ответить   Tue, 22 Nov 2005 14:49:26 +0200 (#478881)

 

Здравствуйте, Дмитрий.

Так я мета-тэги обрезал. Не в этом вопрос. А в том, что комментарием
указывается адрес, с которого сохраняли.

Ответить   Andrey Yakushev Tue, 22 Nov 2005 16:10:01 +0300 (#478893)

 

Hello Andrey!

Tuesday, November 22, 2005, 3:10:01 PM, you wrote:

А вот у меня не указался, причём только на этом сайте. Как
пользователь инетом и посетитель сайта, я имею полное право делать
вывод. :-)

Если не все браузеры (или даже просто не всегда) записывают ссылку,
откуда сохранена страница, то давайте, как джентельмены, будем
принудительно вносить в html комментарий cо ссылкой, взятой из
массива серверных глобалов.

WBR, Demetrius



библиотекa сайтостроительства http://www.i2r.ru/static/244/

Ответить   Tue, 22 Nov 2005 15:28:09 +0200 (#478897)

 

Здравствуйте, Дмитрий.

Предлагаю вебмастерский джентльменский уговор:
На каждой странице есть ссылка на главную. Давайте делать её
абсолютной!

Ответить   Andrey Yakushev Tue, 22 Nov 2005 16:51:50 +0300 (#478912)

 

Hello Andrey!

Tuesday, November 22, 2005, 3:51:50 PM, you wrote:

А я, наивный, думал, что это и без договора очевидно и понятно. :-)
Так же как не имеет смысла джентельменам договариваться о том, что они
не будут срать посреди общей комнаты, а посещать отхожия места (миль
пардон за оффтоп). Но, такова се ля ва. Как для моего примера таки был
издан официальный закон, обязывающий штаб- и обер-офицеров соблюдать
элементарные правила поведения, так и нам, видимо, прийдётся
пропагандировать среди широких масс веб-разработчиков архиважность
такого невзрачного элемента дизайна, как абсолютная ссылка хотя бы на
корень сайта. :-)

WBR, Demetrius



библиотекa сайтостроительства http://www.i2r.ru/static/244/

Ответить   Tue, 22 Nov 2005 16:12:44 +0200 (#478922)

 

Доброго времени суток Дмитрий,

Однаков последние пару лет именно а не meta keywords является
приоритетным списком ключевых слов сайта при его первой индексации.
Потому не думаю, что дописывание ключевых слов или фраз в title -
пример, плохого тона вебмастера. Ведь эти слова могут быть записаны
дплеко за видимой областью заголовка окна брайзера, потому не будут
мазолить глаза никому.

Ответить   Zigzag Tue, 22 Nov 2005 16:08:45 +0200 (#478924)

 

Здравствуйте, Zigzag.

Вы писали 22 ноября 2005 г., 17:08:45:

С точки зрение промоутера, может быть, это и хорошо. Но для человека -
плохо. В конце концов, вы делаете сайты не для роботов.
А плохо, например, потому, что такую страницу сохранить тяжело.
У меня вон страница, о которой я говорил, с большим титлом, вообще не
сохранялась, пока я не догадался её переименовать.
А теперь объясните мне, нахрена мне морочится и переименовывать
страницы, если какой-то идиот-вебмастер захотел именно таким способом
получить первые места в поисковиках.
Я ж говорю, когда вижу такие заголовки, специально пролистываю их. :)

Ответить   Andrey Yakushev Tue, 22 Nov 2005 19:14:21 +0300 (#478994)

 

Hello Andrey!

Tuesday, November 22, 2005, 6:14:21 PM, you wrote:

У меня та же проблема была. И мало того, что так неудобно сохранять,
так ещё и неудобно читать список файлов, чтобы найти нужную статью по
названию. К тому же потом нельзя найти сайт по несохранённому УРЛ. И
это ведь не хомяк Васи Пупкина, а "Библиотека сайтостроительства"!!!
Мне за такой креатифф было бы стыдно. :-(

WBR, Demetrius



библиотекa сайтостроительства http://www.i2r.ru/static/244/

Ответить   Wed, 23 Nov 2005 03:44:17 +0200 (#479222)

 

Ну это просто свидетельвует о том, что хозяин слабо себе представляет, что такое
оптимизация. К тайтлам надо очень бережно относиться, но поситители, видать,
не нужны :-)



библиотекa сайтостроительства http://www.i2r.ru/static/244/

Ответить   Wed, 23 Nov 2005 21:00:25 +0300 (#479579)

 

Здравствуйте, Aleksei.

Вот интересная мысль...
Как-то забыл про это.
Поскакал ставить, и обломался.
Вообще, <base ...> это просто вынесенное "за скобки" начало всех
ссылок на странице. Т.е. нет никакой разницы в том, что ставить полный
урл в каждой ссылке на сайте или вынести хост в заголовки.
А обломался я вот почему. У меня почти везде на страницах идут
абсолютные ссылки но относительно корня сайта (DOCUMENT_ROOT). Т.е.,
если я нахожусь где-то в глубине, а мне надо сослаться на какую-нибудь
картинку, то я делаю не ../../../img/pic.gif, а /img/pic.gif.
Но вот есть у меня один раздел, который показывается одним скриптом. И
там, при выводе, например, ссылок на разные его страницы, я пишу:
<a href="?id=123">. И тут получается ж...
Использовать в этом разделе другой бэйс нельзя, потому что там же в
нём есть шапка с меню, которая ссылается на другие разделы, но уже от
корня.

Так что, бэйс - не панацея!

Ответить   Andrey Yakushev Tue, 22 Nov 2005 11:58:35 +0300 (#478796)

 

Hello Andrey!

Tuesday, November 22, 2005, 10:58:35 AM, you wrote:

В контексте дискуссии это имеет смысл в том плане, что можно прочитать
адрес "базы" в коде сохранённой страницы и определить, адрес сайта,
что и требуется.

Вероятно, это не просто "какая-нибудь картинка", а из чиста оформления
сайта? Ибо картинки от статей, по идее, в других местах хранятся, по
своим правилам.

При такой структуре - согласен. Я предпочитаю иной вариант:

Все ссылки ведут на "index.php" с аргументами. Оный скрипт рисует
оформление и всё такое, а также в зависимости от get-\post-переменной
"контент" инклюдит нужный модуль контента, остальные переменные его не
касаются. В отличии от тех самых модулей, которые уже и обрабатывают
свои данные, взятые из того же гета или поста.

Таким образом, фактически ВСЕ страницы расположены в корне сайта,
поэтому можно смело писать "/img/pic.gif". Недостаток метода - ссылки
на страницы раздела нужно писать в виде
"index.php?content=news&id=123".

Теперь вуаля! Прибавляем к этому mod_rewrite, с помощью которого
переписываем урлы вида "^news/([0-9]+)/?$" в
"index.php?content=news&id=$1". Таким образом ссылка на раздел будет
просто <a href="news">, а ссылка на отдельную новость, например такая:
<a href="news/123">. Проблема может возникнуть, т.к. эта страница,
якобы, находится не в корне сайта, в а директории "news", о реальном
отсутствии которой браузер понятия не имеет. Следовательно, картинка
по адресу "/img/pic.gif" будет искаться не там, где фактически
написано в коде, а на "/news/img/pic.gif" или даже на
"/news/123/img/pic.gif" относительно корня. Поэтому...

Ещё раз вуаля! Пишем а шапку сайта базу
"http://".$_SERVER['HTTP_HOST']."/" с вариациями (кто какие переменные
использует). Таким образом, наша ссылка <a href="news/123"> становится
АБСОЛЮТНОЙ! :-)

Если вы принципиально не желаете писать имя раздела в ссылках
того же раздела, в конце концов можно процесс дописывания этого имени
к ссылкам автоматизировать, но это, IMHO, изврат.

Занавес...

WBR, Demetrius



библиотекa сайтостроительства http://www.i2r.ru/static/244/

Ответить   Tue, 22 Nov 2005 15:21:11 +0200 (#478894)

 

Привет народ.

Большего бреда не читал. картинка по адресу "/img/pic.gif" будет искаться
только по адресу "/img/pic.gif" от корня сайта, а на "/news/img/pic.gif" или

даже на "/news/123/img/pic.gif". Этот прием полезен когда у вас скапливается

много файлов в одном месте, например, в корне сайта, и надо их логично
структурировать по папкам. Тогда не надо менять все ссылки на картинки в
файлах, которые переносились.

Господа, вы тут вроде вебмастерами себя именуете, говорите про какие-то
проф.соглашения, неужели еще кто-то из вас серфит в IE. Я лично его
использую только на этапе проверки верстки на предмет правильности
отображения в различных браузерах, и никогда не перестаю удивляться тому,
как он игнорирует все стандарты W3С.

С уважением,
Юра



библиотекa сайтостроительства http://www.i2r.ru/static/244/

Ответить   Tue, 22 Nov 2005 22:18:46 +0200 (#479380)