Защита контента от копирования
2010-08-09 17:45 melnikoff_kc@list.ru (Bormaley)
Без контента (то есть «наполнения» — текстов, иллюстраций и так далее) сайт не будет работать и приносить прибыль. Согласитесь, трудно представить себе человека, который что-то купит у фирмы, предлагающей нечто вроде «Страница в разработке» или «Тест ТЕСТ тест тест». Эта аксиома не требует доказательств, а потому сразу перейдем к вопросам о том, где взять контент, и как защитить его от копирования.
Контент можно:
1. создать самостоятельно — способ весьма трудоемкий (к тому же вы вряд ли являетесь специалистом по копирайтингу, то есть написанию продающих текстов, профессиональным фотографом и иллюстратором);
2. заказать в специализированной компании или у фрилансера — это оптимальный вариант (диапазон цен очень широк: от 70 рублей за страницу средненького текста до 4000-6000 долларов за полное наполнение сайта профессионально подготовленными материалами);
3. украсть у конкурентов или на сайтах аналогичной тематики (причем эту «операцию Ы» можно провести как без стеснения — заимствовать тексты и картинки целиком, так и с некоторой степенью порядочности — с рерайтом). Рерайт — это переписывание чужого текста своими словами (точнее, обычной заменой каждого третьего-пятого слова синонимом).
Очевидно, что для любого серьезного проекта подходят только первые два варианта. Третий же будет для честных людей постоянной опасностью — особенно потому, что поисковые системы наказывают («пессимизируют», понижают в результатах поиска) сайты с дублирующимся контентом. Самое неприятное, что они не пытаются определить первоисточник! Проблема защиты от копирования особенно актуальна, если у вас очень хороший и часто обновляющийся контент, и его воруют чуть ли не в режиме реального времени. Если вы приняли решение не использовать «контрафактный» контент, то защита интеллектуальной собственности и пресечение попыток воровства станет важной задачей. И, повторимся, дело не только в принципиальности и том, что «вор должен сидеть в тюрьме», а именно в политике поисковых систем по отношению к копиям вашего контента. Вам придется либо защищать свой контент, либо постоянно его заменять, переписывать, — а это недешевое удовольствие.
Итак, у владельца сайта и оригинального контента есть две задачи:
1. принять превентивные меры для защиты интеллектуальной собственности;
2. вовремя обнаруживать и пресекать попытки копирования текстов и прочих материалов в досудебном и судебном порядках.
Предупреждающие меры защиты контента
К сожалению, пока ни Яндекс, ни Google не предоставляют инструментария или официальной процедуры подтверждения прав на контент. Поэтому приходится ставить эксперименты и пытаться выяснить, по каким критериям поисковики определяют первоисточники.
1. Достаточно известный (потому, что он работающий) способ закрепить за собой статус первоисточника — приобретать на каждый материал несколько входящих ссылок с достаточно длинными анкорами-цитатами из защищаемого контента. Согласно результатам многих проверок, если на текст есть ссылки с цитатами из него же, поисковик с гораздо меньшей вероятностью сочтет первоисточником этого материала другой сайт.
2. Еще один очевидный метод — писать тексты таким образом, чтобы их было трудно поставить на сайт другой организации без коренной переделки. К сожалению, этот способ работает только против мелких воришек, рыщущих по сети в поисках наполнения для своих СДЛ («сайтов для людей»). Если же контент копируется с цель наполнения сателлитов и прочих «сайтов не для людей», его содержание не имеет значения. Таким «текстовым гангстерам» важны только тематика и оригинальность (отсутствие множества копий в интернете).
3. Может помочь простое размещение предупреждения о том, что контент защищается юридически. Поскольку у копипастеров есть огромный выбор контента для кражи, они могут оставить ваш сайт в покое. А вот ставить «водяные знаки» на иллюстрациях не стоит: это раздражает посетителей вашего сайта, а от копирования практически не защищает. Также мы не рекомендуем пользоваться различными плагинами и скриптами, запрещающими копирование текста, вставляющими какие-то дополнительные строки и т.п. Все это может быть воспринято поисковой системой как попытка обмана, клоакинга (подмены контента). Сайт, применяющий такие хитрости — пусть и с благими намерениями — достаточно сильно рискует выпасть из результатов поиска или заметно потерять позиции.
Помимо технических способов защиты, будьте готовы защищать свои интересы в суде. Конечно, нужно заранее просчитать, будет ли рентабельно оформление авторских прав на контент (в том числе и вновь создаваемый), а также юридическое обслуживание в целом. Может оказаться, что проще смириться и переписывать, пусть и за деньги, украденные тексты заново.
Служба внешней разведки
Как можно обнаружить, что у вас украли тексты? Существует несколько сервисов, способных помочь в несении почетного караула. Конечно, если текста на сайте немного, можно делать проверку и вручную: просто брать произвольный кусок текста (не слишком большой) и задавать его Яндексу и Google как поисковый запрос, предварительно заключив в кавычки.
Перечисленные ниже сервисы работают по такому же принципу, просто облегчая работу по нажиманию волшебных хоткеев Ctrl-C и Ctrl-V.
1. Программа Double Content Finder от сервиса textbroker.ru. Простой интерфейс без изысков. Позволяет провести поиск копий текста из файла или размещенного на указанной веб-странице.
2. Веб-сервис copyscape.com. Классика проверки текстов на уникальность. Даже в бесплатном функционале предоставляет неплохие возможности. Проверку проводит на основе обращений к Google. За сравнительно же небольшие деньги CopyScape предоставляет более продвинутый сервис: полную проверку всех страниц сайта (их ведь может быть несколько тысяч), а также периодическую автоматическую проверку. У сервиса есть и API, что позволит при желании написать собственный скрипт.
3. Проверить, не украли ли у вас иллюстрации и изображения (с некоторой степенью точности) поможет сервис TinEye .
Как защитить контент
Если проверка выявила наличие копий, необходимо связаться с владельцами этих сайтов. К сожалению, далеко не всегда владельцы подобных ресурсов оставляют какую бы то ни было контактную информацию. В этом случае есть два пути:
1. попытаться получить ее с помощью whois-сервиса, предоставляющего всю открытую информацию по домену (например, http://whois.org/). Но далеко не во всех доменных зонах есть требования к владельцам доменов о предоставлении оригиналов документов, поэтому многие недобросовестные личности оставляют в whois произвольные или неполные данные.
2. связаться с хостером, в дата-центрах которого размещен сервер сайта-вора.
Чтобы определить хостера по домену, существует несколько методов.
* Первый — посмотреть ns-серверы в той же самой whois-информации. Очень часто в них указывается домен хостера, хотя некоторые сайты могут пользоваться своими DNS. * Достаточный объем информации можно получить с использованием DNS Lookup — например, удобного сервиса http://www.lookupserver.com/.
Далее можно отправить хостеру или администрации дата-центра письмо с уведомлением о ситуации и готовности передать дело в суд. Полезно перевести это типовое письмо на английский, так как многие «копипастеры» размещают свои сайты не на российских хостингах. В некотором проценте случаев хостер отреагирует закрытием сайта-вора, однако есть «абузоустойчивые» хостинги и они ни на какие юридические уведомления они реагировать не будут, а сами серверы физически расположены далеко за пределами России — в странах, где интернет-право не регулирует такие вопросы. К сожалению, пока слабость юридических процедур не позволяет обеспечить решение вопроса в пользу правообладателя в ста процентах случаев.
По материалам: Рассылка от SeoPult.ru: автоматизированное продвижение сайтов.