Воровство контента: как защититься, превентивные меры
Проверяю позавчера почту и вижу большое число комментариев на разных блогах, требующих подтверждения. Сразу понимаю, что дело неладное, неужто спамеры постарались. На самом деле оказалось трекбеки, что в свою очередь, может быть вызвано еще одним нехорошим событием.
Пошел, значит, проверять кто же такой щедрый на ссылки и оказалось, что один нехороший человек нагло и цинично украл у меня контент нескольких постов с моего сайта. Судя по всему, предварительно прогнав все это дело через синонимайзер, либо еще как-то, потому что текст был не читаем.
К сожалению, я оказался не единственной жертвой этого человека, и замеченные отличия натолкнули на написание этой статьи. Другие пострадали немного меньше, поскольку использовали «кат» для своих сообщений, то есть каждый пост имел анонс, что отображался на главной странице блога и уходил в RSS, а для полного прочтения статьи нужно было кликнуть на ссылку. Причем, в данном случае злоумышленник оставлял в своем блоге лишь текст, ссылку «ката» резал.
Ранее я неоднократно повторял, что выступаю только за публикацию полных сообщений в RSS и на сайте. Зачем человеку делать лишний клик, Интернет сейчас у большинства весьма хороший. В общем, это привело к тому, что мои посты были украдены целиком:) Но не все оказалось так печально. Это частично можно использовать для защиты контента — следовательно я начал делалть анонсы постов блога в ленте RSS.
Некоторые фишки при защите контента от воровства
1. Во-первых, я стараюсь во время написания статьи ставить ссылки на другие свои посты, что-то вроде «вчера я рассмотрел такую-то тему» или «вопрос уже поднимался в блоге месяц назад» и т.п. В таком случае вы хотя бы получите обратные ссылки, да и для перелинковки это хорошо, можно при этом использовать ключевые слова. Когда-то на Дизайн Мании файлы хранились в Letitbit, и за скачивание там давали небольшой бонус ($15 за 1000 загрузок), поэтому теоретически при попадании сайта-клона в индекс и наличии там трафика я мог бы получать дополнительный доход. О ссылках на свои посты блога я уже размышлял.
2. Если лень или некогда ставить в каждой статье ссылки, выбирать подходящие материалы, то позвольте это сделать самой системе. От вас требуется лишь установить плагин simple-tags. Он имеет множество полезных функции, одна из которых вывод связных по тематике сообщений для каждой статьи. Выбор происходит на основании указанных тегов. В этом случае можно найти сразу несколько полезных действий. Ведь для случайного посетителя, который только лишь попал на ваш блог, было бы интересно почитать другие статьи. Также «связные посты» транслируются в RSS фид, поэтому новые подписчики смогут найти для себя нечто из архивных публикаций. Ну и поскольку контент воруется обычно через RSS фид, такие ссылки также попадут на сайт-клон.
3. Есть еще один полезный плагин — ozh-better-feed. Он позволяет добавить в RSS некоторый дополнительный текст, например, копирайт, ссылку для добавления поста в delicious, свою ссылку «читать далее» и многое другое. Вот так это выглядит у меня в блоге:
Хотя все эти методы хороши, когда злоумышленник действует не очень умно — не убирает ссылки из постов, не заботиться о дизайне (стандартная тема от WordPress ужасная), все украденные тексты были добавлены за один раз. Исходя из этого, а также сохранившихся ссылок на себя я, в принципе, могу не сильно переживать за сайт. К тому же Дизайн Мания имеет далеко не нулевые показатели и в глазах поисковиков, думаю, выглядит более значимым (трастовым) проектом нежели только что созданный ужасный ресурс.
4. Еще одним из первых, что приходит на ум при защите контента — это опция сервиса FeedBurner, которая запрещает использование RSS фида через Yahoo Pipes — наиболее часто используемого для создания сплогов и воровства контента. Находится данная функция в меню Publicize — Noindex:
Правда, в наши дни, думаю, это все не очень эффективно, и обойти такую защиту раз плюнуть. Это также «наивно» как запрещать клик правой кнопкой мыши на страницах сайта.
Как же вести себя в ситуации, когда превентивные меры предпринимать уже поздно? Пока у меня есть только теоретические наработки в этом направлении. Тем не менее, они могут пригодиться.
Разбираемся со злоумышленником, если контент уже украден
1. Первый шаг разбирательства с сайтом, ворующим контент — обратиться к автору. Люди попадаются разные, до некоторых после объяснений доходит, что они сделали не хорошо, и копипаст убирается. Такое, скорее всего, приемлемо для серьезных, открытых (в плане деятельности) лиц — фирм, организаций и т.п. Вот, например, однажды с сайта веб-студии, где я работал, был украден почти весь контент. После письма с предупреждениями о судебных разбирательствах он был удален:) Другое дело, когда автор анонимен.
2. Шаг номер 2 — обратиться к хостеру, предоставляющим услугу размещения этого сайта в сети. На практике тоже не всегда срабатывает, поскольку для хостера сайт — это, прежде всего, деньги, прибыль. Не каждый захочет от нее отказаться. Конечно, в этом случае затрагивается моральная сторона вопроса или имиджевая. Серьезная хостинг компания должна следить за своими клиентами и наказывать не только за спам, адалт или фарма сайты, но и воровство контента.
3. Последнее место, куда можно обратиться, не считая суда, это поисковые системы. Не уверен, что работники Google будут «выходить на контакт», мне почему-то все еще кажется, что он «где-то там далеко, за океаном». Яндекс выглядит несколько ближе и доступнее в этом плане. В качестве доказательств вашей правоты может служить дата регистрации домена, наличие страниц сайта в индексе, в кэше Google. Но это все будет иметь вес, если обратиться сразу, чуть позже, я так понимаю, доказать будет уже сложнее.
Кстати, если речь идет о чем-то более серьезном чем просто контент, то можно подать жалобу на нарушение авторских прав в Adsense если злоумышленник использует эту систему при монетизации.
Интересно услышать о вашем опыте борьбы с вороством контента. Какие еще методы знаете, что более эффективно?
P.S. Советую обратить внимание на рейтинг блогов о заработке — хорошая возможность найти новых читателей. Я уже там зарегился:)
Также хочу порекомендовать сервис ИТ-ориентированных переводов сайтов — «Alconost Translations». Они помогут с решением вашей проблемы.
У меня была такая проблема. Я обратился в ру цент где был зарегистрирован домен, где мне сказали что домен делегирован на таком то хостинге, в который я обратился. После чего блог нарушителя был отключен
Если почитать рекомендации поисковиков по этому поводу, везде все пишут практически одинаково: «Вы должны самостоятельно обратиться к нарушителю и договориться с ним о том, чтобы незаконное копирование материалов прекратилось». По этому поводу суд, это еще сложнее чем все вышеописанное, т.к. доказать что это именно твой текст, очень сложно.
Авторский текст после синонимайзера, это уже можно считать «ремиксом» и авторские права здесь не особо помогут.
Действенней всего конечно это письмо ворам ну и ссылки в своих постах, на собственные посты.
да, это проблема.
находил несколько раз полностью выдраные сообщения, за несколько недель подряд, не измененные совсем…
в жж, на юкосе, жаловался в поддержку, правда не знаю чем заканчивалось, больше туда не заходил.
это наверно называется дорвеи? когда тупо собирается инфа и публикуется массово
Дорвеи — это немного другое. Чаще всего таким страдают спроги — автоматически наполняемые блоги — воруется текст с нескольких источников и проганяется синонимайзером.
Нещодавно ворюга вкрав скопіпастив у мене цілий ігровий фан-сайт. Якщо цікаво — подробиці тут. Негідник зробив те саме, що й нещодавно з трьома українськими відомими ресурсами. І так само клон хостився на «Мірахості». Чому вони вибирають цей хостинг? Але, до честі хостера, реакція була швидка і вже за півгодини сайт-клон було відключено!
>>>Есть еще один полезный плагин — ozh-better-feed. Он позволяет добавить в RSS некоторый дополнительный текст, например, копирайт, ссылку для добавления поста в delicious, свою ссылку «читать далее» и многое другое. Вот так это выглядит у меня в блоге:
у меня в РСС видна картинка
На счет обращения в поисковые системы. С саппорта яндекса обычно приходит такой ответ:
«Поисковая система Яндекс является лишь зеркалом русского Интернета, поэтому мы не правомочны разбираться в вопросах плагиата. Чтобы защитить свои авторские права Вам надо, видимо, обратиться к хозяевам указанного сайта и к провайдеру, на сервере которого он находится. Если сайт прекратит свое существование, он будет удален из поисковой базы Яндекс автоматически.
Тем не менее, мы уже работаем над алгоритмами, которые будут способны отличать текст источника от плагиата.»
А ничего практически сделать невозможно. Подумай сам, если уж «Голливуд всесильный и ужасный» (всякие там Тайм/Уорнер и др.) ведёт войну с пиратством без особого успеха, то что может сделать простой блоггер? А ведь у них целая армия адвокатов и сыщиков, неплохо проработанное законодательство, поддержка правоохранительных органов, да ещё дядя Сэм и ВТО за спиной стоят с угрозой применить санкции к тем странам, которые плохо борются с пиратством. Так что, смирись и работай дальше.
Можешь конечно попробовать обратится к копипастеру и попросить/припугнуть его убрать ворованный контент или поставить хотя бы гиперссылку на твой сайт, но больше ничего. Нет, если есть лишние деньги и время, можно пойти в милицию/прокуратуру, нанять адвоката, подать гражданский иск…Вот только стоит ли игра свеч?
Rulaf, про яндекс это смешно, конечно, если не было бы так грустно) Тут недавно они выкинули из индекса Блогохохел мой, которому уже год, там исключительно авторские тексты и есть небольшое комьюнити. Я уже было подумал что виной всему зеркало на Я.ру, поэтому начал удалять. Ведь совсем недавно на Хабре была история как одну очень крутую компанию занимающуюся поисковой оптимизацией исключили из индекса из-за (внимание!) копипаста на Народ.ру. Мне лично просто страшно стало какие это они там «супер алгоритмы разрабатывают») Лучше бы разбирались с жалобами от пользователей — на начальной стадии отличить копипаст реально — сравнив для сайта.
Александр, полностью согласен. Теоретически, если захотеть можно украсть, сломать любую программу и т.п. Все, что я написал выше, действует лишь против новичков, жаждущих побыстрее заработать денег, у которых нет ни опыта, ни знаний.
Спасибо за плагины, скачал и установил оба.
По поводу Яндекса говорить без мата нельзя. Мой блог аналогично выкинули из поискового индекса, хотя нарушений в раскрутке нет. Хотя бы потому, что нет и самой раскрутки. Даже в каталоги не регистрировал. С гуглом все ОК.
Но когда телепортом выкачали полностью другой мой сайт, ответ Яндекса был примерно как у Rulaf.
Хорошая статья!
В нашей стране авторское право является молодой отраслбю права, присутствует множество коллизий, которые мешают правильно работать в этом направлении.
С юридической точки зрения можно обратится в суд, но в России вас посчитают несовсем адекватным человеком, т.к. на практике подобные дела просто являются правальными и не рассматриваются в суде.
Мы в России, и этим всё сказано!
Напишу с 2х позиций.
К воровству контента надо быть готовым изначально, потому что если интересно, то почти всегда своруют ;) Поэтому ссылки на самого себя, другие свои страницы, картинки с вотермарками советую делать. Это не так сложно, зато эффект дает неплохой. Кстати, насчет поисковиков и хостеров: не все так безнадежно, часто бывает достаточно предоставить ссылки на индекс ПС хостеру и тот соглашается, что имеет место нарушение авторских прав и можно воздействовать на хозяина ресурса, своровавшего контент.
Полностью защититься от кражи контента нереально. Сам переписывал под различные нужны граббилки RSS.
Просто используйте пополной тех, кто пытается использовать вас ;)
Ссылки в теле поста хороши при постинге, к примеру, на Хабре. Если топик выйдет на индекс — его растаскивают десятки сплогов, и я поимел пару десятков ссылок таким образом. Мелочь, а приятно — плюс немного трафика всё-таки идёт :)
Артур, у нас в Украине не лучше.
shr, полностью согласен, нужно будет еще автоматизировать процесс нанесения лого на картинки, может подскажешь софт какой-то? кроме фотошопа:)
Волотко Дмитрий, я в последнее время на Хабре мало публикуюсь после их открытой нелюбви к копипасту, да и минусуют часто)
>>>Ведь совсем недавно на Хабре была история как одну очень крутую компанию занимающуюся поисковой оптимизацией исключили из индекса из-за (внимание!) копипаста на Народ.ру.
Tod, эта компания лукавит :) Их исключили из индекса совсем за другое, а не из-за копипаста на народ.ру :)
Реально действующих методов нет, увы, недавно вот написал одному хостеру и тишина в ответ…
А вообще по методам, это на alexnote.ru описано пару способов, типа отсроченная отдача новости по рсс и замена букв на латинские…вообщем поиск там вам поможет.
Когда у меня с блога воровали контент — чистили все ссылки, перемещали картинки к себе на сервер — в общем, автоматизация была достаточно грамотная) Еще и изменили порядок публикации (несмотря на то, что порядок публикации был важен), а даты поставили более ранние (вообще мой блог тогда даже и не существовал). Тот сайт, помню, вышел в топ яндекса по моему запросу (моего блога вообще не было в индексе) — поэтому было немного обидно. Но ничего, потом он оттуда исчез. :))
Заметил, что воруют информацию из блога и «пакуют» в сплог. Решил добавлять в каждую запись по 3-4 «скрытые» ссылки не только на блог, но и на другие свои сайты :) Пока смотрю — ссылки стоят, никто не убирает , зачем же трогать «вора» — дополнительная раскрутка не помешает.
Как технически защититься, подсказать не могу — не специалист. Но судя по комментариям, это геморно, а — главное — не гарантирует результат.
А вот по опыту в области Интернет права могу точно сказать: Интернет подчиняется тем же законам, что и обычная жизнь. И бороться за свои права можно, механизмы есть. Контент, как любой продукт интеллектуальной (творческой) деятельности защищается авторским правом. И есть методы доказательств воровства контента, и есть практика общения с хостерами и поисковыми системами. И есть успешные судебные процессы.
А знаете чего мало? Мало людей, которые хотят бороться за свои права! Все считают, что это безнаказанно и ничего не предпринимают.
Автор спасибо огромное за статью, на моём блоге тоже пару дней назад украли статьи, теперь хоть буду знать что делать.
Подскажите я установил плагин wp-copyprotect к него нет проблем с поисковиками ?
А как по поводу того, что хозяин контента, выложил его специально на сайте для того, чтобы его как можно большее количество людей увидело. Украденный контент — с действующей ссылкой на сайт хозяина, это ведь бесплатная реклама этому контенту, да и сайту попутно. А вы обсуждаете методы защиты, надо еще хозяину контента платить вору за пиар его сайта. А вы рассказываете — как самому себе на прибор наступить, сузив тем самым круг увидевших ваш сайт и контент, что же это за раскрутка получается?
Дмитрий, если честно, без понятия, с wp-copyprotect я не работал.
Валерий, во-первых, это бывает достаточно редко, когда ворующий тексты ставит «открытую» обратную ссылку, во-вторых, часто бывает что эффект от ссылки никакой по сравнению с тем, что поисковики посчитают опубликованный текст на другом сайте — источником, в-третьих, копирование контента надо обсуждать с автором, я просто могу НЕ хотеть чтобы мои тексты были где-то еще, имею так сказать полно право. Поэтому, Валерий, не следует подменять понятия, воровство контента это воровство, а не какая-то благодать.