Обзор Сервисов-Идентификаторов Плагиата

plaguate-recognize-service

Еще раз немного поговорим о плагиате — сейчас борьба с этим явлением стала как никогда актуальна.
Напоминаем, что на нашем сайте уже имеется ряд материалов посвященных вопросам защиты контентного наполнения сайтов. Например, в статье «Что делать, если воруют контент?» детально рассмотрены два рабочих способа защиты от злостных копипастеров, а материал под названием «Как защищаться от обвинений в плагиате»посвящен вопросу, как корректно себя вести в тех случаях, когда вас обвиняют в нарушении авторских прав. Рекомендуем вам ознакомиться с этими статьями — они весьма подробны и в них присутствует нечто вроде инструктажа.

В данной же статье мы остановимся на сервисах, которые помогают идентифицировать нарушение авторских прав — т.е. сделаем небольшой обзор тех служб, алгоритмы которых заточены под сканирование сети на предмет выявления схожих текстов. Но для начала — пара полезных советов.

Не для кого не секрет, что плагиат на какой-либо контент появляется не только по вине злостных нарушителей. Очень часто выявляется, что сами владельцы сайтов провоцируют воровство своих же текстов.
Это мы говорим к тому, что не забывайте ставить приблизительно такое оповещение на морде своего сайта — «Любое использование материалов, их подборки, может осуществляться только с указанием ссылки на источник». Текст можно варьировать как вам угодно — главное, что б было понятно — вы не даете своего согласия на то, что у вас будут нагло выдергивать контент.

Еще момент — настраивайте RSS канал так, что бы в нем не было полного текста статьи или поста. Очень часто контент воруется не копи-пастом, а через подписку на RSS — поэтому, если ваш фид будет носить исключительно характер анонса (заголовок и пара предложений из основного текста), то такими популярными примочкой, как, скажем, YhooPipes, его уже невозможно будет запостить на другом сайте в автоматическом режиме.

Поэтому, для того, чтобы не провоцировать воровство — поставьте нечто вроде предостерегающих знаков и окружите ваше детище небольшим забором. Это оградит ваш контент от огромного количества потенциальных злоумышленников. Ну а теперь о том, как можно быстро проверить — воруют у вас контент или нет.

Самый простой способ проверки на плагиат вы, наверное, и так знаете. Загоняем в гугл или яндекс кусок из своего тектса, жмем «поиск» и смотрим выдачу. Если ваш сайт проиндексирован вышеназванными поисковыми системами, то тот отрывок контента, который вы ввели в поисковую форму, будет находиться на первом месте выдачи. Ну, а плагиат, конечно же, будет находиться этажом ниже (если он имеет место быть). Такой способ эффективен, когда у вас мало контента — проверить дубликаты пары десятков статей не отнимет много времени.

Но вот что делать, когда контента много? Не будете же вы, скажем, сто пятьдесят страниц своего сайта прогонять через гуглю! На помощь приходят специально созданные для такого случая службы. В принципе, все они, как бы платные, но платить придется только в том случае, если пользоваться ими вы собираетесь каждый день (и по много раз). Обычному же веб-мастеру, который просто раз в неделю или же раз в месяц желает удостовериться в том, что его не обворовывают, можно вообще ничего не платить.

Поскольку тексты бывают на различных языках, то следует определиться под какой язык заточен тот или иной детектор плагиата. В данной статье мы рассматриваем только англоязычные и русскоязычные службы.

  • 1. Самый знаменитый детектор — это Copyscape.com. Систему эту всегда приводят в качестве примера и, зачастую, на вопрос — «А действительно ли этот контент уникальный?», можно услышать ответ — «Проверьте через Copyscape и узнаете». Служба эта действительно классная — вводите адрес какой-либо страницы своего сайта (или же просто — адрес сайта целиком) и получаете выдачу. В выдаче подробно показано — где находится сворованный у вас контент. Разумеется, в результатах обязательно будут ошибочные ссылки и другой мусор, но в 90% случаев Copyscape находит все на ура. Очень хороший сервис, одним словом — рекомендуем!
    И еще, кстати, не забывайте — эта система следить за вашим IP! Если будете пользоваться ее услугами более чем 10 раз в сутки, то она потребует от вас оплаты. Мониторинг плагиата от Copyscape сейчас используют почти все рунетовские биржи контента (например, контент-провайдер http://copylancer.ru/ весьма хорошо внедрил в свой интерфейс поисковую форму от Copyscape).
  • 2. Второй сервис, который нам очень нравится, называется Plagiarismdetect
    Сервис полностью бесплатен — единственное, что просит разработчик, так это по возможности перекинуть ему денег посредством формы Donate. Алгоритм придуман молодым американским программистом Джефри Смитом (Jeffrey Smith) и, на наш взгляд, Plagiarismdetect.com получился просто замечательным конкурентом раскрученному Copyscape. Если сравнивать выдачу этих двух систем, то будет видно, что поиск плагиата осуществляется на основании разных алгоритмов. То, что находит Copyscape Plagiarismdetect может и не найти, но это еще не говорит о том, что проанализировав выдачу от Plagiarismdetect вы не обнаружите там не найденное при анализе в Copyscape. Короче говоря — очень рекомендуем перепроверять свой контент на плагиат в обоих системах сразу.
  • 3. Полностью платный сервис — Iplagiarismcheck . К сожалению, сказать что-то конкретно об этой службе ничего не можем, т.к. никогда ей не пользовались (т.е. не платили $5 за проверку одного единственного документа). Различные же независимые обзоры говорят о том, что сервис обладает очень могучим потенциалом. Поиск производится по кэшу всех поисковиков, по блоговым директорям и по каталогам сайтов. Если вы заинтересованы в дотошном исследовании какого-либо контента на плагиат, то вам надо прямиком на Iplagiarismcheck! Разбирайтесь!
  • 4. Рунетовский сервис Антиплагиат.ру — ориентирован, главным образом, на идентификацию научных и учебных публикация (диссертаций, дипломов, рефератов и т.п.). Тем не менее, его можно использовать и для выявления дублированного контента в виде тематических статей и постов. Минус у системы один — нет формы для ввода адреса, т.е. проверить сайт целиком нельзя. Доступна только проверка текста, через специальную форму — 5000 символов за один раз. Считается, что посредством Антиплагиат.ру можно уличать студентов в воровстве рефератов и курсовых.
    Большой плюс — Антиплагиат.ру разрабатывался и затачивался исключительно под русский язык — поэтому, если ваша сфера деятельности рунет, то не забывайте тестить свой контент и на этом сайте.
  • 5. Еще один рунетовский детектор плагиата — Pasteit! . Эта система создана недавно и на форуме биржи сылок Sape.ru можно наблюдать как его, по началу неудачно, начали пиарить (http://forum.sape.ru/archive/index.php/t-5577.html). Pasteit! — это не только детектор плагиата, но еще и сервис по написанию оригинальных статей, рерайтов и переводов. С главной страницы доступна форма ввода адреса для проверяемой страницы. Поиск производится по выдаче поисковых систем. Есть возможность выбрать — в каком именно поисковике искать дубликаты (поисковики — Google, Yandex, Rambeler). В принципе, все очень просто. Что бы все заработало, необходимо пройти непродолжительную процедуру регистрации. Сервис платный, но разрешается сделать 10 тестовых поисков в течении одних суток.
    Плюс сервиса — заранее можно определить, в выдаче какой системы искать плагиат.
    На наш взгляд, Pasteit! пока что находится в состоянии далеком от совершенства, т.к. в 5-ти случаях из 10-ти плагиат контента обнаружен не был (а он на самом деле был).

Ну вот, вроде и все. Как нам кажется, пять выше представленных служб — это даже больше чем требуется, что бы выявить плагиат на ваши тексты. И на последок! Не забывайте о том, что воровство контента можно использовать и в своих целях. Например, если при написании текста вы не реже двух раз вставляете линки на себя самого (т.е. на какие-то другие статьи уже имеющиеся на вашем сайте), то есть реальная возможность получить дополнительных посетителей с ресурса-вора. Подробнее об этом читайте в статье «Использование плагиата собственных статей».

Воровать же контент будут всегда и бороться с этим делом чрезвычайно сложно. На наш взгляд, самым эффективным способом борьбы с плагиатом, является:

  • своевременное выявление самого факта воровства;
  • реакция на нарушение (обращение к владельцу сайта).

Если нарушитель не соглашается с вашими доводами, то тогда уж надо брать быка за рога и начинать с ним бороться! Читаем статью «Что делать, если воруют контент?». Желаем удачи! И ждем ваших рассказов на нашем форуме!

Опубликовано в разное

Добавить комментарий