Что такое INVITEXT и зачем это нужно?
Технология INVITEXT защищает авторский контент (авторский текст) от кражи и сайты – от копирования.
Защита текста основана на добавление в тексты на сайте невидимых знаков, сообщающих об авторе текста или о сайте, на котором впервые появился защищаемый документ. Невидимые знаки ставятся автоматически в любом количестве в авторский текст. На этом сайте уже присутствует такая защита, но вы ее не видите, а при копировании на другой сайт она проявится.
При несанкционированном скачивании вашего авторского контента (чем занимаются, в частности, сплоги) эти невидимые знаки проявятся и сразу станет понятно, что текст сворован.
Технология мультибаузерная (IE >5.5, Safary, Сhrome, Firefox), подходит для всех систем управления контентом (CMS) и, естественно, бесплатна.
Как это работает?
После изучения некоторого кол-ва материалов по защите авторства текстов и контента, я пришел к выводам:
а) технологии защиты текстов как таковой, в виде удобоваримого продукта, нет и
б) быть не может – от ручной переработки чужого текста не может быть защиты. Опыт мне подсказывает – если что-то захотят украсть – украдут в любом случае.
Таким образом, основная задача заключается в том, чтобы усложнить механические способы воровства контента: копипаст, граббинг, rss-агрегатирование и автообработку текста. В основу решения лег принцип “меченого” текста, который содержит специальный текст-маркер в большом количестве. С помощью этого текста-маркера можно определить автора. Осталось совсем малое – как совместить трудность скачивания с легкостью чтения?
Ответ очевиден – сделать меченый текст невидимым (отсюда название “invitext”) и труднообрабатываемым в автоматическом режиме. Т.е. читатель защитный текст не видит и/или не замечает, а автообработчик не может создать маску (или это осложнено), по которой можно удалить защитный текст из всего документа.
Итак, два столпа вашей защиты:
1) невидимость защитного текста
2) трудность автоудаления маркера из документа
Теперь эти два пункта реализованы в двух вариантах:
1) в виде макроса для MS Word 2003, который позволяет очень просто подготовить текст по данной технологии. Ниже в файле – подробная инструкция по работе и файл с макросом
2) в виде плагина для Wordpress
Практическая реализация защиты контента INVITEXT:
1) Невидимость
Чтобы сделать текст невидимым, его надо сделать очень маленьким и скрытым. Это делается следующей конструкцией CSS:
span.invitext { font-size: 1px; letter-spacing: -1px; visibility: hidden;}
Соответственно, перед текстом-маркером (раскиданном в большом количестве по документу) ставится тэг
<span class="invitext">
и маркер становится малозаметным и не мешает читателям (не забудьте тэг закрыть).
Эту технологию можно считать кросс-браузерной. В таком виде полностью эту конструкцию понимают IE >5.5, Safary, Сhrome и Firefox.
Некоторые трудности возникают с Opera: этот браузер не понимает отрицательный «letter-spacing» и “font-size:1px”. Если «letter-spacing» побороть до выхода следующих версий нельзя, то с “font-size:1px” ситуация следующая: по умолчанию в настройках Opera стоит минимальный размер шрифта 9px. Поэтому пользователи будут видеть пустые промежутки между словами в том месте, где стоит текст-маркер. Это совершенно не мешает чтению защищенного текста.
Что бы уменьшить эти промежутки, надо в Опере настроить минимальный шрифт: Инструменты – Настройки – Дополнительно – Шрифты – Минимальный размер = 0.
Стиль css “display:none” для наших целей не подходит, т.к. невидимый текст не копируется во всех браузерах, кроме IE и Firefox. А нам-то надо, чтобы копировался!
Таким образом, можно добиться наличия незаметного копирайта прямо внутри текста, не мешая посетителям сайта читать ваш защищенный уникальный контент. В качестве примера – весь этот текст. Если вы скопируете и просто вставите в редактор, то увидите это.
Однако если тексты достаточно интересны, то можно их просто скопировать и в том же MS Word автоматически удалить все вхождения текста-маркера, который как раз и появляется во всей красе и в полный размер. Вот тут и начинает работать еще один принцип:
2) Трудность автоудаления и пример маркера
Во всех средах и языках, которые имеют средства обработки текста, есть поиск “по маске” (регулярные выражения). Называется и реализован по-разному, но суть одна: задается образец текста и ищутся все вхождения этого образца в основном документе.
Так же есть некие символы-заменители, например звездочка, которая заменяет любой символ.
Наличие дополнительных символов может затруднить обработку текста – достаточно случайным образом добавить их в текст-маркер, и создать маску для такого вхождения становится заметно сложнее. Т.е. для обработки скопированного текста придется писать какой-то обработчик, а это уже может сделать процесс воровства контента невыгодным.
Пример:
Допустим, этот текст защищен адресом invitext.ru и оно встречается несколько раз. Если скопировать этот защищенный пост, то можно дать команду “удалить все invitext.ru” и текст останется без копирайта. Однако если в каждом абзаце встречается разные слова вида
In*vite*xt.ru
Invit_ext.ru
I*nvi.te.xt*.ru
и т.д.
то задача удаления этих маркеров становится сложнее. Решаемой, конечно, как и абсолютное большинство задач, но не с наскока. Даже ручная обработка текста (рерайт) занимает много времени.
Таким образом, мы получаем защищенный авторский текст, который при автоматической сборке и выкладке, а так же при простом копипасте, будет напичкан визуально различимой (потому что форматирование из п.1 пропадает) информацией о владельце текста. Или, даже если форматирование сохранено и маркеры незаметны, мы сможем задать поиск только по одному маркеру и сразу найти в интернете все копии нашего текста. Мне представляется это достаточно простым и эффективным методом защиты авторского контента на сайте.
Методика защиты контента названа invitext и предлагается для некомерческого использования всем желающим.
При использовании макроса для автоматической обработки и защиты текста вот такая ссылка на этот сайт ставится в конце исключительно по вашему желанию.
Для защиты контента по технологии INVITEXT нужно сделать три простые вещи:
1) скачать макрос и подробную инструкцию – этот способ подходит для тех, у кого сайт не на платформе WordPress
2) настроить ПО
3) добавить в файл стилей (обычно style.css) на своем сайте всего одну строку
Скачать: Макрос INVITEXT для MS Word 2003 (733)
Александр Хорошилов
Мой блог находят по следующим фразам
- защита текста от копирования
- плагин wordpress защищающий текст от копирования
- копирайт плагин для WordPress
- wordpress защита контента
- как поставить невидимый знак в word
- защита текста на сайте
22 комментариев
Подскажите, а в Opera не работает такой подход?
(Oper 10 – кажися не работает)
Работает, только в месте вставки копирайта образуется небольшой пропуск между словами, что не мешает восприятию текста. Дело в том, что Opera не позволяет по умолчанию показывать буквы меньше 6pt. Если у того, кто смотрит, в настройках поставить минимальный шрифт 1pt, то промежуток будет совсем маленький.
На самом деле проблема выреза по маске нисколько не решена. Мне не обязательно резать текст между span’ов, мне просто достаточно по маске спан и классом invitext вырезать как сами спаны, так и то что в них находится.
Но еще более простой метод – ведь все и так знают кто у кого что стырил – просто позаимствовать определении класса css и наслаждаться чтением/публикацией этого текста.
На самом деле проблема защиты интеллектуальной собственности нисколько не решена – от ручной переработка текста никто не застрахован. Эта защита может сыграть на авто-ГС, а это уже не мало.
А написать парсер с допусловиями, да еще если автор поменял что-то – это лишние затраты. Капчи тоже ломают…
Я так обрадовалась, когда нашла вашу технологии защиты текста от копипаста, и… очень огорчилась когда обнаружила, что в моей Опере это не работает. То есть я могу скачать любой Ваш текст, вставить его в Ворд, даже сразу в визуальный редактор своего блога, и… ничего, понимаете, никакого Вашего копирайта. То же самое в ЖЖ. Да, очень жаль.
Лека, здравствуйте.
Для блогосервисов эта методика не подходит – в них нельзя в полной мере использовать css.
В данный момент на сайте работает настройка, которая в любом случае показывает копирайт при копипасте. подробнее на странице настройки плагина http://invitext.ru/nastrojka-plagina-invitext/
C наступающим Вас! Пусть Ваши мечты сбудутся!
Попробуем так, спасибо!
Могу сказать что процесс автораспарсивания будет прост т.к. в языках программирования можно отменять трактовку служебных символов например * как спец символ.
Т.е. способов защиты своего контента на сегодняшний день не существует?
целиком и полностью – конечно нет. И не будет, т.к. то, что один человек построил, другой завсегда разломать сможет
(с) сами знаете.
Есть только механизмы, которые усложнят процедуру, точно так же, как и в автоугоне – неугоняемых охранных систем не существует.
[...] чем ставить его себе на блог, почитать о плагине можно здесь. Так же можно избавиться от злостных копировальщиков, [...]
[...] ворд 2003 удалить невидимый *in*vit*ext.ru текст [...]
[...] как защитить сайт от копирования браузером opera [...]
[...] способы защиты от парсинга капча [...]
[...] невидимый текст в Word [...]
[...] как защитить текст от копипаста в жж [...]
[...] защита контента против парсинга [...]
[...] парсер контента в Word [...]
Сергею, я защищаю особо ценный контент через депонирование – например http://deponate.ru (пытаюсь защищать) Возможнотси проверить еще не было, т.к. то что задепонированно пока не крали)
[...] защита от копирования текста wordpress [...]
А вот что-то новенькое… наткнулся на сайт http://nocopypaste.com обещают защищать текстовый контент и отдаваться ПС. У кого какие мнения на сей счет? p.s. Зарегистрировался там.. вроде все красиво, текст отдается на флеше но флэш зашифрован и разрабы божатся что текста в флеше нет… какой-то у них там технология. А ну и бесплатно это все
У кого какие есть мнения на сей счет?