Заметки

И снова антиплагиат

В последнее время студенческий плагиат перестаёт меня радовать.
Все, словно сговорившись, присылают работы, програнные через синонимайзер (программу, которая произвольно заменяет слова в тексте синонимами из своей базы).

Чисто технические ухищрения по обходу «Антиплагиата» система учится обнаруживать очень быстро. А вот синонимизированный текст машине распознать не то чтобы совсем невозможно, но очень непросто — это весьма ресурсоёмкая задача. Поэтому предупреждений в подобных ситуациях «Антиплагиат» не выдаёт.

Но человеческий глаз синонимические ухищрения замечает сразу — нужно только вчитаться в текст. Обилие не к месту использованной экспрессивной лексики (нейтральные синонинимы в сравнении с экспрессивными относительно редки), диковатые сочетания слов — как будто писал иноземец, нетвёрдо владеющий русским языком…

А тут неожиданно повезло нос к носу столкнуться с очередной инновацией в техниках формального обжуливания «Антиплагитата», тупой до безобразия, но столь же — до безобразия — эффективной.

Коллеге прислали ВКР с 14% оригинального текста. Она отписалв дипломнику: не пойдёт — переделывайте работу. Через несколько дней присылает «исправленный» вариант: текст буква в букву тот же, зато оригинальность фантастическим образом скакнула за 80%.
Вот она и попросила меня разобраться.

Открываю отчёт «Антиплагиата». Первые страницы густо-красно списанные — для отвода глаз: типичная, дескать студенческая поделка, в меру сплагиаченная вначале, но в целом — ты же ее будешь листать отчёт дальше первой страницы, дорогой препод? — в целом очень даже ничего себе.

А вот страницы с четвёртой-пятой отчёта, куда большинство преподов и впрямь никогда не заглядывает, начинаются чудеса: между буквами откуда ни возьмись повсплывали многочисленные вопросительные знаки, превращая хорошо знакомый «Антирлагиату» текст в хаотический набор символов.

Узнать рецепт изготовления анти-антиплагиатной пилюли после этого не составило труда: открываем вордовский исходник по месту первого же внедрённого вопроса и обнаруживаем: шрифт «Calibri», 5-й кегль, выкрашен для маскировки белым цветом, плюс двойное уплотнение межсимвольного интервала, чтобы убрать разрыв между соседними буквами.
То есть абсолютно ничего инновационного.

За одним маленьким «но»: алгоритмы «Антиплагиата», подмену и внедрение символов щёлкающие на раз, перед этими, с позволения сказать, вопросами современности неожиданно пасуют.

Так что одну копию этого текста — в блог, другую — разработчикам в «Антиплагиат».

Продолжайте совершенствовать свои методики, господа хитрюги! Эта очень скоро перестанет работать 😉