ReCaptcha был взломан / взломан / OCR'd / победил / сломан?

Были ли использованы какие-либо методы программирования для победы над reCAPTCHA?

Я заинтересован в том, чтобы увидеть свидетельства и потенциальные демонстрации того, что reCAPTCHA, в частности, устарела с помощью полностью автоматизированных, безгражданских методов.

Для того, чтобы уточнить, не ищу рекапчи-обжуливая решения, которые включают человек в любом случае, будь то задачу команды с заполнением из CAPCHAs, порно убежища или Mechanical Turk.

Я также не ищу альтернатив reCAPTCHA, таких как выбор типа животного, фоновых полей или хитрости javascript.

14 ответов

Решение

Я замечаю, что почти все ответы здесь относятся к неэффективности концепции CAPTCHA, в принципе - и хотя я с ними очень согласен, на самом деле несколько месяцев назад выступил в OWASP с объяснением, объясняя только это - вопрос очень специфический так что обеспечу демонстрацию.
Но сначала я повторю эту демонстрацию в стороне, перечитайте другие комментарии, поскольку это правда, что CAPTCHA бессмысленна и не полезна, не имеет отношения к реализации....

Но на самом деле, проверьте CAPTCHA Killer. Вы можете загрузить изображение CAPTCHA, и оно автоматически, если не сразу, предоставит ответ OCR. Это также обеспечивает API (REST, я думаю, но, возможно, также SOAP). Я лично пробовал множество изображений reCAPTCHA, и это было на самом деле одни из самых простых (или, по крайней мере, самых быстрых) сломанных.

ОБНОВЛЕНИЕ: веб-сайт CAPTCHA Killer теперь закрыт, по-видимому, под юридическим давлением. Смотрите http://captcha.org/ для полного обзора темы.

И да, OCR - не лучший способ взломать защищенный сайт CAPTCHA - есть много других лучших способов.

Возможно, вас заинтересует этот подробный отчет о том, как 4chan победил reCAPTCHA и использовал его для манипулирования ежегодными результатами Time.com 100 Poll.

Взлом Recaptcha (он же "Поток пениса")

Следующая используемая тактика состояла в том, чтобы увидеть, могут ли они найти изъян в реализации reCAPTCHA. Одна вещь, которую они обнаружили в reCAPTCHA, заключалась в том, что он всегда представляет пользователю два слова для декодирования: одно слово - это контрольное слово, известное системе reCAPTCHA, а другое - неизвестное слово (reCAPTCHA использует людей для исправления ошибок распознавания). Википедия описывает процесс: "Отсканированный текст подвергается анализу с помощью двух разных программ оптического распознавания символов; в случаях, когда программы не согласны, сомнительное слово преобразуется в капчу. Слово отображается вместе с уже известным контрольным словом и помечено человеком. Те слова, которым последовательно присваивается единый ярлык судьями-людьми, превращаются в контрольные слова ". 2iasdo4 Anonymous осознали, что если они всегда маркируют неизвестный отсканированный текст одним и тем же словом - и если они делают это тысячи и тысячи раз, в конечном итоге большой процент неизвестных слов будет помечен их словом. Все, что им нужно было сделать, это взглянуть на два слова в капче, ввести правильную метку для "легкого" (предположительно это будет тот, с которым согласятся два оптических сканера) и ввести слово "пенис" для тяжелый Если бы они делали это достаточно часто, то вскоре значительный процент изображений был бы помечен как "пенис", и способность к автоматическому голосованию была бы восстановлена ​​(один побочный эффект, который не был утерян на Anonymous, был понятием, что на долгие годы по всему тексту будет случайным образом вставлено несколько цифровых книг со словом "пенис". Обновление: я спросил Бена Маурера, главного инженера reCAPTCHA, об этой атаке "наводнения пениса", Бен сказал, что они ожидали такого рода атаки и они имеют многочисленные средства защиты, которые будут препятствовать проникновению пениса через барьер reCAPTCHA.

Оптимизация reCAPTCHA

Так же, как и идея разбрызгивать слово "пенис" в текстах, команда Anonymous знала, что время идет, и если они собирались восстановить Сообщение, у них не было времени ждать, когда автопоставщики вернутся в сеть - им предстояло голосовать вручную много-много раз. И поэтому им нужно было вводить капчи так быстро, как только могли. Они разработали набор рекомендаций, которые позволили им быстро решить, какие слова reCAPTCHA они могут пропустить. Например:

Вам дадут 2 слова: 1 реальное, 1 фальшивое.

За [REAL FAKE] или же [FAKE REAL]Вы можете просто ввести REAL и это должно быть принято.

Если это [LOOKSREAL LOOKSREAL] или же [LOOKSFAKE LOOKSFAKE]обычно просто быстрее набрать оба слова. Не тратьте драгоценное время, решая, какой из них настоящий.

Используйте как внешний вид, так и тип слова, чтобы определить поддельное слово. Не полагайтесь только на один из них.

Весь набор правил здесь: поддельная капча.

Слабость систем CAPTCHA заключается в том, что люди создают комнаты, заполненные людьми в Китае, единственной задачей которых является просмотр изображения CAPTCHA и ввод результата, который подключается к автоматизированной системе, которая фактически выполняет рассылку спама.

Не так много, что вы можете сделать с этим на самом деле.

Это также намного дешевле, чем попытка распознавания изображения, распознавания текста и т. Д. На реальном изображении (в противном случае вы можете получить ответ менее чем за 0,01 доллара США).

Прежде чем поддаваться давлению использования капчи, рассмотрите творческие обходные пути, такие как наличие поля с пометкой "Ваши комментарии", которое скрыто CSS. Если поле введено, запрос отбрасывается сервером. Большинство ботов попадутся на это, даже если все еще нет хорошего способа победить комнату, полную неоплачиваемых рабочих, с которой капча не помогает в любом случае.

ОБНОВЛЕНИЕ: просто прочитайте пример, в котором удаление CAPTCHA увеличило коэффициент конверсии почти на 10%. Это указывало бы на то, что это довольно плохо, если вы теряете 10% своих лидов только для того, чтобы отфильтровать ботов. Представьте себе, что 10% означает для большинства предприятий.

Моя любимая капча от Microsoft: http://research.microsoft.com/en-us/um/redmond/projects/asirra/

Asirra (Распознавание изображений видов животных для ограничения доступа) - это HIP, который работает, предлагая пользователям идентифицировать фотографии кошек и собак. Эта задача трудна для компьютеров, но наши исследования показали, что люди могут выполнить ее быстро и точно. Многие даже думают, что это весело!

Это бесплатный сервис, и у них есть пример кода, чтобы вы начали.

Интересно, сколько времени пройдет, пока он не взломан.

ReCAPTACHA не сломан и не будет в течение очень долгого времени. Дело в том, что если вы внедрите свою собственную капчу, если она сломана, вероятно, потребуется много времени, чтобы это исправить.

Это взято со страницы о безопасности reCAPTCHA:

reCAPTCHA - это веб-сервис. Это означает, что все изображения создаются и оцениваются нашими серверами. (…) Это также обеспечивает дополнительный уровень защиты: наши CAPTCHA могут автоматически обновляться при обнаружении уязвимости безопасности.

Например, если кто-то напишет программу, которая может читать наши искаженные изображения, мы можем добавить больше искажений за очень короткое время, и веб-мастерам не придется ничего менять на их стороне.

Я считаю, что, поскольку они специализируются на капчах, у них есть улучшенные сохраненные версии, готовые к развертыванию за короткое время, если это необходимо. (Почему они должны создавать более сильную безопасность, когда слабый еще не сломлен?)

Он не только побежден, но и над ним успешно построено полезное приложение, которое стало самым удивительным инструментом для защиты от всех видов защиты от бесплатных аккаунтов большого списка сайтов с прямой загрузкой (не только megaupload и rapidshare).).

Jdownloader является открытым исходным кодом и написан на Java, поэтому взгляд на исходный код может ответить не только, если он сломан, но и как.

Изменить: Большинство сайтов прямой загрузки не используют reCaptcha, но более простой метод Captcha (3 заглавные буквы окрашены в разные цвета). Тем не менее, Jdownloader и Cryptload (программа, похожая на Jdownloader) являются единственными известными мне работающими реализациями, которые эффективно нарушили метод Captcha. Я не слышал ни о какой реализации взломать reCaptcha.

Обновление: Кажется, что по крайней мере одна реализация reCaptcha (не вся reCaptcha сама) была взломана тоже.

Обновление от декабря 2010: Jdownloader, похоже, наконец-то побеждает reCaptcha. Плагин все еще является экспериментальным и работает только на версиях Jdownloader для Windows, но, как мне сказал товарищ, который попробовал его, он работает.

  • "Фактически, это [reCAPTCHA] стало довольно бесполезным 4 января [2011], когда спаммеры, очевидно, получили в свои руки программное обеспечение, которое обходит reCAPTCHA и позволяет полностью автоматизировать процесс регистрации. Боты были заняты, действительно очень заняты с тех пор " [1]

2-3 года назад подход, основанный на типизированном тексте с использованием капч, нарушил черту, когда они проиграли битву, то есть дальнейшие осложнения лишь делают их относительно (так как компьютерная мощь растет, а человек нет) легче для машин и более отвратительными и отталкивающими, если нет совершенно невозможно для людей. Это противоречит исходной парадигме CAPTCHA в качестве теста, чтобы гарантировать, что ответ не генерируется компьютером

Обновить:
Обратите внимание, что reCAPTCHA принадлежит Google Inc., но Google Inc. не использует его в своих собственных службах.
Вот ссылка на веб-страницу с капчей, используемой самим Google / для внутренних целей, например, для регистрации в Gmail:

альтернативный текст



Обратите внимание, что в Google reCAPTCHA всегда есть 2 слова.
Вот ссылка на изображение с reCAPTCHA от Google, предложенное для использования другими.

И скриншот reCAPTCHA:

альтернативный текст

Я оставляю очевидные выводы для читателя.

Цитируется: [ 1 ]
форумы vBulletin пострадали от спам-бота reCAPTCHA | Блог PC Pro
Опубликовано 12 января 2011 года Дэйви Уиндером

В прошлом году на Defcon была речь, в которой обсуждались проблемы с CAPTCHA в целом. Одна из вещей, которые они сделали, - это использование нескольких бесплатных механизмов распознавания текста, чтобы они голосовали за лучшие слова. Делая это, они смогли добиться несколько приличных шансов на успех. Для одного вида это было около 40%, но я не думаю, что это была reCaptcha.

Я вижу комментарии блога в системе, защищенной reCAPTCHA, где страница загружается, и через 1 секунду сообщение было успешно сделано. User-Agent был ерундой (в данном конкретном случае он утверждал, что работает под управлением Ubuntu 9.25/Firefox 3.8), реферер был с совершенно не связанного сайта без ссылки на нас.

Это явно автоматизировано.

Самый простой способ победить капчу - это Amazon Mechanical Turk. Есть парень по имени Кермит Уэлда, который платит людям по никелю за регистрацию учетных записей Hotmail, AOL и Gmail. Это 6000 фальшивых почтовых аккаунтов по 5 центов = 300 долларов в день. Стоимость ведения бизнеса довольно дешевая, если другие люди делают за вас грязную работу. Неудивительно, что спам-фильтры нашего сервера хотят отклонить что-либо из Hotmail.

reCAPTCHA не был побежден. Если это так, то почему Google просто купила его и объявила, что будет применять технологию в Google для повышения защиты от мошенничества и спама для продуктов Google?

от Google Приобретает reCAPTCHA, опубликованную в блоге Google 16.09.09:

Таким образом, уникальная технология reCAPTCHA улучшает процесс преобразования отсканированных изображений в простой текст, известный как оптическое распознавание символов (OCR). Эта технология также поддерживает масштабные проекты сканирования текста, такие как Google Книги и Поиск по архиву новостей Google. Наличие текстовой версии документов важно, потому что простой текст можно искать, легко отображать на мобильных устройствах и отображать для слабовидящих пользователей. Таким образом, мы будем применять эту технологию в Google не только для повышения защиты от продуктов Google от мошенничества и спама, но и для улучшения процесса сканирования книг и газет.

AFAIK На практике не существует инструмента для взлома реализации RE-капчи, однако в конечном итоге я предполагаю, что кто-то получит его.

Забавно, что если кому-то удастся заполучить его, тогда весь проект RE-captcha не имеет смысла, потому что re-captcha разработал оцифровку книг, что невозможно сделать автоматически.

Кстати:

Слабость систем CAPTCHA заключается в том, что люди создают комнаты, заполненные людьми в Китае, единственной задачей которых является просмотр изображения CAPTCHA и ввод результата, который подключается к автоматизированной системе, которая фактически выполняет рассылку спама.

Вы не можете защитить систему, думая так, это все равно что сказать: "Ваше веб-приложение недостаточно защищено, если ваш хост не находится в старом военном бункере, потому что теперь люди могут украсть вашу машину".

Есть много методов, которые используются для обмана recaptcha. В то время как трудно использовать программы с поддержкой нейронной сети для автоматического их решения, можно получить изображение и использовать механический турник Amazon или какую-то эквивалентную программу для их решения.

http://codemagician.wordpress.com/2010/01/22/solving-recaptcha/

Другие вопросы по тегам