В некоторых случаях капча может доставлять большое количество проблем. Особенно, это могут почувствовать всевозможные СЕО-специалисты, которым капча может очень сильно мешать. Зная такую потребность было создано немалое количество различных программных решений, которые позволяют обходить ввод капчи, что позволяет автоматизировать целый ряд процессов. Одним из самых популярных таких средств является программа zennoposter, которая пользуется немалой популярностью, как среди обычных пользователей интернета, так и в среде сеошников.
Что такое zennoposter?
Zennoposter представляет собой программный комплекс, который позволяет автоматизировать целый ряд процессов, которые совершаются при помощи браузера. То есть данная программа способна автоматически регистрировать аккаунты, заниматься постингом и выполнять многие другие действия , если ей задать для всего этого необходимые параметры.
Что позволяет делать zennoposter?
У этой программы очень серьёзный функционал, вот её основные возможности:
- автоматическая регистрация аккаунтов в социальных сетях, хостингах и других интернет-ресурсах.
- парсинг различных сайтов и поисковых систем.
- автоматическое создание и генерация профилей на форумах.
- автоматическое наполнение блогов и различных сайтов.
- автоматическая регистрация доменов.
- многопоточность.
- совершение действий анонимно, программа использует для этого прокси, соксы и другие решения.
- хорошее и понятно апи, которое открывает большие возможности перед разработчиками.
Таким образом, смотря на весь этот широкий функционал, можно сделать вывод, что zennoposter позволяет выполнять все те действия, которые обычно выполняет человек в окне браузера.
Zennoposter как программа для распознования и обхода капчи
Данную программу можно использовать для самых разных действий, например, при помощи неё можно автоматически наполнять блоги и форумы. Очень полезной функцией у неё, без сомнения, является распознавание капчи. Эта функция позволяет справиться с целым рядом проблем, при автоматизации тех или иных процессов.
Каким же образом происходит распознавание капчи в зеннопостере и как его можно организовать? Что касается организации процесса распознавании капчи, то существует несколько методов, каждый из которых имеет свои сильные стороны.
Одним из способов является распознавание капчи вручную, то есть делать это через специальные сервисы распознавания капчи, с которыми зеннопостер автоматически интегрирован.
Таким образом, в этом случае ничего не надо настраивать, необходимо только выбрать специальную функцию в программе. Также можно организовать распознавание капчи через написание собственного модуля её распознавания, программа предоставляет для этого все возможности, но для этого необходимо знать один из языков программирования, с которым работает данная программа.
Смотрите видео - Заработок на капче. Как заработать на вводе капчи:
Как использовать специальные сервисы для распознавания капчей в zennoposter?
Для тех, кто решил использовать для распознавания капчи специальные сервисы, необходимо совершить подключение этой возможности в программе.
Для того, чтобы это выполнить необходимо ввести логин и пароль от такого сервиса в настройках программы, помимо логина и пароля можно также ввести секреты ключ для использования функций сервиса, который есть у каждого зарегистрировавшегося пользователя.
Помимо этого, ещё необходимо выбрать модуль с которым будет работать программа в процессе распознавания капчи, сделать это всегда можно при помощи выпадаемого списка доступных модулей, который можно найти в настройках распознавания капчи.
Зеннопостер позволяет распознавать самые разные капчи и делает это очень успешно и быстро. Программа справляется со следующими видами капчей:
- капчи в виде картинки.
- текстовые капчи.
- математические капчи.
- флеш-капчи.
- капчи сделанные при помощи нескольких картинок
Кроме всех этих видов капчей, любой элемент веб-страницы можно представить как капчу и послать его после этого на специальный сервис распознавания капчи.
Для тех, кто работает с программой ZennoPoster, сервис РуКапча - это незаменимый помощник для автоматического разгадывания капч, особенно в шаблонах от ZennoArt.ru.
Если с разгадыванием простых капч все понятно, то с ReCaptcha от Google дела обстоят серьезней. Такие капчи эффективны и сервисы массово внедряют ее на свои страницы. Ещё очень интересно то, что гугл недавно выпустил Invisible ReCaptcha. Это такая же рекапча, но суть её в том, что она невидимая изначально, и если история IP и вообще хождений по интернету у вас есть, то вы ничего и не заметите. А если вы запустили пустой браузер на только что установленной операционке - вам скорее всего (но не всегда, если IP чистый у провайдера) нужно будет как и обычно отгадать рекапчу. Суть тут сводится к тому, что как раз таки нужно хранить историю и "гулять" по интернету ботами, чтобы не было проверок бот ты или нет. Тогда почти всегда формы будут сразу сабмитится, но определенное количество, т.к. если постоянно сабмитить инвизибл рекапчу, то она рано или поздно покажет окно, где нужно выбрать что-то. И вот как раз опять же от этого всего геморроя спасает рукапча, не нужно никаких "гуляний" по интернету - работники на сервисе всё сделают за вас. И за вменяемые деньги.
Еще полгода назад, распознавание reCaptcha на зеннпостере - являлось острой проблемой. Корректно работающего модуля для зенки попросту не было. Но время идет и на сегодня есть как минимум два актуальных способа разгадывания ReCaptcha , о которых стоит рассказать.
Первый способ: Встроенный модуль разгадывания recaptcha 2.
Как интегрировать при создании шабона:
1) В ProjectMaker переходим на вкладку "Старт" > Выбираем пункт "Настройки" > Выбираем раздел "Капчи" > вставляем api-ключ от Рукапчи (берем его на странице ) в соответствующее поле:
После добавления ключа - должен отобразится баланс в поле ниже, там должна показаться именно та сумма, что находится у вас на аккаунте. Если баланс не появился, то нужно проверить системный файл hosts, там могут остаться записи от CapMonster/XEvil, если вы его ранее запускали и там была включена "Эмуляция сервиса Рукапча"
2) Теперь можем вставить экшен распознования. На вкладке "Запись и отладка" добавляем действие "Распознать ReCaptcha2".
3) Настраиваем экшен:
- В модуле распознавания выбираем значение RuCaptcha.dll
- Прокси нужны с доступом по логину-паролю, если прокси будут с доступом только по айпи и айпи будет прописан тот, где крутится зенка, то не получится использовать такие прокси.
"Сейчас наша реализация такова, что рекапчу работник решает с одного IP, а проходите Вы её с иного IP. Теоритически гугл может это выследить и заблокировать Ваш IP, через который Вы работаете. Поэтому желательно вместе с капчей отправлять нам адрес прокси, через который работник загрузит капчу. Наши работники подключаются к Вашем прокси через наш промежуточный сервер и не видят авторизационные данные от Ваших прокси. "
Поэтому активируем галочку "Использовать прокси проекта".
- Далее нам нужно указать, как будет находится сам модуль рекапчи на странице. Если проект несложный, то спокойно ставим параметр "Во вкладке".
Но бывают случаи, когда нужно прописать алгоритм парсинга SiteKey вручную (как это сделать, читайте в мануале:). Для этого меняем значение на "Через SiteKey", парсим нужные параметры и вставляем через переменные в поля:
Не забываем указать в свойствах действий переменную, в которую будет записываться результат разгадывания рекапчи. И на этом настройка для первого способа завершена.
Второй способ: ReCaptchaGnizer - бесплатный шаблон для решения Google ReCAPTCHA2 со 100% результатом.
Решение идет в виде отдельного шаблона, который с легкостью встраивается через связку "Проект-в-Проекте". Что умеет данный модуль:
- Разгадывание ReCaptcha через барузер;
- Разгадывание ReCaptcha с автосабмитом (отправка рекапчи в форме без кнопки "Отправить");
- Разгадывание ReCaptcha без использования браузера на GET/POST шаблонах;
Преимущества:
- Решение прекрасно работает с сервисом RuCaptcha, так же ведется разработка для англоязычного сегмента 2captcha.com .
- Шаблон полностью написан на C#, поэтому он гарантирует высокую скорость работы и работоспособность на большинстве версий ZennoPoster.
- Обработка всех ошибок (валидация данных/ответы сервисов распознавания). Официальный кубик разгадывания ReCaptcha может выдать какую-то ошибку, по которой трудно понять, что исправлять. В этом шаблоне все ошибки прописаны человеческим языком и в абсолютно любой ситуации можно посмотреть в лог и определить проблему.
- Сделан подсчёт времени решения рекапчи.
- Возможно получение прокси текущего инстанса (в каждом тестовом шаблоне прилагается кубик для этого).
- Шаблон умеет парсить sitekey 3 различными способами, т.к. на разных сайтах он задается по-разному.
- Если вдруг на текущей странице нет рекапчи (например, сдох прокси), то шаблон оповестит об этом.
- Возможность встроить для проекта на ZennoBox;
Как использовать:
- Прописать API-ключи к RuCaptcha в настройках ZennoPoster
- Добавить кубик "Проект в проекте" и выбрать шаблон "ReCaptchaGnizer.xmlz"
- Сделать "сабмит" (отправку) формы, т.к. на разных сайтах это происходит по-разному, из-за чего это НЕ реализовано в данном шаблоне.
В случае, если что-то пойдет не так - шаблон выдаст ошибку с детальным описанием.
Можно протестировать!
Чтобы лучше понять, как работает данный метод, автор приложил тестовые шаблоны к основному проекту. Можно наглядно узнать:
- Как работает браузерный шаблон разгадывания ReCaptcha (test_project.xmlz);
- Как работает разгадывание ReCaptcha с автосабмитом (test_project_autosubmit.xmlz);
- Как работает разгадывание ReCaptcha на GET/POST запросах (test_project_GETandPOST.xmlz);
Что еще нужно знать о ReCaptcha?
Примечание от Lord_Alfred:
У рекапчи есть настройки защиты от простых до сложных (3 градации), и нам не известно какие настройки выбраны на сайте, поэтому иногда получается так, что на рукапче какая-то из капч решается очень долго или вообще бывает, что в итоге выходит не решившись - это очень часто из-за двух причин:
а) сервис может быть загружен
б) у сайта стоят максимальные настройки защиты
в) у текущего работника на рукапче не выполнен вход в gmail-аккаунт в их программе или он очень часто решал до этого рекапчу, поэтому у него всё усложнилось (в случае если один работник не сможет решить рекапчу и пропустит её - сервис сам тут же передаст решение другому работнику)
Если первое ещё можно как-то обойти (дождаться, когда нагрузка спадет), то со вторым - никак не справится и не узнать наверняка.
РуКапча опубликовали график текущей скорости распознания (Распознание \ статистика сервиса \ среднее время распознания). И если оно у вас выше - вам не повезло, у вас капчи повышенной сложности. Если у вас ниже - повезло, у вас простые.
Но потаённый смысл ReCaptcha - это хитрость на уровне искусственного интеллекта. Она следит за тем сколько ты решил до этого капч, поэтому работникам иногда приходится на сайте с простой рекапчей разгадывать её подолгу, т.к. они уже "запачкали" свою историю и хитрый гугл за место простой рекапчи начинает подсовывать им посложнее. Нам тут ничего не сделать и не обхитрить его, но если бы мы решали рекапчу сами (кликали мышкой сами или делали это через капмонстр) - у нас было бы ОЧЕНЬ много проблем из-за этого. По ощущениям и субъективному мнению - гугл больше всего смотрит на "историю" IP, которую он хранит у себя. Если использовать бесплатные прокси или прокси, которыми пользуются множество людей (платные пакетные прокси), то очень часто попадаются ситуации, что даже если пробовать решить ReCaptcha руками в ProjectMaker, то гугл будет подсовывать всё новые и новые картинки и так может продолжаться раз 10-15, пока он точно не удостоверится, что это не бот.
Для того, чтобы решать рекапчу через CapMonster - нужны приватные прокси, которыми пользуетесь только вы и ранее ими или не пользовались для этих целей или хотя бы не "убили" их. Такие найти не просто, стоят они от 50р / 1 шт. в месяц, что крайне дорого, если нужно покупать по 1000 штук (чтобы хоть как-то разнообразить их при работе с каким-то сайтом). К тому же, прокси - это не единственная проблема, их, к сожалению, очень много: нужно на каждой прокси иметь по залогиненному аккаунту гугла с историей просмотров обычных сайтов и с использованием сервисов от гугла, чтобы ReCaptcha решалась или кликом на галочку или выдавала очень простые варианты. Нужно иметь "хороший" для гугла UserAgent, причем не просто иметь его, а по максимуму сэмулировать похожесть на него: прописать BuildID, эмулировать в разных профилях различные наборы браузерных плагинов, mime-типов, часовые пояса чтобы были именно для того прокси, который используется, да и кучу других параметров, про которые достоверно никому не известно (разве что гугл знает что именно он смотрит). Вообщем, если коротко - это страшная головная боль, причем гугл каждый месяц закручивает гайки всё сильнее. А рукапча спасает от этого всего: за каких-то 16 копеек вам решат рекапчу без таких сложных заморочек и исследований "что ещё нужно сэмулировать, чтобы выглядеть как реальный пользователь, а не ZennoPoster".
Встречаются сайты, где рекапча подргужается хитрым образом и эти способы не могут отправить форму или бывают какие-то дополнительные способы валидации на сайте, которые прикручены в рекапчу. Например, рекапча позволяет добавить вызов функции по событию, когда она решена - там можно добавить заполнение какого-то скрытого поля в форме, и при дальнейшей валидации - оно будет проверяться. Если решать рекапчу с помощью этих способов, что выше - то там ответ от рекапчи просто вставляется в поле у неё, а событие это не вызывается (если не прикручен автосабмит и если он сработает). Если автосабмит не сработал или нет возможности его выполнить, то проще всего отсниффать отправляемый запрос и сэмулировать отправку через Get/Post режим (у ReCaptchaGnizer есть тестовый проект, в котором можно посмотреть как это делать).
В общем, ReCaptcha хоть и сложная преграда для автоматизации. Но все обходится и все решаемо. А сервис РуКапча помогает нам в этом.
Распознавание каптчи в программе можно организовать несколькими способами - вручную, через сервисы ручного распознавания, либо написать свой модуль распознавания каптч и распознавать через него.
Если вы хотите использовать сервисы распознавания, вам необходимо в настройках программы ввести ваши логин-пароль, или ключ для доступа к сервису в специально отведенные поля. Также в параметрах действия распознавания каптчи нужно выбрать модуль распознавания, с которым будет работать проект. Выделите в вашем проекте такое действие, и откройте его свойства (двойным кликом). В открывшемся окне из выпадающего списка выберите нужный модуль.
Если требуется, на вкладке «дополнительно» укажите его параметры (чаще всего параметров нет). Параметры уточняйте на сайтах сервисов. Параметры нужны тогда, когда, например, у вас математическая каптча, т.е. нужно ввести не 7+5 , а сумму 12, еще это касается рекаптчи или каптч с цифрами, также, когда каптча регистрозависимая, тоже нужно это указывать в параметрах.
Бывает, что каптча состоит из нескольких картинок, тогда их можно объединить, чтобы не тратиться на распознавание отдельных частей. Для объединения каптч, если вы не объединили их при записи шаблона, нужно в окне свойств элемента каптчи установить флаг «Склеивать каптчи» и у последней каптчи, которую нужно склеить, установить флаг «Последняя каптча».
Текстовые каптчи
Довольно часто, особенно на слабозащищенных ресурсах, встречается текстовая каптча. Отличается она от простой (графической) каптчи тем, что не нарисована на картинке, а просто написана текстом. Такую каптчу, отсылать, в принципе, никуда не нужно, ее можно взять (выпарсить) прямо из текста страницы. Чтобы выпарсить каптчу из текста страницы нужно взять текст страницы с помощью действия «Данные» из категории «Вкладки», выбрать текст страницы и, отметив «парсить результат», в параметры вписать регулярное выражение для парсинга страницы.
Математические каптчи
Также встречается математическая текстовая каптча. Эта та же текстовая каптча, только на ней обычно пишут математическое выражение типа 58+63. Можно превратить этот текст в картинку и отправить на распознавание, а можно использовать JavaScript. Для решения каптчи можно использовать действие «JavaScript» из категории «Свой код». В поле для кода можно вставить ссылку на переменную, в которой содержится выпарсенное выражение, например 58+63 и после выполнения действие вернет результат 121.
Flash каптча и каптча из любого другого элемента
Если вам встретится flash каптча, ее можно превратить (отрендерить) в обычную картинку и также отправить на распознавание. Найдите этот элемент в дереве элементов, правой кнопкой мыши вызовите меню для выбора действий над этим элементом. Выберите там пункт «Это каптча»… все!
Как обрабатывать ошибки распознавания CAPTCHA