Мы все работаем на Google: правда о reCAPTCHA

Содержание:

  1. История капчи
    1. А как reCAPTCHA понимает, что я ввел правильный текст для оцифровки текста?
    2. Почему reCAPTCHA просит написать 2 слова, а не 1 или 3?

Компьютерный тест ка́пча просит распознать сложно читаемые буквы, поставить галочку, выбрать картинки. Все это с целью отличить ботов от людей и защитить сайты от вредоносных атак. А вы задумывались, откуда капча берет слова и картинки?

История капчи

Систему CAPTCHA разработали в начале нулевых в Университете Карнеги, США. Луис фон Ан и его команда предложили капчу, как программу, которая отфильтрует спам-ботов при регистрации на сайтах. Тогда она была в виде искаженного текста.

Со временем капча преобразовывалась, вот основные этапы:

  1. Искаженный текст на картинке
  2. Чтобы перевод изображения в текст нес дополнительную пользу, в качестве капчи используют архивы «The New York Times». Таким образом, пользователи оцифровывают номера газеты, а именно фрагменты плохого качества, которые не может разобрать компьютер (система получает имя reCAPTCHA).
  3. В 2009 году сервис покупает компания Google. К газетам добавляются старые книги.
  4. Google использует в качестве рекапчи фотографии со своих же сервисов: Google Maps и Google Street View. На 3D-картах миллионы домов, машин, указателей, деревьев и прочего, что становится объектом для распознавания капчи. Однако такой способ защиты боты обходят с высокой вероятностью.
  5. В 2015 году введена система, которая просто предлагает «щелкнуть» на галочку рядом с надписью «Я не робот». Важен не сколько факт нажатия, а то, как пользователь ведет себя на сервисе до этого действия. Если система сомневается в его человечности, то предлагает дополнительное задание. Например, поле из 9 разных картинок: «Выберете изображения, на которых есть деревья».

А как reCAPTCHA понимает, что я ввел правильный текст для оцифровки текста?

Вы не единственный в этом задании. Один и тот же фрагмент книги с плохо читаемым словом система предложит тысячам людей. Наиболее частый вариант ответа — верный.

Почему reCAPTCHA просит написать 2 слова, а не 1 или 3?

Из двух отсканированных слов, которые вы видите, одно система знает наверняка: оно служит для проверки вашей причастности к миру людей. В правильности второго слова reCAPTCHA еще сомневается: оно — ваш вклад в распознавание текстов.

НАВЕРХ