Мабуть, кожен користувач Інтернет стикався із CAPTCHA. Здавалось би — це простий малюночок, який висвічує код, відомий серверу. Ви його вказуєте, і тим підтверджуєте, що Ви не бот…
А чи знаєте Ви, що боту для аналізу CAPTCHA потрібно виконати лише кілька кроків
1) Забрати фонові шуми зображення (легке завдання)
2) Здійснити сегментацію, щоб в кожному сегменті був лиш один символ
3) Проаналізувати, який це символ (легке завдання)
Із цих завдань найважчим є друге — сегментація. Але сьогодні алгоритми досягли такого рівня, що і його виконують із великим відсотком влучності. Так, рік тому було зламано механізми захисту Google та Yahoo!, не кажучи про менш захищені сервіси.
Якщо алгоритм не здатен розпізнати вміст малюночка, це завдання передається людям. Люди розв'язують, що написано на малюночку, і висилають результат комп'ютеру. Орієнтовна вартість цього завдання становить близько цента за малюночок.
Якщо людина зіставила значення малюнка та сам малюнок для комп'ютерної системи, надалі якщо сервер повторно запитує Вас про код, і md5-хеш зображення уже має зіставлений код у базі даних, серверу відсилається правильна відповідь, і, відтак, можна задіювати автоматизовану реєстрацію, якщо база малюнків обмежена (як правило, вона обмежена).
Після обходу систем гігантів Google та Yahoo! вони перейшли на використання проекту Re-CAPTCHA. Цей проект застосовує слова із книг, які погано розпізнаються системами оптичного розпізнавання символів, викривлює їх, та видає користувачу.
Ви напевно зауважили, що Вам пропонують не одне слово, а два? А відповідь проста — одне слово це CAPTCHA, інше, оскільки, відтак, відомо, що Ви не робот — слово із одної із старих книг, котрі оцифровуються для Інтернет-бібліотек. І саме Ви допомагаєте розпізнати це слово. Якщо понад 4 людини однаково ідентифікували слово, інформація про це слово надсилається у центри оптичного розпізнавання та виправляє значення слова у текстах. Таким чином, завдяки нам з вами виконується важлива робота, а системи оптичного розпізнавання книг можуть виконати свою роботу із точністю понад 97%.
- +7
- 30 березня 2010, 22:42
- AnShLv
Сьогодні 19 листопада, а отже через місяць наші офіси пахнутимуть мандаринками, а більші ніж звичайно збіговиська людей біля кавових автоматів обговорюватимуть, що знайшли під подушками цієї ночі. Якщо ви ще не визначилися, що дарувати колезі-тестувальнику або чим з нагоди свята потішити себе — нижче є ідея.
(
Читати далі
)
- +4
- 19 листопада 2009, 10:30
- andriyr