Chyba wszyscy czytelnicy bloga mieli do czynienia z CAPTCHA, choć zapewnie niektórzy nie zdają sobie z tego sprawy. CAPTCHA, czyli Completely Automated Public Turing test to tell Computers and Humans Apart, to z reguły obrazki z zakodowanymi w nich literami i cyframi, które należy odczytać i wpisać do formularza. Celem tych obrazków jest odróżnienie ludzi od maszyn, w tym przypadku głównie spamujących botów.

CAPTCHA chronią fora internetowe przed spamującymi botami, usługi kont pocztowych przed zakładaniem przez boty kont wykorzystywanych do nielegalnej działalności, i tak dalej. Już po tym zdaniu, powinno się nasunąć spostrzeżenie, że powstała cała gałąź przemysłu zajmująca się neutralizowaniem CAPTCHA.

Problem polega na tym, że twórcy CAPTCHA mają istotną przewagę a tworzenie trudniejszych CAPTCHA jest łatwiejsze niż tworzenie algorytmów zdolnych dokonywać skomplikowanej analizy wizualnej obrazków. W tej dziedzinie, przynajmniej na razie, ludzkie oko i mózg góruje nad maszynami.

W tym miejscu pojawia się wolny rynek, globalizacja, obniżenie kosztów transmisji danych oraz państwa z bardzo dużymi zasobami bardzo taniej siły roboczej. Część czytelników już pewnie domyśla – istnieją firmy zatrudniające osoby, których zadaniem jest odczytywanie CAPTCHA, w trybie rzeczywistym. Wygląda to tak: spamujący bot napotyka na CAPTCHA, którego nie potrafi rozgryźć, wysyła zapytanie do dostawcy usługi. Na komputerze pracownika wyspecjalizowanej firmy pojawia się obrazek i formularz do wpisania odpowiedzi. Odpowiedź trafia do bota, który ją wykorzystuje.

Ile wynosi koszt takiej usługi? Na poziomie pracownika jest to obecnie około 0,75$ za 1000  CAPTCHA, choć jeszcze w 2006 roku rozwiązanie 1000 CAPTCHA przynosiło około $10. Rynek jest więc bardzo konkurencyjny. Warto jednak podkreślić, że skoro są to zarobki pracownika to koszt dla spamera jest zapewne o kilkadziesiąt procent wyższy – trzeba przecież pokryć koszty stanowiska pracy i marzę usługodawcy.

Autorzy analizy sektora CAPTCHA (omówienie badań) podają, że rozwiązanie 1000 CAPTCHA kosztuje zleceniodawcę od $1 do $2. Fakt, że spamerzy gotowi są płacić za rozwiązywanie CAPTCHA przekonuje, ze CAPTCHA chronią realne dobro ekonomiczne, którym jest potencjalna ekspozycja na materiał reklamowy.

Autorzy badań przetestowali sektor neutralizujący CAPTCHA i stwierdzili, że z wyjątkiem jednego serwisu, od 86% do 89% rozwiązań było poprawnych, co jest dla autora tego tekstu wynikiem wyśmienitym z uwagi na fakt, że sam osiąga zbliżone rezultaty. Imponujący był także czas reakcji, jego mediana dla badanej grupy wyniosła 14 sekund. Jak duży jest to biznes? Autorzy szacują, ze lider branży może zatrudniać od 400 do 500 pracowników i posiada zdolność przerobową od 27 do 41 CAPTCHA na sekundę. Zdolności przerobowe całego sektora można szacować na 1 000 000 CAPTCHA dziennie. Przy cenie $1 za 1000  CAPTCHA tworzyłoby to rynek wart 0,35 mln USD rocznie.

W gruncie rzeczy, CAPTCHA przestały być technologiczną zaporą dla spamerów – stały się przeszkodą ekonomiczną. Stanowią po prostu dodatkowe koszty i tak długo jak utrudniają spamerom ‘wyjście na zero’ tak długo są skuteczne. Okazuje się jednak, że na przykład w przypadku zakładania ‘spamujących’ kont pocztowych wystarczy by jedno konto zdołało wysłać 100 wiadomości by zwróciły się koszty usługi neutralizującej CAPTCHA (jeden spam farmaceutyczny zarabia około $0,00001). To oznaczać może pojawienie się zapór następnej generacji.

Ukłony: Marginal Revolution