Internetowe wsparcie programów OCR
Chyba każdy z użytkowników sieci internetowej natrafił kiedyś na rozwiązanie zwane „Captcha”. Zazwyczaj stosuje się je jako zabezpieczenie przed botami rozsyłającymi spam. Podczas rejestracji potencjalny użytkownik musi rozpoznać niewyraźny tekst po to aby udowodnić, że jest żywym człowiekiem a nie złośliwym oprogramowaniem.
Ciekawym pomysłem wykorzystującym tą technikę jest tzw. reCaptcha czyli wykorzystywanie aktywności użytkowników do odczytania tekstu z którym nie poradziły sobie programy OCR. Okazuje się bowiem, że podczas stosowania programów OCR często dochodzi do błędów i wypaczeń w odczytaniu tekstu, dlatego też wyniki pracy tego typu aplikacji nieustannie muszą weryfikować żywi ludzie. Opóźnia to proces digitalizacji książek i spowalnia rozwój wirtualnych bibliotek. Aby temu zaradzić postanowiono przeformułować test Captcha tak aby podczas jego wypełniana użytkownicy rozpoznawali wyrazy z którymi mają problemy programy OCR. W tym wypadku podczas testu wyświetlane są dwa słowa; pierwsze słowo jest rozpoznawane przez programy zaś drugie sprawi im problemy. Jeśli kilku użytkowników właściwie odczyta pierwsze słowa i w identyczny sposób zidentyfikuje drugie, przyjmuje się, że mało czytelne znaki mają właśnie takie znaczenie. Dzięki temu prostemu pomysłowi, każdego dnia setki tysięcy użytkowników nieświadomie bierze udział w procesie digitalizacji książek.
