Internetowe wsparcie programów OCR

Chyba każdy z użytkowników sieci internetowej natrafił kiedyś na rozwiązanie zwane „Captcha”. Zazwyczaj stosuje się je jako zabezpieczenie przed botami rozsyłającymi spam. Podczas rejestracji  potencjalny użytkownik musi rozpoznać niewyraźny tekst po to aby udowodnić, że jest żywym człowiekiem a nie złośliwym oprogramowaniem.

Ciekawym pomysłem wykorzystującym tą technikę jest tzw. reCaptcha czyli wykorzystywanie aktywności użytkowników do odczytania tekstu z którym nie poradziły sobie programy OCR. Okazuje się bowiem, że podczas stosowania programów OCR często dochodzi do błędów i wypaczeń w odczytaniu tekstu, dlatego też wyniki pracy tego typu aplikacji nieustannie muszą weryfikować żywi ludzie. Opóźnia to proces  digitalizacji książek i spowalnia rozwój wirtualnych bibliotek. Aby temu zaradzić postanowiono przeformułować test Captcha tak aby podczas jego wypełniana użytkownicy rozpoznawali wyrazy z którymi mają problemy programy OCR. W tym wypadku podczas testu wyświetlane są dwa słowa; pierwsze  słowo jest rozpoznawane przez programy zaś drugie sprawi im problemy.  Jeśli kilku użytkowników właściwie odczyta pierwsze słowa i w identyczny sposób zidentyfikuje drugie, przyjmuje się, że mało czytelne znaki mają właśnie takie znaczenie. Dzięki temu prostemu pomysłowi, każdego dnia setki tysięcy użytkowników nieświadomie bierze udział w procesie digitalizacji książek.

Możliwość komentowania jest wyłączona.

-->