Internetowe wsparcie programów OCR

Chyba każdy z użytkowników sieci internetowej natrafił kiedyś na rozwiązanie zwane „Captcha”. Zazwyczaj stosuje się je jako zabezpieczenie przed botami rozsyłającymi spam. Podczas rejestracji  potencjalny użytkownik musi rozpoznać niewyraźny tekst po to aby udowodnić, że jest żywym człowiekiem a nie złośliwym oprogramowaniem.

» Continue reading “Internetowe wsparcie programów OCR”

Dodaj komentarz

OCR – system optycznego rozpoznawania znaków

Skrót OCR w rozwinięciu oznacza Optical Character Recognition, czyli optyczne rozpoznawanie znaków. W rzeczywistości optyczne rozpoznawanie znaków oznacza skanowanie tekstu i obrazów z papierowych dokumentów i zapisywanie ich w postaci elektroniczne gotowej do prztwarzania przez komputer. Zatem system OCR pozwala na przeniesienie np. książki, czasopisma do komputera w postaci pliku, który dalej można edytować zwykłym edytorem tekstowym.

OCR samo w sobie nie jest technologią bezpośrednio ułatwiającą czytanie tekstów. Jednak dzięki OCR jesteśmy w stanie przenieść dokładną zawartość dokumentów papierowych do postaci elektronicznej co jest najtrudniejszym procesem. Każda obróbka dokumentów elektronicznych jest już prostsza. Przy zastosowaniu modułów Braille’a, lektorów lub komponentów do powiększania tekstów ludzie z problemami dotyczącymi wzroku są w stanie w pełni funkcjonować w pracy biurowej nad dokumentami.

Jest obecnie wielu dostawców systemów OCR na rynku. Wybór jest więc spory, ale rosną jednocześnie zagrożenia. Systemy OCR różnią się bowiem od siebie jakością i wydajnością. Przed zakupem OCR należy więc dokładnie dowiedzieć się jakie możliwości mają systemy OCR od poszczególnych dostawców. Na co w szczególności zwrócić uwagę? Oto kilka rzeczy:

  • dokładność skanowania
  • czy system obsługuje niskiej jakości wydruki
  • poziom elastyczności w zakresie obsługiwanych materiałów, rozmarów formatów
  • czy system oferuje automatyczne dostosowanie jakości, kontrastu i orientacji wydruku (pionowo i poziomo)
  • czy dostępna jest obsługa np. klawiatury Braille’a lub syntezator mowy
  • jaki jest poziom wsparcia technicznego

Dodaj komentarz

Zarządzanie dokumentami w trybie outsourcingowym

Z zarządzaniem dokumentów w trybie outsourcingowym wiążą się pewne zagrożenia, o których otwarcie mówią firmy outsourcingowe, które zajmują się skanowaniem, rejestracją i archiwizacją dokumentów. Tym zagrożeniem jest utrata dokumentów, która może wydażyć się na wiele różnych sposobów. Najczęstszym czynnikiem za to odpowiedzialnym jest czynnik ludzki, czyli np. pracownicy, którzy nie zwracają dokumentów lub niepoprawnie je oznaczają, co potem praktycznie uniemożliwia ich odnalezienie pomiędzy innymi papierami. W takim wypadku najlepszym rozwiązaniem jest konwertowanie treści dokumentów do postaci elektronicznej oraz outsourcing usług informatycznych związanych z dalszym zarzadzaniem dokumentami. W takiej postaci dokumenty są rejestrowane, czyli dokładnie etykietowane, a następnie archiwizowane w data center.

Skanowanie dokumentów oraz dokumentacja OCR jest obecnie wykorzystywana przez wiele firm, korzystających z kompleksowych usług zarządzania dokumentami. OCR jest systemem optycznego rozpoznawania znaków drukowanych. Jego wykorzystanie znacznie usprawnia konwersję dokumentów papierowych do wersji elektronicznych. Oczywiście nie bez powodu firmy decydują się na ten zabieg oraz późniejsze zarządzanie dokumentami w wersjach elektronicznych. Przynosi to znaczne oszczędności firmie oraz przekłada się na duży wzrost wydajności, ponieważ z oczywistych powodów o wiele łatwiej jest zarządzać dokumentami w postaci elektronicznej.

Kolejną istotną rzeczą związaną z digitalizacją dokumentów jest znaczna oszczędność przestrzeni biurowej. Różne badania wykazują, że aż 1/3 powierzchni biurowej w firmach jest przeznaczona na składowanie dokumentów papierowych. A należy pamiętać, że na koszty składowania takich dokumentów składają się nie tylko opłaty za miejsce ich przechowywania, ale i materiały do tego wykorzystanie, czyli tony papieru, ksero, drukarki.

Dodaj komentarz