Co to jest optyczne rozpoznawanie znaków (OCR)?

Optyczne rozpoznawanie znaków (OCR) odnosi się do oprogramowania, które tworzy cyfrową wersję drukowanego, pisanego lub odręcznego dokumentu, który komputery mogą odczytać bez konieczności ręcznego wpisywania lub wprowadzania tekstu. OCR jest zwykle używany na zeskanowanych dokumentach w formacie PDF, ale może również tworzyć czytelną komputerowo wersję tekstu w pliku obrazu.

Co to jest OCR?

OCR, określane również jako rozpoznawanie tekstu, to technologia oprogramowania, która przekształca znaki takie jak cyfry, litery i znaki interpunkcyjne (zwane również glifami) z wydrukowanych lub zapisanych dokumentów w postaci elektronicznej, łatwiej rozpoznawanej i odczytywanej przez komputery i inne programy. Niektóre programy OCR robią to, gdy dokument jest skanowany lub fotografowany aparatem cyfrowym, a inne mogą zastosować ten proces do dokumentów, które zostały wcześniej zeskanowane lub sfotografowane bez OCR. OCR pozwala użytkownikom wyszukiwać dokumenty PDF, edytować tekst i ponownie formatować dokumenty.

Do czego służy OCR?

Do szybkiego, codziennego skanowania potrzeb, OCR może nie być wielkim problemem. Jeśli wykonujesz wiele operacji skanowania, wyszukiwanie w plikach PDF w celu znalezienia dokładnie tego, czego potrzebujesz, może zaoszczędzić sporo czasu i sprawić, że funkcja OCR w twoim programie skanera będzie ważniejsza. Oto kilka innych rzeczy, z którymi pomaga OCR:

Zautomatyzowane przetwarzanie danych i wprowadzanie danych (Przykład: systemy śledzenia kandydatów do pracy dla życiorysów)
Możliwość przeszukiwania zeskanowanych książek
Konwertowanie odręcznych skanów na tekst czytelny dla komputera
Udostępnianie dokumentów przez programy do czytania, które pomagają użytkownikom niedowidzącym
Zachowywanie dokumentów historycznych i gazet, a jednocześnie możliwość ich wyszukiwania
Ekstrakcja danych i transfer do programów księgowych (przykład: paragony i faktury)
Indeksowanie dokumentów do wykorzystania przez wyszukiwarki
Rozpoznanie tablic rejestracyjnych kierowcy za pomocą fotoradaru i oprogramowania kamery z czerwonym światłem
Syntezatory mowy dla osób, które nie potrafią mówić - fizyk teoretyczny, Stephen Hawking, jest prawdopodobnie najbardziej znanym użytkownikiem programu syntezatora mowy

Dlaczego warto korzystać z OCR?

Dlaczego nie po prostu zrobić zdjęcie, prawda? Ponieważ nie można edytować niczego lub przeszukiwać tekstu, ponieważ byłby to tylko obraz. Skanowanie dokumentu i uruchamianie oprogramowania OCR może przekształcić ten plik w coś, co możesz edytować i móc wyszukiwać.

Historia OCR

Chociaż najwcześniejsze użycie rozpoznawania tekstu datuje się na rok 1914, szeroko rozpowszechniony rozwój i wykorzystanie technologii związanych z OCR rozpoczęło się na dobre w latach 50. XX w., W szczególności dzięki stworzeniu bardzo uproszczonych czcionek, które łatwiej przekształcić w tekst czytelny cyfrowo. Pierwsza z tych uproszczonych czcionek została stworzona przez Davida Sheparda i powszechnie znana jako OCR-7B. OCR-7B jest nadal w użyciu w branży finansowej dla standardowej czcionki używanej na kartach kredytowych i debetowych. W latach sześćdziesiątych usługi pocztowe w kilku krajach zaczęły korzystać z technologii OCR, aby znacznie przyspieszyć sortowanie poczty, w tym w Stanach Zjednoczonych, Wielkiej Brytanii, Kanadzie i Niemczech. OCR jest nadal podstawową technologią używaną do sortowania poczty dla usług pocztowych na całym świecie. W 2000 roku kluczowa wiedza na temat ograniczeń i możliwości technologii OCR została wykorzystana do opracowania programów CAPTCHA używanych do zatrzymywania botów i spamerów.

Przez dziesięciolecia OCR stał się dokładniejszy i bardziej wyrafinowany dzięki postępom w powiązanych obszarach technologicznych, takich jak sztuczna inteligencja, uczenie maszynowe i komputerowa wizja. Obecnie oprogramowanie OCR wykorzystuje rozpoznawanie wzorców, wykrywanie cech i eksplorację tekstów, aby przekształcać dokumenty szybciej i dokładniej niż kiedykolwiek wcześniej.