Оптичне розпізнавання символів (optical character recognition, OCR). Програми для оптичного розпізнавання символів ABBYY FineReader, CuneiForm

Технологія OCR (Optical Character Recognition) може бути використана для перетворення друкованої копії документа в електронну версію. Наприклад, якщо сканується багатосторінковий примірник у файл TIFF, то його завантажують в OCR-програму, яка розпізнає текст, і далі переводять в редагований файл. Деякі програми дозволяють сканувати сторінки і перетворювати вміст в документ за один крок.

Хоча технологія спочатку була розроблена для оптичного розпізнавання друкованих символів, вона також може використовуватися для рукописних. Наприклад, поштові служби, такі як USPS, використовують програмне забезпечення OCR для автоматичної обробки листів і посилок, зчитуючи адресу.

Області застосування OCR

OCR розшифровується, як Оптичне Розпізнання Символів. Це широко поширена технологія розпізнавання тексту всередині зображень у вигляді відсканованих документів і фотографій. Технологія використовується для перетворення практично будь-якого типу зображень, що містять письмовий, рукописний або друкований текст у машиночитані текстові дані.

OCR стала популярною на початку 1990-х років при спробі оцифровки історичних матеріалів. З тих пір метод зазнав значні поліпшення, і в даний час забезпечує практично ідеальну точність оптичного розпізнавання символів. Розширені методики, такі як Zonal OCR, використовуються для автоматизації складних робочих процесів на основі перетворення машинописних текстів в цифрові документи. Після того як відсканований матеріал пройшов обробку, текст можна редагувати за допомогою програм, таких як Microsoft Word або Google Docs, які є текстовими редакторами.

До того як з’явилася ця технологія, єдиним варіантом оцифрування друкованих документів був ручний набір тексту. Це не тільки займало багато часу, але і призводило до неточностей і помилок при відтворенні копії. OCR часто використовується в якості «прихованої» технології у багатьох відомих системах та службах, що включають автоматизацію введення даних і індексацію для пошукових систем, автоматичне оптичне розпізнавання символів номерних знаків, а також допомогу сліпим і слабозрячим людям.