Оптичне розпізнавання символів (optical character recognition, OCR). Програми для оптичного розпізнавання символів ABBYY FineReader, CuneiForm

Оптична технологія для Брайля

Технологія Optical Character Recognition (OCR) надає сліпим або слабозрячим людям можливість визначити текст і вимовляти її вголос. При цьому використовується мовний висновок, а також відображається інформація на дисплеї Брайля.

Існує три основних елемента систем оптичного розпізнавання символів: отримання зображення, розпізнавання і читання тексту. Спочатку роздрукований документ захоплюється камерою, потім програмне забезпечення OCR перетворює його в розпізнані символи і слова, а після цього синтезатор в системі вимовляє певний матеріал вголос або відображає на дисплеї Брайля. Інформація може зберігатися в електронному форматі на пристрої, на якому запущено ПО OCR, або в пам’яті автономного устрою.

Процес враховує логічну структуру мови. Система зробить висновок, що, наприклад, союз «цьому» в початку пропозиції є помилкою і повинен читатися, як «це». Вона використовує лексикон і застосовує методи перевірки, аналогічні тим, які використовуються в багатьох текстових редакторах.

Всі системи OCR створюють тимчасові файли, які містять символи і макет сторінки. В деяких системах вони можуть бути перетворені у формати, які можна знайти за допомогою широко використовуваних комп’ютерних додатків, таких як текстовий редактор, електронна таблиця і бази даних.