Чи бувало у вас таке, що, наприклад, партнери по бізнесу прислали якусь документацію чи проект договору про співпрацю у вигляді графічного файлу формату (звичайної картинки або PDF)? По всій видимості, з цим стикалися, якщо не все, то дуже багато. А адже документ вам потрібно терміново змінити, а найчастіше це стосується редагування текстової частини, яка може міститися у вихідному файлі. Як розпізнати текст, картинки, щоб витратити на це мінімум часу і уникнути можливої появи всіляких помилок? Про це та інше й піде далі мова. Способів «витягування» тексту з файлів графічних типів або універсального формату PDF на сьогоднішній день існує багато, проте при розгляді деяких з них будемо відштовхуватися від найбільш цікавих, простих і зрозумілих будь-якому користувачеві методів.
Як розпізнати текст з картинки в Word?
Почати варто з одного з найпростіших методів, який підійде всім без винятку користувачам. Якщо мова йде про те, щоб «витягти текст з PDF-документа, а потім відредагувати його і зберегти в «рідному» форматі текстового редактора Word, далеко ходити не потрібно, оскільки всі останні версії цього додатка, починаючи з «Офісу» 2010 року випуску, підтримують роботу з файлами PDF і дозволяють редагувати точно так само просто, як якщо б це був самий звичайний документ Word.
Щоб у «Ворді» розпізнати текст з картинки формату PDF, який, якщо хтось не знає, відноситься саме до графічним типами файлів, досить задати відкриття документа, а в типі файла вибрати саме формат PDF. Після цього текст можна буде і відредагувати і зберегти повторно у вигляді «рідного» формату редактора, вибравши в тому ж полі потрібний тип (наприклад, DOC або DOCX).
Додаткові інструменти для Office 2003
Якщо ж проблема полягає в тому, як розпізнати текст з картинки в редакторі, входить до складу офісного пакету, скажімо, 2003 року, в якому цей формат не підтримується, то і в цьому випадку нічого складного немає.
В доважок до самого текстового редактору додатково можна встановити інструмент у вигляді интегрируемого в Word розширення під назвою File Format Converters, який додасть можливостей редактора в тому плані, що він зможе працювати з PDF-файлами, і з документами оновлених форматів начебто DOCX.
Як розпізнати текст з картинки в PDF?
Ще один спосіб вилучення тексту безпосередньо з графічного об’єкта в PDF-форматі полягає в тому, щоб скористатися будь-яким з відомих редакторів, розрахованих на роботу з такими документами. Одним з найбільш універсальних і практичних додатків можна назвати відому програму від Adobe Reader. Зверніть увагу, що в даному випадку мова йде саме про програму «Рідер», а не про аналогічному переглядачі «Акробат», який підтримує тільки читання документів (перегляд без можливості редагування).
У самій програмі вам потрібно буде просто виділити потрібний фрагмент тексту, скопіювати його в буфер обміну, а потім вставити в документ Word і зберегти у потрібному кінцевому форматі.
Використання програми OneNote
Якщо розбиратися в тонкощах того, як розпізнати текст з картинки без використання вищеописаних програм, можна порадити скористатися ще одним унікальним аплетом, що входять до складу останніх модифікацій і збірок самих офісних пакетів, під назвою OneNote, про можливості якого багато користувачів в більшості своїй або забувають, або не знають зовсім. У програмі буде потрібно для зручності роботи лише створити порожній документ, використовуючи меню вставки помістити в нього зображення з текстом з графічного файлу (будь-якого формату), а потім налаштувати мову розпізнавання.
Після цього залишиться тільки скопіювати текст в буфер обміну, для чого використовується спеціальний пункт «Копіювати текст з картинки», після чого його можна буде вставити з буфера в будь-яку іншу програму.
Примітка: якщо питання стосуються того, як з картинки розпізнати китайський текст або вміст, представлене на будь-якому іншому неподдерживаемом для відображення мовою, вам потрібно встановити додатковий мовний пакет, завантаживши його, наприклад, з офіційного джерела Microsoft і інтернеті.
Система розпізнавання ABBYY Finereader
Природно, якщо мова йде виключно про те, як розпізнати текст з картинки в графічних форматах, краще всього використовувати для цього спеціалізовані OCR-системи. Однією з найбільш потужних і популярних є програма ABBYY Finereader, а також її онлайн-аналог у вигляді офіційного інтернет-порталу.
Ця програма працює за типом віртуального сканера, в якому потрібно всього лише задати напрямок розпізнавання, а іноді може знадобитися вказати мову документа (це відноситься до застарілими версіями пакета). Коли сканування тексту на тому ж друкованому аркуші або в графічному файлі буде закінчено, він буде автоматично перенаправлений, наприклад, у Word або будь-який інший офісний редактор.
Конвертери форматів
Поки що це були найпростіші програми, що дозволяють розпізнати текст з картинки. Програми для виконання таких дій включають в себе і ще одну категорію, званого конвертерами. Вони цікаві тим, що виконувати саме розпізнавання текстового вмісту графічного файлу в них не потрібно. Суть полягає в тому, щоб переконвертувати вихідний графічний формат в обраний текстовий, після чого перетворений файл і можна буде відкрити в потрібному редакторі. Крім того, дуже часто саме такі програми виявляються максимально ефективними, коли вам потрібно обробити кілька десятків однотипних документів. Це називається пакетним режимом. Що ж до самих програм, їх в тому ж інтернеті можна знайти величезну кількість.
Серед найбільш затребуваних додатків можна відзначити утиліти для перетворення PDF-файлів в інші формати, конвертери PDF або JPG в Word, універсальні перетворювачі будь-якого типу графіки, текстові файли і т. д.
Онлайн-сервіси: нюанси використання та можливі обмеження
Нарешті, якщо жодне із запропонованих рішень вам не підходить, займатися перетвореннями вручну просто лінь або немає часу, будь ласка, в інтернеті представлено величезну кількість ресурсів, на яких всі ці операції будуть виконані без вашої прямої участі. Від вас буде потрібно тільки завантажити вихідний графічний файл, дочекатися закінчення вилучення тексту й скачати готовий текстовий файл на власний комп’ютер (або навіть просто скопіювати текст з вікна з результатом). Правда, незручність деяких таких сервісів полягає тільки в тому, що найчастіше можуть встановлюватися обмеження на кількість одночасно завантажуваних для обробки файлів і ліміти, що стосуються їх розміру, не кажучи вже й про те, що деякі сервіси є аж ніяк не безкоштовними. Зате багато хто з таких ресурсів визначають використовуваний в тексті мова автоматично, що позбавляє вас від додаткових непотрібних дій з переведення.