Як перетворити відскановані документи в Word

Якщо вам потрібно оцифрувати книгу в текстовому форматі, у вас може виникнути кілька запитань. Чи можна це зробити? Як щодо якості, чи це добре? Це можна не тільки зробити, але також існує кілька способів перетворити відсканований документ у Word. Подивимось:

Сканувавши документ у форматі PDF, а потім відредагувавши його за допомогою Adobe Acrobat XI Pro, збережіть його у форматі Word. Професійна версія Acrobat платна, але ви можете придбати безкоштовну 30-денну пробну ліцензію.
З веб-сайту OnlineOCR.net . Ця веб-програма дозволяє конвертувати документи PDF, JPG, TIFF та GIF у Word, Excel та текст. У безкоштовній версії ми можемо конвертувати до 15 сторінок на годину та документи не більше однієї сторінки.
Скануючи документ у форматі (OCR) та зберігаючи його як текст. Тоді ми можемо відкрити Word та відредагувати або зберегти його у форматі .doc.
Використання програми оптичного розпізнавання символів :
- VueScan (доступно для Windows, Mac OS X та Linux)
- Kooka (для Linux)
- Офісний об'єктив (для Android та iOS )
- CamScanner (для Android та iOS )

Найефективніший із усіх, які ми могли б сказати, - це Adobe Acrobat Pro, але лише в тому випадку, якщо сканування дуже, дуже чисте та якісне. Програми оптичного розпізнавання символів пройшли довгий шлях, але вони все ще демонструють деякі лазівки, такі як напівжирний шрифт або курсив, і транскрипція деяких слів залежно від типу шрифту оригінального документа може бути неправильною.

Спробуйте відсканувати та передати цей документ у Word, щоб побачити, що трапиться

З самого сканера

Деякі сканери мають функцію оптичного розпізнавання (OCR) у власній програмі сканування. Щоб відсканувати документ у текст, вам просто потрібно встановити формат оцифрування та переглянути той, що стосується OCR або подібного (це залежить від марки / моделі сканера).

Перехід від PDF до Word за допомогою Adobe Acrobat XI Pro

Після завантаження та встановлення Adobe Acrobat XI Pro (у вас є безкоштовна 30-денна пробна версія ТУТ ) перейдіть до розділу « Інструменти -> Розпізнавання тексту -> У цьому файлі ».

У вікні " Розпізнати текст " натисніть " Редагувати " і виберіть мову тексту, стиль виведення та роздільну здатність.

Нарешті, поверніться до « Інструменти -> Редагування вмісту -> Редагувати текст та зображення » та змініть текст, якщо вам потрібно виправити слово. Для завершення натисніть « Файл -> Зберегти як » та збережіть його у форматі Word.

OnlineOCR

OnlineOCR - це веб-програма для передачі зображень або PDF-файлів у Word, і вона дуже проста у використанні. Поясню, як це працює: введіть //www.onlineocr.net/ і натисніть « Вибрати файл ». Виберіть відсканований документ, а потім виберіть мову та формат виводу із 2 випадаючих меню, розташованих у центрі екрана.

Щоб закінчити, натисніть « Перетворити ». Відразу під ним з’явиться попередній перегляд у вигляді простого тексту, який ви можете відредагувати, якщо вам потрібно виправити будь-які слова. Нарешті, натисніть " Завантажити вихідний файл ", і ви зможете завантажити файл у форматі Word. Ось приклад PDF, перетвореного у Word за допомогою OnlineOCR:

Оригінальний PDF:

Перетворений документ:

Якщо ця веб-програма вас не задовольняє, ви можете спробувати інші подібні альтернативи, такі як FreeOCR або Free-Online-OCR .

Програми оптичного розпізнавання символів (OCR)

Якщо ви не хочете змінювати свої документи в Інтернеті і вам потрібна настільна програма, ви можете використовувати такі програми, як VueScan (яка також доступна для Mac і Linux на додаток до повсюдної Windows).

Інша можливість полягає у використанні пристрою Android або iOS для сканування документа та безпосереднього перетворення його в текст. Існують такі програми, як Office Lens (для Android та iOS ) або CamScanner (для Android та iOS ), які виконують весь процес з однієї програми. У цих випадках рекомендується очистити зображення перед перетворенням його в текст. Якщо ви хочете дізнатись більше про цей метод, погляньте на ЦЕЙ ПОСТ .

На мій погляд, оптична техніка розпізнавання символів, хоча вона значно вдосконалилася за останні роки, все ще знаходиться на відстані світлових років від ідеальної техніки. Багато деталей, багато слів, які він "перекладає" неправильними літерами та символами, що смітять текст. Йому все ще не вистачає того додаткового розуму, який змушує його бачити, що " t &! $ Olog1a " не може бути дійсним перекладом будь-якого слова в тексті. Я все ще бачу не розуміння читання, а просте візуальне розпізнавання окремих букв, що утворюють слова, не інтегруючи їх з рештою тексту. Однак я переконаний, що момент, коли ми зробимо цей останній великий стрибок, наближається з кожним днем.

У вас встановлений Telegram ? Отримуйте найкращі публікації кожного дня на нашому каналі . Або, якщо хочете, дізнайтеся все на нашій сторінці у Facebook .