Новини / Технології / Телефон як сканер: розпізнаємо знімки програмою ABBYY FineReader
20 листопада 2009, 13:44
Розмір шрифта: А А А

Телефон як сканер: розпізнаємо знімки програмою ABBYY FineReader

Телефон як сканер: розпізнаємо знімки програмою ABBYY FineReader, FineReader, додаток, розпізнавання тексту
Телефон як сканер: розпізнаємо знімки програмою ABBYY FineReader

Нагадаємо, що FineReader — популярний додаток для розпізнавання текстів. Як правило, користувачі воліють використовувати для розпізнавання відскановані документи, але ситуація може скластися так, що сканера під рукою немає. У такому разі десята версія FineReader допускає використання фотографій документів, навіть якщо вони сфотографовані камерою мобільного телефону. З цією можливістю програми ми і ознайомимося.

Для розпізнавання знімків документів ми використовували ABBYY FineReader 10 Professional Edition. До речі, цю програму можна безкоштовно завантажити для тестування з сайту розробника. Така версія діє 15 днів і дозволяє розпізнати 50 документів. Також програму можна купити, однак будьте готові розлучитися з сумою 500-800 грн. (Залежно від версії).

Стартова сторінка програми ABBYY FineReader 10 Professional Edition.

стартова сторінка програми ABBYY FineReader 10 Professional Edition

Фотографування за допомогою Nokia E51

Для першого тесту використовувався мобільний телефон Nokia E51 — типовий бізнес-смартфон, не найновіша модель оснащена всього-на-всього 2-мегапіксельною камерою. Документ представляв собою аркуш формату A4 з текстом і картинкою. Камера телефону була виставлена ??на максимальний дозвіл. Документ помістили на підвіконня і сфотографували при природному освітленні (пагода була похмура). Фотознімок, відверто кажучи, захоплення не викликав -досить-таки мутний текст, злегка розпливлися літери, перекошений аркуш паперу.

фотографія документа

Це частина фотографії документа в натуральну величину. Як бачимо, текст розбірливий але якість його не ідеальна.

частина фотографії документа в натуральну величину

Тоді ми запустили FineReader, відкрили в ньому фотозображення і без всякої додатково обробки натиснули кнопку «Розпізнати». Процес розпізнавання не зайняв багато часу. Одержаний документ був збережений в Word, результати процесу ви можете бачити на скріншотах.

Завершення процесу розпізнання сторінки програмою ABBYY FineReader 10.

розпізнання сторінки програмою ABBYY FineReader 10

Розпізнаний текст у редакторі Word.

Розпізнаний текст у редакторі Word

Після обробки документа програма FineReader видала рада використовувати знімок більш високого дозволу для коректного розпізнавання більш дрібного шрифту. Дійсно, блоки тексту подрібніше (відзначені на скріншоті червоним) програма розпізнала, м'яко кажучи, не дуже добре. Але слід доля, що ці текстові блоки не були набрані, а представляли собою слайд, який роздрукувався в помітно гіршій якості, ніж набрані вручну рядка. Інший текст, всупереч сумнівам, був розпізнаний цілком задовільно. Так, і звичайно ж, не розпізнавалися слова, написані латиницею.

блоки тексту подрібніше (відзначені на скріншоті червоним) програма розпізнала погано

Той же фотознімок документа ми спробували піддати процедурі розпізнання після додаткової обробки, передбаченої в FineReader. Для цього там є такі функції, як виправлення трапецієподібних перекручувань, зменшення шумів, усунення розмиття, а також виправлення викривлення рядків. Ніякого особливого поліпшення якості розпізнання ми не побачили.

Процес редагування документа у програмі ABBYY FineReader 10 Professional Edition.

Процес редагування документа

На другому етапі тестування документ фотографувався тією ж фотокамерою в максимальному дозволі, але при штучному освітленні. Якість знімків при цьому помітно погіршилася, окремі слова просто зливалися в щось неудобочитаєме. Природно, все це позначилося на результаті розпізнавання тексту — коректно розпізнані були тільки окремі слова. Нітрохи не допомогла і попередня обробка зображення засобами FineReader.

Частина документа, отримана при штучному освітленні.

Фотографія документа, отримана при штучному освітленні

Результат розпізнавання документа, сфотографованого при штучному освітленні.

Результат розпізнавання документа

Нарешті, не сподіваючись на позитивний результат, але щоб розставити всі крапки над «i» на третьому етапі документ був сфотографований все тією ж камерою при денному освітленні, але з встановленим на ній VGA-дозволом, що відповідає 0,3 Мп. Як і очікувалося, спроба ця привела до повного фіаско — текст взагалі не був розпізнаний (якщо не вважати «шапки», набраний дуже великими літерами).

Документ, сфотографований в VGA-роздільній здатності.

Документ, сфотографований в VGA-роздільній здатності

Фотографування за допомогою Nokia 7390

Продовжуючи тестування, ми фотографували документ жіночим слайдером Nokia 7390 -не в силу пристрасті до телефонів фінського виробника, просто це був перший підвернувся під руку апарат з 3-мегапіксельною камерою. Використання камери з більш високою роздільною здатністю відразу позитивно позначилося на якості розпізнавання тексту.

Для початку документ був сфотографований при денному освітленні. Знімок вийшов не в приклад більш чітким, ніж при використанні 2-мегапіксельної камери. Майже всі слова в документі, включаючи дрібний і поганенько пропечатаних шрифт слайда, були коректно розпізнані додатком без всякої попередньої обробки зображення.

Використання камери з більш високою роздільною здатністю

Використання камери з більш високою роздільною здатністю

Результат розпізнавання документа

Деякі складнощі викликала конвертація отриманого тексту в документ Word. Програма нехитро підстроїла вордовскую сторінку під розміри фотографії, тому розміри отриманого в результаті документа помітно перевищували формат A4. Але ця проблема була легко усунена шляхом зміни відповідних налаштувань у FineReader — текст за умовчанням конвертувався в формат А4.

Процес зміни налаштувань в ABBYY FineReader 10 Professional Edition.

Процес зміни налаштувань в ABBYY FineReader 10 Professional Edition

Другий досвід був проведений з зображенням документа, знятого все тієї ж камерою, але при штучному освітленні. Цього разу програма гірше розпізнала дрібний шрифт, але з основним текстом справилася добре. На цьому тестування було припинено.

малюнок при штучному освітленні

малюнок при штучному освітленні

Результат розпізнавання документа

Висновки

Отже, ми провели розпізнавання тексту документів, сфотографованих найпоширенішими на сьогодні телефонними камерами — 2-х і 3-мегапіксельною. Для 2-мегапіксельної камери задовільних результатів вдалося домогтися, коли документ був сфотографований при природному освітленні. Досить тьмяне штучне освітлення помітно погіршило результат. Зате 3-мегапікскельная камера добре спрацювала — в обох випадках розпізнавання тексту було коректним. Так що використання сучасних камерафонов для таких цілей гарантовано призведе до гарного результату. Підводячи підсумки, відзначимо, що досвід використання камери телефону як сканера разом з ABBYY FineReader 10 Professional Edition виявився успішним.

ВКонтакте Buzz Live journal Facebook Twitter

Знайшли помилку в тексті? Виділіть її мишою і натисніть CTRL+Enter
Лист у редакцію

Коментарі (1)

Ви не авторизувались.
Якщо у вас вже э обліковий запис ВКурсе.ua, увійдіть або зареєструйтесь.
ваш коментар:

Читайте також:

Позбавтеся від свого смартфона

27 березня 2017, 09:09

Компанія чи додаток: в ЄС намагаються визначити статус Uber

4 грудня 2016, 14:31

«Укрзалізниця» призначила додаткові поїзди до осінніх канікул

21 жовтня 2016, 08:26

Останні новини за сьогодні: