Новости / Технологии / Телефон как сканер: распознаем снимки программой ABBYY FineReader
20 ноября 2009, 13:44
Размер шрифта: А А А

Телефон как сканер: распознаем снимки программой ABBYY FineReader

Телефон как сканер: распознаем снимки программой ABBYY FineReader, FineReader, приложение, распознавание текста
Телефон как сканер: распознаем снимки программой ABBYY FineReader

Напомним, что FineReader — популярное приложение для распознавания текстов. Как правило, пользователи предпочитают использовать для распознавания отсканированные документы, но ситуация может сложиться так, что сканера под рукой нет. В таком случае десятая версия FineReader допускает использование фотографий документов, даже если они сфотографированы камерой мобильного телефона. С этой возможностью программы мы и ознакомимся.

Для распознавания снимков документов мы использовали ABBYY FineReader 10 Professional Edition. Кстати, эту программу можно бесплатно скачать для тестирования с сайта разработчика. Такая версия действует 15 дней и позволяет распознать 50 документов. Также программу можно купить, однако будьте готовы расстаться с суммой 500-800 грн. (в зависимости от версии).

Стартовая страничка программы ABBYY FineReader 10 Professional Edition.

тартовая страничка программы ABBYY FineReader 10 Professional Edition

Фотографирование с помощью Nokia E51

Для первого теста использовался мобильный телефон Nokia E51 — типичный бизнес-смартфон, не самая новая модель оснащенная всего-навсего 2-мегапиксельной камерой. Документ представлял собой лист формата A4 с текстом и картинкой. Камера телефона была выставлена на максимальное разрешение. Документ поместили на подоконник и сфотографировали при естественном освещении (пагода была пасмурная). Получившаяся фотография, откровенно говоря, восторга не вызвала — довольно-таки мутный текст, слегка расплывшиеся буквы, перекошенный лист бумаги.

фотография документа

Это часть фотографии документа в натуральную величину. Как видим, текст разборчивый но качество его не идеально.

часть фотографии документа в натуральную величину

Тогда мы запустили FineReader, открыли в нем фотоизображение и без всякой дополнительно обработки нажали кнопку «Распознать». Процесс распознавания не занял много времени. Получившийся документ был сохранен в Word, результаты процесса вы можете видеть на скриншотах.

Завершение процесса распознания страницы программой ABBYY FineReader 10.

распознания страницы программой ABBYY FineReader 10

Распознанный текст в редакторе Word.

Распознанный текст в редакторе Word

После обработки документа программа FineReader выдала совет использовать снимок более высокого разрешения для корректного распознавания более мелкого шрифта. Действительно, блоки текста помельче (отмечены на скриншоте красным) программа распознала, мягко говоря, не очень хорошо. Но следует участь, что эти текстовые блоки не были набраны, а представляли собой слайд, который распечатался в заметно худшем качестве, чем набранные вручную строки. Прочий текст, вопреки сомнениям, был распознан вполне удовлетворительно. Да, и конечно же, не распознавались слова, написанные латиницей.

блоки текста помельче (отмечены на скриншоте красным) программа распознала плохо

Тот же фотоснимок документа мы попробовали подвергнуть процедуре распознания после дополнительной обработки, предусмотренной в FineReader. Для этого там имеются такие функции, как исправление трапециевидных искажений, уменьшение шумов, устранение размытия, а также исправление искажения строк. Никакого особого улучшения качества распознания мы не увидели.

Процесс редактирования документа в программе ABBYY FineReader 10 Professional Edition.

Процесс редактирования документа

На втором этапе тестирования документ фотографировался той же фотокамерой в максимальном разрешении, но при искусственном освещении. Качество снимков при этом заметно ухудшилось, отдельные слова просто сливались в нечто неудобочитаемое. Естественно, все это сказалось на итоге распознавания текста — корректно распознаны были только отдельные слова. Ничуть не помогла и предварительная обработка изображения средствами FineReader.

Фотография документа, полученная при искусственном освещении.

Фотография документа, полученная при искусственном освещении

Результат распознавания документа, сфотографированного при искусственном освещении.

Результат распознавания документа

Наконец, не надеясь на положительный результат, но чтобы расставить все точки над «i» на третьем этапе документ был сфотографирован все той же камерой при дневном освещении, но с установленным на ней VGA-разрешением, что соответствует 0,3 Мп. Как и ожидалось, попытка эта привела к полному фиаско — текст вообще не был распознан (если не считать «шапки», набранный очень крупным шрифтом).

Документ, сфотографированный в VGA-разрешении.

Документ, сфотографированный в VGA-разрешении

Фотографирование с помощью Nokia 7390

Продолжая тестирование, мы фотографировали документ женским слайдером Nokia 7390 — не в силу пристрастия к телефонам финского производителя, просто это был первый подвернувшийся под руку аппарат с 3-мегапиксельной камерой. Использование камеры с более высоким разрешением сразу положительно сказалось на качестве распознавания текста.

Для начала документ был сфотографирован при дневном освещении. Снимок получился не в пример более четким, чем при использовании 2-мегапиксельной камеры. Почти все слова в документе, включая мелкий и плоховато пропечатанный шрифт слайда, были корректно распознаны приложением без всякой предварительной обработки изображения.

Использование камеры с более высоким разрешением

Использование камеры с более высоким разрешением

Результат распознавания документа

Некоторые сложности вызвала конвертация полученного текста в документ Word. Программа бесхитростно подстроила вордовскую страничку под размеры фотографии, поэтому размеры полученного в результате документа заметно превышали формат A4. Но эта проблема была легко устранена путем изменения соответствующих настроек в FineReader — текст по умолчанию конвертировался в формат А4.

Процесс изменения настроек в ABBYY FineReader 10 Professional Edition.

Процесс изменения настроек в ABBYY FineReader 10 Professional Edition

Второй опыт был произведен с изображением документа, снятого все той же камерой, но при искусственном освещении. На этот раз программа хуже распознала мелкий шрифт, но с основным текстом справилась хорошо. На этом тестирование было прекращено.

фотография при искусственном освещении

фотография при искусственном освещении

Результат распознавания документа

Выводы

Итак, мы провели распознавание текста документов, сфотографированных самыми распространенными на сегодня телефонными камерами — 2-х и 3-мегапиксельной. Для 2-мегапиксельной камеры удовлетворительных результатов удалось добиться, когда документ был сфотографирован при естественном освещении. Довольно тусклое искусственное освещение заметно ухудшило результат. Зато 3-мегапикскельная камера хорошо сработала — в обоих случаях распознавание текста было корректным. Так что использование современных камерафонов для таких целей гарантированно приведет к хорошему результату. Подводя итоги, отметим, что опыт использования камеры телефона в качестве сканера вместе с ABBYY FineReader 10 Professional Edition оказался успешным.

ВКонтакте Buzz Live journal Facebook Twitter

Нашли ошибку в тексте? Выделите ее мышкой и нажмите CTRL+Enter
Письмо редактору

Комментарии (1)

Вы не авторизировались.
Если у вас уже есть учетная запись ВКурсе.ua, войдите или зарегистрируйтесь.
ваш коментарий:

Читайте также:

Избавьтесь от своего смартфона

27 марта 2017, 09:09

Компания или приложение: в ЕС пытаются определить статус Uber

4 декабря 2016, 14:31

В устройствах Samsung появится защита по голосу и лицу

24 сентября 2016, 18:03

Последние новости за сегодня: