ABBYY FineReader Engine 10 поддерживает основные графические форматы, включая многостраничные TIFF и JPEG 2000, и работает с черно-белыми, серыми и цветными изображениями. Изображения могут поступать на обработку в ABBYY FineReader Engine 10 несколькими способами: со сканера через TWAIN-интерфейс, непосредственно из памяти или из файлов. Программа также может открывать PDF-файлы и преобразовывать их в изображения с помощью Adobe PDF Library. В ABBYY FineReader Engine есть возможность управлять такими параметрами сканирования как яркость, цветность, разрешение, область сканирования, одно- или двустороннее сканирование. Возможно также задать паузу между сканированием страниц и т.д.
ABBYY FineReader Engine способен выполнять следующие операции предварительной обработки изображений:
- Устранение перекосов. Применяется для изображений, полученных со сканера. Для обработки не требуется наличие границ или других линий.
- Разделение двойных страниц. Применяется при распознавании отсканированных книг: изображение книжного разворота разделяется на два изображения, каждое из которых соответствует одной странице. Затем каждая страница распознается и анализируется, при этом также может быть устранен перекос изображения.
- Удаление «мусора» (очистка изображения). При сканировании с низким или средним качеством на изображении может появиться большое количество лишних точек, расположенных вблизи границ символов, что приводит к ухудшению качества распознавания. ABBYY FineReader Engine 10 позволяет устранять подобный случайный «мусор».
- Фильтрация текстуры и адаптивная бинаризация. Технология фильтрации текстуры позволяет удалять с изображения фоновую текстуру и цветной фон. С помощью передовой технологии адаптивной бинаризации удается безошибочно распознавать тексты, расположенные на фоне изображений с переменной контрастностью. При распознавании подобных оригиналов параметры бинаризации подбираются индивидуально для каждого фрагмента изображения. Таким образом удается повысить точность распознавания трудночитаемых документов, таких как газеты, цветные документы, факсы и ксерокопии.
- Масштабирование изображения. Если документ был отсканирован с низким разрешением (менее 120 dpi) и в нем есть мелкий текст (менее 10 pt), для повышения качества распознавания можно выполнить цифровое увеличение изображения.
- Автоматическое определение угла поворота страницы (90, 180, 270 градусов). При сканировании возможно различное расположение страниц пакета на планшете сканера. Соответственно, их изображения могут быть повернуты под различным углом. ABBYY FineReader Engine 10 автоматически определяет угол поворота страницы и при необходимости исправляет ошибки, допущенные при подаче документов в сканер.
- Адаптивная обработка изображений документов, снятых цифровым фотоаппаратом. Эта новая технология позволяет отличать отсканированные изображения документов от изображений, полученных при помощи цифрового фотоаппарата, и устранять искажения, типичные для цифровой фотосъемки.
- Очистка изображения в пределах текстового блока. При очистке предусмотрена возможность указывать размер черных и белых фракций «мусора».
- Изменение цветов текста и фона в прямоугольных областях. Эта функция будет особенно полезна разработчикам систем управления данными. Типовой сценарий ее применения в электронном архиве выглядит следующим образом: распознанный документ сохранен в виде изображения и в виде текста, притом в архивном индексе хранятся геометрические координаты каждого символа на изображении страницы. Используя функцию изменения цветов, можно реализовать подсветку ключевых слов в результатах поиска по архиву. При этом пользователь будет видеть фрагмент изображения, на котором искомые слова выделены цветом.
Анализ структуры документов необходим для автоматического преобразования документа с сохранением форматирования, распознавания отдельных зон документа с разметкой блоков вручную, а также для обработки форм. Анализ документа позволяет:
- автоматически определить ориентацию страницы – 90, 180, 270 градусов;
- автоматически обнаружить текстовые блоки, таблицы, штрихкоды и картинки;
- автоматически обнаружить в ячейках таблиц текст с вертикальным направлением;
- размечать блоки вручную, а также добавлять, удалять и редактировать их.
Также можно воспользоваться следующими возможностями ABBYY FineReader Engine, каждая из которых представляет собой индивидуальный тип анализа, предназначенный для решения конкретных задач пользователя:
Анализ документа для счетов. Этот специализированный вид анализа предназначен для предварительной обработки документов, расположение элементов которых неодинаково для разных документов одного типа. К ним относятся, например, инвойсы, платежные поручения, квитанции, денежные переводы, визитные карточки, договоры, заявление о выплате страхового возмещения, резюме и т.д. Данная функция позволяет обнаруживать максимальное количество текста, включая символы и цифры, даже если надписи выполнены мелким шрифтом и находятся на картинках, логотипах, и т.п.
В отличие от стандартного анализа, данный специализированный вид анализа предполагает, что вся печатная информация, содержащаяся на документе, является текстом. В частности, структура таблиц не анализируется, текст в ячейках выделяется в самостоятельные текстовые блоки. При таком подходе важная текстовая информация не будет интерпретирована как графические элементы, а числа в таблицах гарантированно не будут разделены на группы, состоящие из целой и дробной частей. В результате удастся получить максимальное количество информации о тексте, включая его координаты. Впоследствии эта информация может быть использована для анализа документа, обработки полей и разбора текста в других системах.
Анализ документа для полнотекстового индексирования. В данном режиме на странице автоматически находится и распознается вся текстовая информация, в том числе и та, что находится внутри изображений, графиков, диаграмм и т.п. Это дает разработчикам возможность строить полнотекстовые индексы для распознаваемых документов, что полезно для организации эффективного и удобного поиска по электронным архивам и другим массивам неструктурированной или слабоструктурированной текстовой информации.