14 августа 2014
Что собой представляет интеллектуальное распознавание документов?
Начальник службы ДОУ, г. Омск
Алексей Чернышев, эксперт департамента корпоративных систем, Digital Design
Интеллектуальное распознавание документов – один из видов обработки, применяемый в тех случаях, когда входящие документы не структурированы либо слабо структурированы и плохо поддаются распознаванию обычными средствами. Системы интеллектуального распознавания (IDR) представляют собой совокупность стандартных средств оптического распознавания и специализированных программных методик, предназначенных для обработки полученных данных с помощью определенного набора правил.
В частности, может использоваться предварительный анализ документа на предмет содержания определенных ключевых слов (например, слова «счет»), по которым документ будет отнесен к определенной категории («Счета») с соответствующим набором предполагаемых полей (дата, сумма, реквизиты поставщика и т. д.), которые система будет искать в документе в определенных последовательностях. Еще один пример – в двухслойных PDF-файлах (с наличием как текста, так и графики) в зависимости от различных условий система IDR может «принимать решение», использовать ли текстовый слой PDF или вместо этого произвести распознавание графического слоя. Функции «обучения» в процессе работы также являются распространенной чертой таких продуктов.
Общая задача интеллектуальных средств распознавания – обеспечить ускорение обработки слабоструктурированных и неструктурированных документов, тем самым сэкономив время сотрудников организации, уходящее на ручной ввод данных.
Словарь
Интеллектуальное распознавание документов (Intelligent Document Recognition (IDR)) – новая технология, которая обещает изменить способ обработки документов для бизнеса.
СОВРЕМЕННЫЕ ТЕХНОЛОГИИ ДЕЛОПРОИЗВОДСТВА И ДОКУМЕНТООБОРОТА
№ 8 201480
http://www.sekretariat.ru/magazinestdd/stdd_8_2014.php