Сюжеты

Cognitive научила компьютеры различать полбуханки хлеба

В России создана первая система распознавания бумажных документов заранее неизвестной структуры

Фото: «Новая газета»

Общество

Юрий Ревичобозреватель «Новой»

 

Объявлено о создании первой в России системы распознавания бумажных документов сложной и заранее неизвестной структуры. Многие разновидности бизнес-документации, такие, как счета-фактуры, торговые или транспортные накладные не регламентируются едиными правилами и могут иметь самый разнообразный вид...

Компания Cognitive Technologies, специализирующаяся на интеллектуальных возможностях компьютеров, объявила о создании первой в России системы распознавания бумажных документов сложной и заранее неизвестной структуры. Многие разновидности бизнес-документации, такие, как счета-фактуры, торговые или транспортные накладные не регламентируются едиными правилами и могут иметь самый разнообразный вид. Решение проблемы автоматизации ввода таких документов, однако, выходит далеко за узкие рамки чисто бухгалтерских задач.

Автоматическая обработка документов произвольной структуры относится к числу самых сложных задач искусственного интеллекта. Пример такого документа показан на рисунке. И обычную-то проблему распознавания символов в таких случаях решить непросто — документ на рисунке напечатан на древнем разболтанном АЦПУ, символы не пропечатаны как следует, выпадают из строки и т.д. Но если распознавать символы худо-бедно научились, то даже человеку с первого взгляда сложно понять, где там адрес покупателя, поставщика, реквизиты плательщика и другие необходимые данные.

Система распознавания сложных документов должна «понимать», к какому из признаков относится напечатанная в разных частях документа информация. Например, является ли напечатанное число номером платежного документа, или номером банковского счета, или суммой оплаты или чем-то еще. Научить компьютер различать такие вещи и без ошибок раскладывать данные по нужным ячейкам базы — само по себе серьезная научная задача.

Но это еще не все, что умеет делать новая технология Cognitive. Любой интернет-пользователь при поиске информации не раз сталкивался с проблемой названий одних и тех же предметов. Не каждый сразу вспомнит, что, к примеру, «бутерброд», «сэндвич» и  «бургер» — это различные названия одного и то же продукта, хотя результаты запросов в «Яндексе» по каждому из этих слов будут существенно различаться. В таких документах, как товарные накладные, проблема синонимов усугубляется наличием совершенно произвольных сокращений: посторонний человек не сразу догадается, что «Батон нарез. упак.», «Н. у. батон» или «Хлеб нар. уп.» есть строго одна та же позиция.

Cognitive сумела научить компьютер правильно распознавать такие данные, и разбираться с однозначностями вроде «0,5 кг», «полкило», «500 грамм», «пятьсот грамм» и «полбуханки». Руководитель лаборатории систем массового ввода документов, к.т.н. Владимир Арлазаров утверждает, что программы Cognituive безошибочно вводят более 75% позиций.

Разработанная технология ориентирована на крупные торговые сети, вроде «Перекрестка», «Копейки» или «Леруа Мерлен», и с одной из них уже заключено соглашение. Однако, легко себе представить, какие еще применения могут найти такие технологии вне области бухгалтерского учета. Недавно я стал свидетелем конфликта с Пенсионным фондом, затребовавшим у клиента оригинал трудовой книжки, который физически находился в другом городе. Между тем, трудовая книжка — типичный «сложный документ» в терминах Cognitive и, если снабдить отделы кадров подобной программой распознавания, можно значительно облегчить жизнь и клиентам и работникам государственных структур.

Президент Cognitive Technologies Ольга Ускова говорит: «Мы непрерывно ведем исследования в сферах, результаты в которых могут быть востребованы через пять, десять и более лет. Так, работы в направлении когнитивных технологий в понимании документов мы инициировали еще в середине 90-х, а реальный спрос на них возник только в последние годы, при появлении соответствующей аппаратной и организационной базы. Сегодня мы ведем исследования в области машинного зрения, «больших данных», меметических вычислений (модели передачи информации, рассматривающие идеи как единицы информации, по аналогии с геном в генетике) и т.д.». Иными словами, была бы воля и желание что-то менять в бюрократической практике, а за учеными дело не станет. 

Рейтинг@Mail.ru

К сожалению, браузер, которым вы пользуйтесь, устарел и не позволяет корректно отображать сайт. Пожалуйста, установите любой из современных браузеров, например:

Google ChromeFirefoxOpera