С помощью платформы были оцифрованы слабоструктурированные документы ОЦО «Ростелекома», а все данные из них автоматически перенесены в информационную систему компании. Нейросеть также проверила актуальность договоров, определила наличие необходимых подписей, печатей, дат и реквизитов. Таким образом, была частично реализована функция по автоматической проверке юридической значимости документов. Эту аналитическую работу обычно выполняют сотрудники компании.
Информация и персональные данные при оцифровке были зашифрованы и защищены механизмом деперсонализации: перед обработкой документы разрезались на отдельные фрагменты, по которым невозможно установить их принадлежность. Скорость распознавания одного документа составила около 20 секунд.
Благодаря двухэтапному распознаванию платформа с высокой точностью обработала также данные в договорах, заполненных от руки. Рукописный текст, который современные ИИ-системы распознают с низким порогом уверенности, уходил на вторичную верификацию операторам ввода данных, удаленно подключенным к облачному сервису. Люди сверяли фрагменты распознанного текста и вносили правки в случае ошибок. В результате общее качество распознавания документов составляет почти 100%.
Сервис автоматического распознавания, оцифровки и анализа документов с применением технологий искусственного интеллекта разработала компания «Биорг», резидент ИТ-кластера фонда «Сколково». Всего на платформе обрабатывается около 5 млн полей с персональными данными в месяц.
«При масштабировании проекта компания сможет снизить операционные затраты на 56% за счет автоматизации распознавания и ввода атрибутов, необходимых для регистрации документа в системе. Отечественное решение компании Биорг полностью соответствует требованиям безопасности ФСТЭК и ФСБ к обработке персональных данных. В дальнейшем мы планируем дополнительно защитить обрабатываемую информацию. Так, верификаторами слабораспознанных рукописных данных будут выступать наши же сотрудники, а сама система будет развернута в нашем корпоративном облаке», — сказал директор департамента филиала ОЦО «Ростелекома» Павел Шмидт.«В идеале система на основе платформы Beorg Smart Vision оставит за человеком только финальное решение о приемке документов. С рутинной и объемной работой нейросети справляются гораздо лучше людей, которых долгий монотонный труд приводит к выгоранию, изнуряет. Эффективность и окупаемость решения целесообразно оценивать на масштабных потоках документов, поскольку искусственный интеллект наилучшим образом подходит для обработки и анализа больших данных. Это может быть несколько миллионов документов в год», — сказал директор по развитию компании «Биорг» Александр Коробов.
В настоящее время «Ростелеком» проводит конкурс на полномасштабное внедрение технологии, по итогам которого решение будет масштабировано на все документоемкие процессы компании. Срок внедрения полноценной системы распознавания и анализа может составить около полугода.