НПФ «Будущее» и ITFB Group: автоматизация 142 тысяч документов с EasyDoc

Технологии
EasyDoc, LLM, OCR

В 2024 году НПФ «Будущее» столкнулся с задачей технологической и операционной консолидации: в условиях объединения фондов и большого объема входящей корреспонденции потребовалось гарантировать регистрацию и качественную обработку более 330 000 документов в год, при этом около 42% потока регистрировались вручную, что создавало риски ошибок, задержек и дополнительных операционных затрат. Работа осложнялась тем, что документы одного формата требовалось классифицировать по нескольким видам, которые далее требовали определения типа и тематики, принятым в фонде. Проект по внедрению OCR системы EasyDoc от ITFB Group был нацелен на быстрое и контролируемое решение этой проблемы в рамках автоматизации и оптимизации процессов регистрации документов для повышения уровня сервиса для клиентов. Это крупнейший на сегодня в России проект по интеллектуальному распознаванию документов, объединивший обработку свыше 140 тысяч файлов и классификацию 20 видов документов по типам и тематикам с применением LLM-моделей.

Задача

Перед командой ITFB Group стояла амбициозная задача спроектировать и внедрить решение, которое обеспечит НПФ «Будущее» сквозную автоматизацию работы с входящей корреспонденцией в условиях объединения фондов и больших объемов документооборота. Необходимо было заменить ручную регистрацию, охватывающую 42% потока (около 142 тыс. обращений в год), на интеллектуальную систему, способную обрабатывать как структурированные, так и неструктурированные документы от физических и юридических лиц.

Одной из задач стала необходимость справится с неоднородностью потока, когда даже документы одного типа могли значительно визуально отличаться и применить стандартные методы было невозможно. Требованиями проекта стали: минимизация ошибок, сокращение времени обработки, снижение затрат на операционную регистрацию, классификация неструктурированных документов по типам и тематикам и формирование платформы, готовой к масштабированию и внедрению новых ИИ-сервисов в будущем.

Ключевым требованием к решению стало достижение качества распознавания не ниже 90% для печатного и 60% для рукописного текста, с возможностью дообучения и адаптации под новые типы документов без изменения ядра системы.

Решение

Решение было реализовано в течение одиннадцати месяцев совместной командой ITFB Group и НПФ «Будущее».

На первом этапе был реализован модуль распознавания и классификации документов, который обрабатывает как классические текстовые формы, так и отсканированные интеграционное взаимодействие с системой электронного документооборота фонда для регистрации структурированных документов.

На втором этапе было внедрено распознавание неструктурированных документов, в том числе запросов государственных органов и судебных документов, при этом классификация по типам и тематике была реализована с помощью тонкой донастройки LLM-моделей — стандартные классификаторы не обеспечивали нужной точности.

На третьем этапе в процесс была интегрирована AI-подсистема — LLM-модели и правило-ориентированные механизмы извлечения данных — для семантического анализа обращений, автоматического выделения сущностей и принятия первичных решений о маршрутизации и приоритизации. Архитектура была спроектирована с акцентом на масштабируемость: модульная интеграция позволила сохранить гибкость при подключении удаленных подразделений.

В основе архитектуры EasyDoc лежит принцип «одного окна»: входящие документы проходят через цепочку импорт, предобработка, распознавание (OCR/HTR), классификация (ML, LLM), извлечение атрибутов и экспорт в СЭД по API.

Модуль работает с 20 видами документов, 58 типами и 74 тематиками, извлекая до 23 ключевых атрибутов — от почтового идентификатора отправления и СНИЛС клиента до тематики обращения, даты исполнения и субъекта Российской Федерации.

Если качество распознавания превышает 90%, документ может регистрироваться автоматически. При более низком пороге задействуется режим ручной верификации атрибутов. Такой гибридный подход позволил сохранить баланс между скоростью и точностью обработки.

технологии

Технический стек проекта сочетал проверенные промышленные компоненты и современные подходы машинного обучения. Модуль использует пять алгоритмов распознавания и поддерживает импортозамещённый технологический стек.

Для предварительного извлечения текста использовались решения OCR и методы компьютерного зрения, адаптированные под широкий спектр изображений и качества сканирования. Для формального извлечения полей и валидации применялись rule-based механизмы, обеспечивающие предсказуемость на критичных для учёта полях.

На уровне семантики и нетривиальной классификации была задействована подсистема на базе больших языковых моделей (LLM), которая позволила работать с неструктурированными текстами, выделять смысловые сущности и предзаполнять тематики.

Интеграция с СЭД системой осуществляется через API с синхронизацией со справочниками, а развёртывание производится в защищённом контуре, что обеспечивает соответствие требованиям по обработке ПДн и отказоустойчивости. Все компоненты были интегрированы в единый процесс с логированием, мониторингом распознавания и контролем качества результатов, что обеспечило прозрачность и возможность последующего аудита.

Результат

Внедрение OCR системы EasyDoc дало НПФ «Будущее» измеримый эффект по ключевым показателям:

Автоматизация процессов. 62% ручных операций в регистрации заменены автоматизированной обработкой.
Скорость обработки. Время регистрации входящей корреспонденции сократилось в среднем на 20%, что напрямую повлияло на скорость реакции на клиентские запросы.
Оптимизация затрат. Фонд оплаты труда, задействованный в процессах регистрации, был сокращён на 30% без потери качества обслуживания клиентов.
Качество данных. Уровень ошибок, опечаток и пропусков при регистрации снизился на 80%, что повысило надёжность учёта и упростило последующую работу с документами.
Гибкость и масштабирование. Процесс регистрации стал функционально разделённым и прозрачным, что открыло возможность для аутсорсинга отдельных этапов и масштабирования системы на процесс обработки клиентских заявлений.
Фундамент для развития. Система изначально спроектирована с учётом интеграции новых модулей ИИ, в том числе расширенной классификации и интеллектуальной маршрутизации обращений.

Система обладает запасом масштабируемости для филиалов и территориально удаленных офисов и поддерживает интеграцию новых ИИ-сервисов с расширением сценариев автоматической классификации.

«После объединения фондов мы столкнулись с огромным объёмом входящей корреспонденции, где значительная часть процессов выполнялась вручную. Внедрение EasyDoc совместно с ITFB Group позволило нам перевести регистрацию и обработку документов на новый уровень — минимизировать ошибки и при этом снизить нагрузку на сотрудников. Сегодня мы видим реальный эффект цифровизации в улучшении качества сервиса для клиентов и в более высокой эффективности внутренних процессов», — отмечает Виктория Бондарева, Заместитель Генерального директора НПФ «Будущее».

«Мы специализируемся на проектах, где классический документооборот встречается с современными технологиями искусственного интеллекта. В случае НПФ «Будущее» ключевым вызовом был масштаб и разнообразие входящего потока: от заявлений физических лиц до запросов государственных органов. Мы объединили опыт в построении систем электронного документооборота с технологиями CV, OCR и LLM, чтобы создать решение, которое не только автоматизировало рутину, но и заложило основу для дальнейшей интеллектуализации процессов», — комментирует Вадим Петросян, директор по развитию бизнеса ITFB Group.

к списку проектов

У вас похожая задача?

Свяжитесь с нами

ОСТАВИТЬ ЗАЯВКУ