2025/05/05 11:46:08

Интеллектуальная обработка документов. Обзор TAdviser

После того, как импортозамещение перестанет быть ключевым драйвером рынка интеллектуальной обработки документов, точкой роста станут ИИ и его интеграция в корпоративные информационные системы класса BPM и IDP в связке с RPA.

2025/05/05
Image:IDP_obzor_cover_975.png

Партнер обзора:

 

Технологии интеллектуальной обработки документов (Intelligent Document Processing, IDP) давно и успешно присутствуют на рынке. Первые отечественные программы оптического распознавания текста (OCR, optical character recognition) получили широкое распространение в середине девяностых годов прошлого века.

С тех пор они прочно занимают место во многих офисных и домашних компьютерах, а технологии, которые ими используются, совершенствуются и модернизируются. Основными при этом остаются OCR и CV (computer vision; компьютерное зрение). Эксперты говорят о том, что и вездесущий искусственный интеллект принимает участие в технологическом развитии этого сегмента программного обеспечения.CIO АЛРОСА Вадим Желтухин — об импортозамещении, которое не остановится, даже если импорт вернётся 3.8 т

Среди ближайших перспектив в сфере интеллектуальной обработки данных отраслевые эксперты видят программы, основанные на использовании больших языковых моделей (LLM) на основе ИИ, обработку естественных языков (NLP; natural language processing) и машинное обучение (ML) в его модификациях: AutoML, self-supervised learning.

1 Текущие тренды в IDP

Эксперты отмечают расширение и взаимопроникновение технологий «классической» и «современной» интеллектуальной обработки документов, при котором традиционные технологии OCR/CV взаимодействуют с LLM/генеративными моделями и AI. Такие интеграции присутствуют на рынке уже сейчас, и большинство экспертов считает, что их число вырастет.

Владимир Андреев, президент компании «ДоксВижн»:

«
Распознавание и интеллектуальный поиск, группировка (кластеризация) и связывание (регрессия) документов давно нашли свое место в системах обработки документов, машинное обучение успешно используется в отдельных специфических областях (например, для нормоконтроля документов, проверки корректности пакетов документов или входящей классификации документов). Наиболее «свежие» технологии – это использование больших языковых моделей (LLM). Кроме того, к интеллектуальной обработке документов можно отнести задачи по оптимизации процессов их обработки, которые объединяются под названием Process Intelligence (в частности, технологии Process Mining).
»

«
Если говорить про сегмент интеллектуальной обработки документов, то в ее основе лежат технологии OCR (в т.ч. ее разновидность ICR) и NLP. (ICR – Intelligent character recognition; интеллектуальное распознавание символов – ред.). Для решения этих задач применяется весь спектр технологий машинного зрения и машинного обучения – от классических эвристических подходов до предобученных генеративных нейронных сетей на архитектуре трансформер. При этом современный тренд – это уход от эвристических подходов и движение в сторону использования ML для решения бо́льшей части задач. Поэтому можно сказать, что сами понятия OCR, ICR или NLP постепенно переходят в разряд задач, которые решаются попутно при применении подхода на основе машинного обучения. Так, например, VLM (Vision Language Model), перспективный подход для извлечения информации из документов, в принципе не подразумевает отдельного этапа OCR в классическом понимании. Вместо этого предобученная на изображениях и текстовых данных мультимодальная лингвистическая модель принимает изображение документа и на его основе генерирует ответ, содержащий данные, которые требуется извлечь из документа. Если говорить про более практические примеры, а VLM сегодня можно назвать скорее перспективным, чем активно применяемым подходом, то внутри задачи OCR на практике классический мультиэтапный конвейер заменяется end-2-end нейронными сетями, которые, принимая на вход изображение текста, на выходе сразу выдают результат OCR. И при этом показывают лучшее качество и устойчивость к искажениям исходных изображений, чем классические подходы. Классический же подход к NLP, подразумевающий ручное создание модели языка и наложение текста на эту модель, полностью уступил место большим генеративным лингвистическим моделям (LLM). LLM позволяют решать задачи NLP с большей гибкостью и универсальностью и с меньшими трудозатратами. Это снижает «порог входа» и позволяет применять технологию для решения задач, которые раньше считались плохо подходящими для автоматизации, – сказал советник генерального директора Content AI Олег Сажин.
»

Григорий Старовойтов, продуктовый аналитик ELMA365 CSP, к ранее названным инструментам интеллектуальной обработки документов добавил ПО для преобразования речи в текст (аудио- и видеозаписей), цифровой архивации данных и ИИ-агенты – программы, работающие автономно от человека, самостоятельно обрабатывающие данные и принимающие решения.

Вадим Петросян, директор по развитию бизнеса ITFB Group, автор EasyDoc (интеллектуальная платформа извлечения, анализа и генерации текстовых данных (OCR, IDP, LLM)), отметил, что сегодня на рынке IDP используются такие технологии: OCR (распознавание текста) – как основа; CV (Computer Vision) – распознавание структуры, таблиц, подписей; ML/AI – для классификации, маршрутизации, предобработки; NLP / NER – для извлечения сущностей, смыслового разбора; LLM – для понимания контекста, работы с неструктурированным текстом; RPA – для автоматизации рутинных операций с документами; интеграция с BPM/DMS/ECM – для полного замыкания процесса.

! Интервью с экспертом

 

Технологиями OCR и ML сегодня никого не удивишь Илья Петухов,
руководитель проектов
по развитию AI-продуктов Directum

 

Импортозамещение — максимальный приоритет для банков. Нам важно обеспечить цифровой суверенитет Алексей Новиков,
первый заместитель директора
департамента бoльших данных РСXБ.цифра

 

2 Технологические перспективы

Илья Петухов, руководитель проектов развития AI-решений компании Directum, считает, что в будущем LLM смогут обрабатывать документы и извлекать из них не только текст и метаданные, но и смысл и просто понимать, о чем документ. Работы в этом направлении, по его словам, уже ведутся.


«
Думаю, в течение года мы придем к отлично работающему сценарию обработки данных с помощью LLM и сможем «поговорить» с любым документом с помощью запросов либо промтов, – сказал Илья Петухов. (Промт/prompt – текстовая команда или описание, которые используются для генерации контента – ред.).
»

Николай Тржаскал, директор по продуктам «Преферентум» компании SL Soft, обратил внимание на рост объема данных и числа документов, требующих обработки и анализа:

«
Большую помощь оказывают большие мультимодальные модели (LMM), которые имеют возможность работать как с текстом, так и с изображениями. С ростом объема анализируемой информации только обработки документа становится недостаточно. Полученные знания необходимо структурировать и сделать доступными для поиска в будущем. Для этого используются технологии векторизации текстов и семантического и векторного поиска. Для последнего необходимы специальные базы данных. Технологии, находящиеся сегодня на передовом крае, вскоре станут такой же частью стандартного инструментария разработчика, как классические реляционные базы данных. В целом, все, что касается превращения информации в доступные знания, будет в ближайшие годы развиваться семимильными шагами, ведь если в 2010 году количество данных в мире оценивалось в 2 зетабайта, то в 2024 г. их стало уже около 145 Збайт, а только за 2025 год добавится еще 40. При этом 80% этих данных – неструктурированные, то есть их восприятие и запоминание человеческим мозгом практически невозможно без предварительной обработки и обеспечения контекстных механизмов поиска.
»

В контексте ЭДО, считает продуктовый аналитик компании ELMA365 CSP Григорий Старовойтов, уместней говорить о дальнейшем развитии уже существующих технологий и создания массовых решений на их основе. Тем не менее в среднесрочной перспективе возможно появление ERP-систем, обслуживающих «цифровые фабрики»: полностью автоматизированное «безлюдное» или с минимальным опосредованным участием человека производство.

Эксперты в ближайшей перспективе ожидают появления типовых предобученных ML-моделей для решения классических задач работы с документами, например, юридической оценки договоров или классификации обращений граждан. Это, считает президент компании «ДоксВижн» Владимир Андреев, существенно удешевит внедрение моделей в практику.

Прогнозируется также эволюция ИИ-агентов от «умных ассистентов» до модулей, автономно осуществляющих бизнес-процедуры не только во внутренней сети предприятия, но и во внешней среде (например, закупки оборудования, найм сотрудников, автоматический учет). Более широкое распространение получит и применение технологий дополненной реальности в проектировании интерфейсов рабочих мест.

Олег Сажин из Content AI сообщил, что в области бизнес-трендов, в том числе основанных на ожиданиях заказчиков от современного IDP-решения, происходит смещение фокуса интеллектуальной обработки данных в сторону задач общей бизнес-автоматизации. Это делает RPA-технологии важным элементом систем интеллектуальной обработки данных и частью этого рынка. Здесь, в дополнение к классическим «скриптовым» подходам, растет роль машинного обучения. Важным трендом становится применение так называемых AI-агентов – технологии, позволяющей автоматизировать сценарии, где присутствует высокая степень вариативности, которую сложно описать в классическом RPA-стиле. AI-агенты имеют внутри LLM и дают возможность пользователю включать их в сценарии автоматизации. AI-агенты, руководствуясь должностной инструкцией и используя элементы классического RPA как свои «глаза и руки», могут решать сложные задачи, алгоритм решения которых трудно описать заранее.

Эксперт центра искусственного интеллекта «СКБ Контур» Дмитрий Иванков обращает внимание на перспективы технологий, связанных с VLM (Visual Language Model), которые могут одновременно работать с изображениями и текстом.

«
На базе таких технологий уже сейчас можно строить вопросно-ответные системы, которые могут довольно неплохо решать задачи обработки документов. Например, распознавать текст на фото или скане документа, отвечать на вопросы по нему, делать суммаризацию, определять наличие печатей и других объектов. Причем со всеми этими задачами справится одна модель, – говорит Дмитрий Иванков.
»

При этом более популярной на рынке он называет связку «OCR+модель для работы с полученным результатом. Прогнозируется в связи с ростом метаданных и накоплением «цифрового следа» автоматизированных процессов повышение интереса к задачам Process Mining, применение методов непрерывной оптимизации бизнес-процессов к параметрам внешней среды предприятия, а также LLM с применением дообучения (supervised fine-tuning) при подготовке и обработке документов.

Несмотря на стремительное развитие мультимодальных языковых моделей (MM-LLM), отмечает менеджер продукта Кирилл Алиулин из Tevian.AI, специализированные решения на базе сверточных нейронных сетей по-прежнему наиболее точно и быстро решают задачу распознавания документов. Такие специализированные решения наименее требовательны к вычислительным ресурсам и легко разворачиваются на инфраструктуре и во внутреннем контуре заказчика, обеспечивая конфиденциальность данных.

В ближайшей перспективе, считает Олег Сажин, можно ожидать прогресса в области автоматизации машинного обучения (AutoML). Так как использование ML-моделей – это четко регламентированный и итеративный процесс, основанный на обработке данных, обучении модели и оценке результатов, то его можно автоматизировать. С помощью AutoML уже можно оптимизировать различные этапы машинного обучения – предварительную обработку данных, настройку гиперпараметров, оценку производительности моделей. В дальнейшем можно ожидать расширения возможностей AutoML, появления новых инструментов, увеличения мощности и способности решать более сложные задачи. Следующим за AutoML этапом идут автономные самообучающиеся системы. В среднесрочной перспективе системы смогут учиться на основе новых данных без вмешательства человека, улучшая свою точность и эффективность.

Алексей Хахунов, сооснователь компании Dbrain, обратил внимание на self-supervised learning в контексте обучения моделей. Технология позволяет обучать модели без использования гигантских массивов размеченных данных и при этом сохранять высокую точность. Это решает главную проблему, связанную с трудоемкой и дорогостоящей разметкой документов.

Также он напомнил о технологии блокчейн, позволяющей надежно и прозрачно проверять подлинность документов. В Европе, по словам Алексея Хахунова, технология уже прижилась, а через несколько лет может стать универсальным стандартом подтверждения подлинности данных.

В ближайшей и среднесрочной перспективе, считает Александр Воробьев из компании Haulmont, будет развиваться группа технологий, включающая в себя Data Science, Big Data, Machine Learning, в результате работы которых из массивов данных извлекаются неочевидные закономерности и последовательности (например, предиктивная аналитика – ред.).

«
Сейчас сложно сказать, какие конкретно инструменты появятся в результате развития этих технологий, – говорит Александр Воробьев, – Из наиболее значимых инструментов, которые появились недавно, стоит упомянуть генеративные модели, работающие с несколькими типами данных одновременно и позволяющие распознать информацию с документа без извлечения текстового слоя.
»

Директор департамента по маркетингу корпорации «ЭЛАР» Артем Вартанян считает, что сейчас рынок сконцентрирован на внедрении генеративного ИИ как в решение отдельных задач, так и в проектирование национальных технологических инноваций. Поэтому применение генеративных нейросетей и является де-факто технологией переднего края на рынке.

Вадим Петросян (ITFB Group) ожидает появления узкоспециализированных LLM для юридических, финансовых и медицинских документов, AI-ассистентов по работе с содержанием документов в СЭД, самообучающихся на пользовательских данных ML-моделей, структуризации PDF/сканов в редактируемые форматы (AI-ассистированная верстка/восстановление документов). Идет развитие в направлении работы с данными в Document QA на уровне «понимания».

!Актуальные продукты

 

 

3 Целевая аудитория IDP

В целом интеллектуальная обработка документов востребована в тех отраслях и компаниях, где административные и бизнес-процессы связаны с использованием бумажных носителей информации, изображения которых важно хранить и/или анализировать для каких-либо целей. Чем больше масштаб операций и ниже уровень цифровизации, тем больше будет объем обрабатываемых документов и более востребованы технологии для их обработки.


Эксперты отмечают, что на рынке интеллектуальной обработки документов большинство решений – «коробочные», эффект от их внедрения возникает в течение короткого интервала времени и позволяет автоматизировать рутинные операции, а также повысить эффективность обработки данных обратной связи, например, при получении заявок, заявлений, обращений. Это могут быть предприятия любой формы собственности и любого размера, организации и учреждения в госсекторе, такие, к примеру, как бухгалтерия, канцелярия, отдел кадров, МФЦ, другие ведомства, ведущие работу с обращениями граждан. Здесь технологии ИИ могут дать существенный эффект в виде сокращения срока обработки документов и/или увеличения объема обработки и в целом снизить операционные расходы.

Функциональную (по типам задач) дифференциацию внедрения решений по интеллектуальной обработке документов отметил и Илья Новосельцев, директор по новым разработкам компании Rubius:

«
Заказные решения для обработки данных, сделанные под конкретную компанию и с учетом особенностей ее бизнес-процессов, более востребованы в крупных компаниях. Там это обусловлено экономически. Объем входящей и исходящей документации достаточно велик, людей, которые с ним работают, много. Любая автоматизация тут же приносит значительный профит. Среди приоритетных кейсов применения ИИ – обработка тендеров, анализ и генерация шаблонной документации: актов, справок, пояснительных записок и прочего. Отдельный большой тренд – создание корпоративных баз данных с ИИ-помощниками. Они решают проблему неравномерного распределения информации по компании. Здесь ситуация такая же, как с чат-ботами в клиентском сервисе: только чат-боты работают на внешнюю аудиторию и снимают нагрузку со службы поддержки, а корпоративные ИИ-помощники помогают решать вопросы внутри. Помимо этого, компании ищут возможности превращать бумажные документы в цифровые. Например, в логистике обдумывают внедрение цифровых архивов для старой бумажной документации. Это упростит поиск, сократит издержки.
»

При этом, отмечают специалисты, предприятия госсектора менее охотно внедряют новые технологии, чья безопасность и надежность не проверена практикой. Предприятия малого и среднего бизнеса в этом смысле более подвижны и в некоторых сферах активно экспериментируют с ИИ-инструментами, например, для быстрого и дешевого производства контента (озвучка, визуальный и саунд-дизайн, 3D-моделинг).

Николай Тржаскал из компании SL Soft придерживается точки зрения, что драйвером развития в сегменте являются госсструктуры и крупные корпорации. В то же время он указал на объективные сложности внедрения интеллектуальной обработки документов:

«
Она востребована везде, не только бизнесом, но и частными пользователями. К сожалению, объективные и субъективные факторы мешают быстрому продвижению систем во всех направлениях. Из объективных стоит выделить высокую стоимость внедрения и владения решениями, поскольку за пределами классического OCR пока не начал формироваться рынок готовых облачных или десктопных продуктов, способных полностью удовлетворить малый и средний бизнес, равно как продвинутых частных пользователей. Госсектор оказывается в тисках ограниченных бюджетов и невозможности заключения контрактов с бюджетированием на несколько лет вперед. Соответственно, развитие систем происходит «урывками» – каждый год по чуть-чуть, что не позволяет простроить долгосрочные программы модернизации, подкрепленные контрактными обязательствами. Поэтому на текущий момент основными драйверами в интеллектуальной обработке документов становятся предприятия и крупный бизнес, для которых это не просто модное веяние и часть национального проекта, а вполне практический вопрос экономии средств, повышения эффективности и снижения рисков ошибок, влекущих за собой репутационные и финансовые потери.
»

Алексей Хахунов, сооснователь Dbrain, детализирует потребности в ИОД (интеллектуальная обработка данных - ред.) для разных сегментов рынка. По словам эксперта, госсектор автоматизирует обработку налоговых деклараций, государственных контрактов, электронных досье граждан. Для ПО ключевыми требованиями являются стабильность и соответствие нормативным требованиям.

Крупный бизнес внедряет ИОД для комплаенса, юридического контроля и оптимизации документооборота на уровне компании. Средний и малый бизнес предпочитает облачные сервисы и готовые SaaS-решения, которые легко запустить и интегрировать с минимальными затратами.

Интеллектуальная обработка данных, считает Олег Сажин (Content AI), применима во всех отраслях экономики. В государственных структурах IDP-решения наиболее востребованы для обработки обращений граждан. Это сложная задача с учетом многообразия тем, видов и форматов заявлений. В правительстве Российской Федерации рассматриваются различные варианты унифицированной автоматизации этого процесса.

ИОД, по мнению Олега Сажина, должна стать ключевым инструментом работы для государственных организаций, так как она позволяет анализировать текущее состояние различных отраслей, фиксировать динамику изменений, выявлять тенденции, будь то анализ демографических процессов, загрузка дорожно-транспортной сети, мониторинг экологического состояния. Полученная информация должна использоваться для координации действий, своевременного реагирования, корректировки текущих процессов и планов.

Как рассказал Вадим Петросян (ITFB Group), в госсекторе локализован максимальный спрос на импортонезависимые решения, автоматизацию заявлений, проверок, в то время как крупному бизнесу (прежде всего банкам, страховым, телекому) стали важны потоковые процессы, требования к IDP по скорости и масштабу. В сегменте СМБ спрос набирает обороты, чаще в формате SaaS или коробочных решений.

4 Роль искусственного интеллекта

ИИ и ML, по мнению большинства экспертов, продолжают оставаться ключевыми технологиями на рынке интеллектуальной обработки документов. Их влияние на рынок ИОД сохранится и даже возрастет. Доминирование технологий AI и ML, как считают некоторые эксперты, будет сохраняться до реального технологического прорыва в области квантовых вычислений.


В то же время ряд экспертов считает, что на сегодняшний день ключевыми на рынке ИОД являются Low-code/No-code-платформы, облачные технологии, технологии блокчейн.

Интерес к ИИ, как отмечает менеджер по развитию компании Rubius Илья Орлов, не уменьшается. Большой интерес заказчики из промышленного сектора (нефтехимия, ТЭК, производство удобрений) проявляют к предиктивной аналитике, системам поддержки принятия решений. По мнению эксперта, это связано с тем, что уже к 2023 году компании накопили значительные датасеты и ищут возможность их монетизировать.

Илья Орлов в качестве примера важности предиктивной аналитики привел задачу предсказания спроса на электроэнергию, активно обсуждаемую промышленными предприятиями. Актуальность задачи связана с характеристиками производства и потребления электроэнергии в индустриальном сегменте: стоимость электричества для потребителя зависит от того, насколько точно он указал необходимый ему объем электроэнергии. Компании рассчитывают объем потребления и подают прогнозы в генерирующие компании. Если прогноз оказывается неточным – превышение по расходу тарифицируется по более высокой цене, и разница ощутима. Следовательно, чем точнее прогноз, тем меньше денег компания заплатит за электричество. Для многих производств это существенная расходная часть, подытожил эксперт.

Эксперты считают, что в большинстве случаев интеграции «AI+хранилище данных» или «AI+BPM» повышают итоговую эффективность работы всей системы, делая ее более гибкой и удобной для пользователей.

«
Сейчас наметился тренд на сквозные процессы и необходимость свести все системы в один ландшафт, как следствие – необходимы максимально гибкие инструменты ИИ с самыми широкими интеграционными возможностями. Однако на практике пока сложно представить такой ИИ, поскольку у каждой ИТ-системы заказчиков своя специфика. Мы стремимся реализовать максимально близкий к этому вариант. Гибкость инструментария позволяет при помощи искусственного интеллекта оптимизировать любой процесс в системе, а поскольку СЭД сейчас часто выступает в роли CSP, то это позволяет подключить ИИ к максимально широкому спектру процессов заказчиков, – сказал Александр Воробьев.
»

С точки зрения трендов интеграции, считает Олег Сажин (Content AI), очевиден рост популярности IDP-решений в связке с RPA и ИИ. Такие проекты реализуют многие крупные заказчики. Примеры интеграции ИИ (LLM) и BPM встречаются на международном рынке. В России есть большой интерес к этому технологическому решению, однако примеров реального применения таких технологий к существующим процессам пока нет. Можно с высокой долей уверенности предположить, что они появятся в перспективе нескольких лет. Работа в направлении интеграции новых технологий имеет большое значение для устойчивости компаний на рынке, перспектив их развития. Этот фактор выйдет на первый план после того, как импортозамещение перестанет быть ключевым драйвером рынка.

Вадим Петросян (ITFB Group) считает, что интеграция с хранилищами (DWH, S3, MinIO), BPM и ERP усиливает конкурентоспособность, ведь клиенты ценят гибкость и бесшовность. Что касается ИИ и ML, то, по мнению эксперта, они становятся неотъемлемой частью любой системы обработки документов – от извлечения до аналитики. Без ИИ автоматизация уже невозможна.

5 Импортозамещение в IDP

Большинство экспертов уверены, что импортозамещение в сегменте интеллектуальной обработки данных является значимым фактором, влияющим как на финансовые, так и на технологические результаты компаний, занимающихся внедрением СЭД, анализом документов и разработкой ML-моделей.


Фокусом импортозамещения в сфере интеллектуальной обработки документов, по мнению ряда из них, является обеспечение работы LLM на отечественном оборудовании (CPU и GPU). Работы в этом направлении ведутся даже по нескольким направлениям. Одно из них – использование LLM на устройствах, не требующих высокопроизводительного оборудования, например, смартфонах. Второе – разработка российских серверов с GPU. Эксперты оценивают количество таких серверов, которые произведут в 2025 году, в 100 штук.

Импортозамещение также будет востребовано в таких направлениях как унификация (замена или интеграция разнородного ПО в рамках единой платформы), обеспечение конфиденциальности информации и персональных данных, отказоустойчивость.

По многим показателям, сообщил Алексей Хахунов из Dbrain, российские системы не просто сравнимы, а превосходят зарубежные аналоги в обработке сложных типов документов, характерных именно для России (например, нестандартных форм договоров и бланков). Это повышает интерес к отечественным решениям и стимулирует отрасль к дальнейшему развитию.

Александр Воробьев из компании Haulmont, говоря об импортозамещении, отметил, что во многих организациях иностранные СЭД были внедрены давно и уже технологически устарели. Изначально их развитие и модернизацию затрудняли архитектурные особенности, но в последние два года появились также сложности с приобретением лицензий и взаимодействием с иностранными вендорами. Возможность использования ИИ становится одной из составляющих технологического апгрейда. При этом СЭД и до активизации в последние два года тренда на импортозамещение заменяли иностранные продукты, в том числе, в высоконагруженных проектах.

Вадим Петросян, директор по развитию бизнеса ITFB Group, считает импортозамещение ключевым драйвером роста, особенно для госсектора и госкорпораций. Оно стимулирует развитие отечественных OCR, NLP и платформенных решений.

6 Востребованность различных форматов использования систем

При оценке востребованности форматов интеграции некоторые эксперты, в частности, Илья Петухов из компании Directum, считают, что приоритетным будет встраивание технологий ИИ в существующие продукты. Применительно к моделям SaaS специалист отмечает, что 81% крупных компаний не готовы использовать облачные сервисы. Для предприятий малого и среднего бизнеса скепсиса меньше, а готовности использовать облачные ИИ-сервисы больше.


Похожего мнения придерживается Григорий Старовойтов из ELMA365 CSP. По его мнению, движение в сторону «экосистем», интегрированность с различным ПО и возможность работы в режиме «единого окна» станут трендом в ближайшей перспективе.

Николай Тржаскал из SL Soft считает, что ИИ должен быть не только модным, но и экономным. Добавить интеллектуальные функции без необходимости менять стабильно работающие системы – и есть самый экономичный путь. Поэтому приоритетом, по его мнению, является возможность интегрировать ИИ-решения в существующие системы СЭД, ERP и BPMS от самых разных производителей.

Артем Вартанян из корпорации «ЭЛАР» отмечает, что в виде SaaS интеграция ИИ в системы ИОД наименее востребована, так как при таком формате необходимо передавать документы из внутренних систем заказчика во внешний сервис. Заказчики же в большинстве своем не готовы передавать документы для обработки на сторонние ресурсы. Кроме того, по модели SaaS сложно автоматизировать обработку всего потока поступающих документов, в этом случае часть данных обрабатываются локально с помощью ручного труда, что влечет повышение трудозатрат и снижение скорости ввода документов в корпоративные информационные системы.

Поэтому, считает Артем Вартанян, большинство заказчиков предпочитает внедрять системы обработки локально. Стратегия внедрения связана исключительно с процессами внутри организации заказчика. Если основные процессы реализуются в системе документооборота, то одним из оптимальных решений будет установка модуля обработки документов в уже функционирующую, привычную для заказчика систему. Но СЭД – не единственный вариант модульного применения ИИ. Наиболее востребованная концепция – ECM-платформа, выступающая в качестве корпоративного хранилища данных. С ней можно связать бухгалтерские, учетные системы на базе ERP, кадровые системы на базе КЭДО, СЭД, системы автоматизированного проектирования, CRM-системы, а для банков и финансовых организаций также автоматизированные банковские системы. Все программные платформы направляют свои данные в единое окно в виде ЕСМ-платформы, где модуль ИИ категорирует, нормализует, классифицирует, разбирает, обрабатывает документы и загружает данные в разделы единого корпоративного хранилища. За счет этого компания получает единое окно и для обработки, и для нормирования данных, исключает дублирования и ошибки и объединяет всю информацию в одной системе, что позволяет гибко выстраивать процессы поиска и формировать консолидированные подборки документов в разных жизненных ситуациях.

Аналогичной позиции придерживается Олег Сажин из Content AI:

«
На российском рынке в значительной мере преобладают проекты, в которых IDP-решения или дополнительные модули интегрируются в используемые системы документооборота или устанавливаются отдельно, но, что важно – только on-premise (локальное решение – ред.). Заказчики предпочитают оперировать информацией и хранить ее во внутреннем контуре. Такая позиция особенно характерна для отраслей, которые работают с чувствительными данными – персональными и финансовыми.
»

Вадим Петросян (ITFB Group) считает интеграцию в ECM/EDMS приоритетом в крупном бизнесе и госсекторе; SaaS – популярен в СМБ, особенно после пандемии; что же касается модулей, то они актуальны, если ИИ-функциональность встраивается в уже существующие процессы.

7 Финансовые итоги 2024 года и прогнозы экспертов

На рынке электронного документооборота на протяжении 2024 года наблюдался восходящий тренд, считает Григорий Старовойтов и прогнозирует стабильный рост в сопоставимых темпах и на 2025 год. Драйверами роста, по его мнению, будут выступать импортозамещение, развитие нормативной базы и эволюция СЭД в Content Services Platform (CSP).


Прогноза о росте рынка в 2025 году придерживается и Илья Петухов из Directum. Он считает, что ИИ для обработки данных – это тиражируемо, эффективно и доступно по цене. В 2024 году рост рынка «коробочных» решений с ИИ составил в количественном отношении порядка 50%, в 2025 году тенденция сохранится.

С ними согласен Дмитрий Иванков из «СКБ Контур». Свое мнение он подкрепляет тем, что многие организации до сих пор используют бумажные носители в своих процессах. Многие документы даже не оцифрованы, но потенциально содержат в себе большое количество данных, которые можно использовать для управления деятельностью компании.

Кирилл Алиулин из Tevian.AI отмечает, что в 2024 году направление интеллектуальной обработки документов показало внушительный рост выручки. Рынок достаточно зрелый и насыщенный, однако есть ниши с неудовлетворенным спросом, поэтому рост, по его оценке, продолжится.

Похожего мнения придерживается и Александр Воробьев из Haulmont. По его мнению, сегмент ИОД испытывает взрывной рост и тенденция сохранится и в ближайшем будущем.

По оценке Content AI, которую озвучил Олег Сажин, на отечественном рынке проекты импортозамещения занимают от 30 до 50% от всех реализованных. Начиная с 2022 года отечественные вендоры занимают освободившиеся на рынке ниши. Вендоры, чьи решения обладают развитой функциональностью, высокой производительностью, совместимостью с отечественными операционными системами, надежностью, устойчивостью, могут рассчитывать на устойчивый рост выручки.

«
В 2024 году рынок интеллектуальной обработки информации продолжил рост. Так, Content AI увеличила выручку более чем на 55%, по сравнению с 2023 годом. По итогам 2024 года она составила 1,2 млрд рублей. Рост рынка в первую очередь обусловлен проектами импортозамещения в крупных компаниях. Текущая конъюнктура позволяет предполагать, что в перспективе 2-3 лет этот рост продолжится. Это связано с длительностью цикла сделок у крупных заказчиков, которые были начаты в 2023 и 2024 гг. и будут полностью реализованы в 2025-26 гг., доработкой функциональности отечественных продуктов, которую ждали заказчики.
Олег Сажин, советник генерального директора Content AI
»

Директор по развитию бизнеса ITFB Group Вадим Петросян отметил рост рынка в 2024 году, особенно за счет цифровизации госуслуг и банков. Перспективой 2025-2026 гг. эксперт видит устойчивый рост: драйверами станут ИИ, импортозамещение, цифровая трансформация.

8 Заключение

Технологические решения для ИОД становятся проще в использовании, а эффект от их применения – более ощутимым. В ближайшее время восходящий тренд продолжится, а компании, внедряющие ИИ-платформы, укрепят свои позиции на рынке. С таким утверждением согласны все эксперты, принявшие участие в опросе TAdviser.

Многие эксперты считают экспансию технологий и инструментов ИИ в сфере ЭДО и интеллектуальной обработки документов неизбежной и желательной. Кроме того, интеграция ИИ и СЭД, ИИ и BPM дает дополнительные преимущества таким комплексным решениям, а для заказчиков наличие интеграций является дополнительным фактором выбора в пользу такого продукта. Интеграционные возможности ПО для распознавания документов повышают ценность продукта и способствуют удержанию клиентов.

Есть также спрос со стороны бизнес-структур и государственных учреждений на унификацию ЭДО, переход от разнородных специализированных систем к единой/унифицированной, обладающей аналогичной функциональностью.

ИИ и ML продолжают оставаться ключевыми технологиями на рынке интеллектуальной обработки документов и, как считают некоторые эксперты, будут пребывать в этом качестве до реального технологического прорыва в области квантовых вычислений.

Дальнейшие перспективы рынка интеллектуальной обработки документов и отечественного ИТ-рынка в целом будут в значительной степени определяться общим политическим и экономическим положением в стране, перспективами взаимодействия с международным сообществом, доступом к передовым технологиям.

! Читайте также