CNews.ru,
6 сентября 2024 г.
Как научить ИИ «читать» бумажные страховые претензии 263 просмотра
Страхование традиционно связывают с большим количеством бумажной работы.
Проникновение ИТ позволило частично изменить эту ситуацию и повысить скорость работы страховых компаний. Однако «узким местом» на пути тотальной цифровизации страхования до сих пор остается большой объем неструктурированных данных, которые приходится обрабатывать вручную: фотографий, сканов гарантийных писем, претензий, актов и других документов.
О том, как разработчик российской цифровой платформы сопровождения страхования грузоперевозок Zunami — ИТ-компания «Инносети» — решает эту проблему с помощью инноваций в сфере искусственного интеллекта, рассказал ее генеральный директор Артем Ефимов.
Постановка задачи
На высококонкурентном страховом рынке скорость имеет решающее значение. На это в первую очередь влияет опыт, полученный страхователями в других сферах. Зная, что оформить заявку на кредит в приложении банка можно за пять минут, клиент справедливо ждет, что его страховой случай тоже рассмотрят быстро.
Автоматизация обработки и анализа документов даст существенный скачок в эффективности обслуживания страхователей. Ручная обработка сканов и фотографий не только занимает значительное время операторов, но и подвержена риску человеческой ошибки. Показателен пример из медицинской сферы — по оценкам Американской медицинской ассоциации, уровень ошибок при оформлении страховых случаев по медицинской страховке достигает 20% и приводит к потерям в размере около 20 млрд долларов ежегодно.
В рамках нашей цифровой платформы сопровождения страхования грузоперевозок Zunami уже запущены сервисы по роботизации урегулирования претензий, автоматическому поиску страхового мошенничества и расчету тарифов с использованием ИИ. Поэтому мы видели перспективу и в сервисе автоматического распознавания документов: он ускорит проверку документов, повысит их точность и сократит расходы клиентов.
Подход к решению
Уже более пяти лет мы специализируемся на работе со сложными технологиями, в том числе с блокчейном и искусственным интеллектом. Поэтому решили подойти к проблеме неструктурированных клиентских данных с использованием нашего накопленного опыта в сфере инноваций.
Проект по автоматическому распознаванию документов было решено реализовать в рамках внутренних R&D-процессов компании (Research and Development — «исследование и разработка», или НИОКР). По пути собственной R&D-разработки мы пошли не просто так. Дело в том, что существующие на рынке решения имеют ограниченные возможности кастомизации, что приводит к их низкой эффективности при использовании в узких сегментах. А в нашем случае при обработке претензий как раз приходится работать с нестандартными документами, зачастую не имеющими заранее заданной структуры.
Кроме того, в силу специфики обрабатываемой информации сервис должен работать в закрытом контуре. На платформе Zunami аккумулируется большой объем чувствительных данных, работа с которыми требует соблюдения правил безопасности и конфиденциальности. Поэтому мы не могли использовать готовые облачные решения, которые работают на удаленном сервере разработчика.
Наконец, проведение R&D позволяет команде глубже погрузиться в современные технологии и архитектуры моделей. Это позволит нам в будущем строить новые гипотезы и модели, внедрять инновации, повышая тем самым конкурентоспособность и способствуя дальнейшему развитию и бизнеса, и отрасли в целом.
В компании реализован гейтовый подход к инновациям, который после признания идеи потенциально успешной предполагает разработку MVP (Minimum Viable Product — «минимально жизнеспособный продукт»). Это недорогой и быстрый способ удостовериться в том, что проект может быть реализован и экономически успешен.
Реализация проекта
В рамках MVP было запланировано запустить сервис для распознавания документов одного определенного типа. Также мы сформулировали требования к модели, которые планировалось получить при внедрении:
Ускорение времени на загрузку и проверку документов. Увеличение точности в классификации и извлечении информации из документов. Круглосуточная работа системы. Обработка больших объемов информации. Снижение рисков человеческого фактора.
Проанализировав базу документов, мы выяснили, что приблизительно 66% файлов, передаваемых вместе с претензией, имеют редактируемый формат. Для извлечения текста достаточно использовать библиотеку для парсинга из PDF, такие как PDFium или PyPDF2. Однако продукт должен уметь не только для загружать текстовую информацию, но и определять все ли пункты заполнены, в решении должна присутствовать модель, извлекающая визуальную информацию. Это задача уже посложнее.
Для выбора подходящего алгоритма мы провели глубокий анализ существующих технологий. Учитывали их доступность для русского языка, возможность дообучения, наличие полного репозитория и поддержки со стороны разработчика. В результате исследования нами были отобраны три решения из группы моделей на архитектуре Transformer и Phi3 на базе MLLM (мультимодальные большие языковые модели).
Чтобы выбрать наиболее эффективное решение, мы провели тесты каждого из них. Результаты показали, что модели на базе Transformer требуют большого количества высококачественных изображений для эффективного обучения. В отличие от них, модель Phi3 эффективно распознает текст без необходимости «скармливания» ей огромного количества данных, что сокращает затраты при сопоставимых результатах. К тому же она изначально поддерживает русский язык и демонстрирует высокую производительность.
Тем не менее Phi3 имеет ограничения: она подходит не для всех задач. В частности, из-за нечетких или слишком мелких полей в документах, таких как паспорт, модель может не справляться с извлечением данных. Это ограничивает ее использование в определенных случаях, несмотря на выдающиеся общие характеристики. Поэтому в финальной версии мы дополнительно использовали комбинацию из двух моделей — то, что Phi3 не может выполнить самостоятельно, берет на себя Transformer.
В ходе экспериментов было выяснено, что такая комбинация имеет высокую способность к распознаванию. Сейчас процесс подачи и обработки претензии занимает в среднем три минуты. После внедрения сервиса мы ожидаем сокращения общего времени на 50%. Так что на следующем этапе планируем полноценно внедрить MVP в пайплайн работы.
Перспективы решения
На данном этапе проект демонстрирует жизнеспособность идеи по внедрению сервиса. Высокие оценки моделей позволяют предположить, что сервис способен повысить оперативность и внести значительный вклад в улучшение качества обслуживания клиентов, поддерживая высокие стандарты и инновационное развитие в компании. В дальнейшем мы планируем:
Обучить модели для распознавания различных типов документов.
Внедрить модель, которая будет подсказывать пользователю, какие документы необходимо догрузить для успешной заявки на урегулирование убытка.
Обеспечить автоматическое заполнение форм на базе обработанных документов для обеспечения дальнейшей автоматизации бизнес-процессов.
Решение может оказать значительное влияние на рынок страхования грузоперевозок и еще больше стимулировать экспедиторов и грузовладельцев цифровизировать страховые процессы. Мы ожидаем, что внедрение такого сервиса поднимет планку качества обслуживания на рынке и клиентского опыта.
Эффективное использование данных и автоматизация процессов могут также способствовать более строгому соблюдению законодательства и регулятивных требований, что укрепит доверие к отрасли страхования в целом. Проект может стать катализатором для дальнейших исследований и разработок в области искусственного интеллекта и его применения в страховой и логистической сферах.
Вся пресса за 6 сентября 2024 г.
Смотрите другие материалы по этой тематике: Управление, Страхование грузов, Хайтек и инновации
Установите трансляцию заголовков прессы на своем сайте
|
|
 |
Архив прессы
|
|
|
 |
Текущая пресса
 |
| |
27 апреля 2026 г.

|
|
Finversia.ru, 27 апреля 2026 г.
Хедж-фонды ставят на падение страховщиков

|
|
Ставропольская правда, 27 апреля 2026 г.
Аграрии Ставрополья первыми включились в весеннее страхование посевов

|
|
РБК.Вологда, 27 апреля 2026 г.
Суд обязал страховщика выплатить вологодскому предприятию 13 млн руб.

|
|
Российская газета онлайн, 27 апреля 2026 г.
Эксперты объяснили схему получения компенсации при падении дерева на машину

|
|
Известия онлайн, 27 апреля 2026 г.
Страховщики рассказали о выплатах за повреждение автомобилей в непогоду

|
|
МК во Пскове, 27 апреля 2026 г.
Бюджет ФОМС в Псковской области увеличат на 402 миллиона рублей

|
|
Известия, 27 апреля 2026 г.
База подданных: ИНН может стать основным документом для работы с банками

|
|
Интерфакс-Юг, 27 апреля 2026 г.
Аграрии Ростовской области в 2026 г застраховали с господдержкой свыше 1,2 млн га озимых

|
|
Право.Ru, 27 апреля 2026 г.
Больнице разрешили выплачивать зарплату из средств ОМС

|
|
ГТРК Ставрополье, 27 апреля 2026 г.
На Ставрополье на помощь онкобольным направят более шести миллиардов рублей

|
|
AK&M, 27 апреля 2026 г.
UniCredit увеличил долю в итальянской страховой компании Generali до 9%

|
|
cbr.ru, 27 апреля 2026 г.
Банк России расширяет возможности доступа к сводной информации об участниках финансового рынка

|
|
cbr.ru, 27 апреля 2026 г.
Решения Банка России в отношении участников финансового рынка

|
|
BFM.Ru, 27 апреля 2026 г.
В Калифорнии могут ввести налог для миллиардеров

|
|
KrasnodarMedia, 27 апреля 2026 г.
Пляжный полис не спасёт в горах: эксперт Чернов раскрыл, как выбрать страховку

|
|
ТАСС, 27 апреля 2026 г.
Юрист Сбитнев: ОСАГО не покроет расходы на ремонт после падения дерева при стихии

|
|
Деловой Петербург (on-line), 27 апреля 2026 г.
ДМС в новых условиях: курс на устойчивость и качество

|
 Остальные материалы за 27 апреля 2026 г. |
 Самое главное
 Найти
: по изданию
, по теме
, за период
 Получать: на e-mail, на свой сайт
|
|
|
|
|
|