ИИ-кейсы

Автоматизация учета чеков для бухгалтерии через ИИ-распознавание

Система обрабатывает любые форматы документов - от фотографий чеков до защищенных PDF-инвойсов, автоматически извлекая суммы, даты и назначения платежей с точностью 99%+.

/ПРОБЛЕМА КЛИЕНТА

Инжиниринговая компания в США, производящая телекоммуникационное оборудование, столкнулась с критической проблемой учета расходов.

Более 100 чеков и квитанций о закупках материалов, инструментов и оборудования ежедневно отправляются. Существующий процесс был катастрофически неэффективен.
Сотрудники скидывали чеки в общий Telegram-чат, бухгалтер ставил лайки для подтверждения получения. В такой "чехарде" множество документов терялось.

На обработку каждого чека тратилось время на:
  • Ручное извлечение суммы из документа
  • Определение даты операции
  • Придумывание и присвоение категории расходов
  • Ввод данных в учетную систему
Проблема:
  1. 3-4 часа ежедневной рутинной работы бухгалтера только на первичную обработку документов. При стоимости американского труда это означало значительные операционные расходы.
  2. Чеки приходили в абсолютно разных форматах - фотографии с заправок, PDF-инвойсы с почты, банковские выписки, рукописные документы. Никакой единой структуры не существовало.

/ЗАДАЧА

Создать автоматизированную систему учета первичных документов с несколькими критическими требованиями:

  • Система должна распознавать любые форматы - от плохо сфотографированных чеков до защищенных PDF-документов.
  • Автоматическое определение суммы, даты операции и назначения платежа из неструктурированного текста.
  • Система должна понимать и автоматически разносить расходы по управленческим категориям (стройматериалы, топливо, инструменты, оборудование).
  • Максимально простой процесс для сотрудников и удобная CRM-система для бухгалтера.
  • Минимизация ошибок распознавания и надежность системы для снижения необходимости ручной проверки.

/СУТЬ ПРОЕКТА

Рынок изобилует OCR и автоматизационными решениями, но все они имели критические недостатки для быстрого и экономичного внедрения. Главным вызовом стало создание системы, способной обрабатывать абсолютно любые документы без месяцев настройки и интеграции.

Проблемы схожий систем-решений:
  • Существующие OCR-системы плохо справлялись с разнообразием форматов
  • Малая гибкость систем автоматизации для бухгалтера
  • Отсутствие демо версий и высокая стоимость корпоративных решений при неясном ROI

Технические сложности:
  • Некоторые PDF-инвойсы оказались защищенными - стандартные экстракторы не могли извлечь текст
  • Чеки фотографировались в разных условиях освещения и качества
  • Отсутствие единой структуры документов исключало возможность обучения модели на конкретном типе

Требования к архитектуре:
  • Система должна быть максимально простой для быстрого внедрения
  • Полный контроль над процессом и данными
  • Возможность масштабирования и адаптации
  • Минимальные операционные расходы

/РЕШЕНИЕ

Создали интеллектуальную систему распознавания и обработки документов с многоуровневой архитектурой:
  • Платформа-оркестратор N8N
  • Канал коммуникации Telegram
  • Возможные каналы коммуникации в будущем WhatsApp, Email
  • Распознавание изображений Mistral OCR
  • LLM-система для анализа ChatGPT 5
  • CRM-система Airtable

1. Универсальный прием документов

Telegram-бот принимает любые форматы документов:

  • Фотографии чеков (JPEG, PNG)
  • PDF-документы и инвойсы
  • Банковские выписки
  • Рукописные документы
Каждый файл автоматически загружается в Airtable для дальнейшей обработки.

2. Интеллектуальное распознавание с резервированием

Двухэтапная система распознавания:

Этап 1 - Первичное распознавание:
  • PDF → стандартный экстрактор текста
  • Изображения → Mistral OCR (специализация на сложных документах)

Этап 2 - Обработка ошибок: Проверка достижения 90%+ успешности распознавания и решение ошибок (если PDF-экстрактор не смог получить данные или файл защищенный):
  • Конвертация PDF в изображение через API
  • Повторное распознавание документа как изображения

3. Принцип "четырех глаз" для критических данных

Для повышения точности извлечения ключевых данных используется параллельная проверка:
  • Первичное распознавание основной моделью
  • При неопределенности - дублирование через GPT Vision и Google Cloud Vision
  • Сравнение результатов и выбор наиболее вероятного варианта
  • Обозначение спорных моментов для ручной проверки

4. Структурирование неструктурированных данных

ИИ-система извлекает из хаотичного текста:
  • Общую сумму (не постатейно, а итоговую)
  • Дату операции (если отсутствует - дата загрузки)
  • Назначение платежа с автоматической категоризацией
  • Дополнительную информацию (возвраты, рассрочки, отмены)

5. Элегантный процесс в 15 нодах

Компактная система из 15 нод обеспечивает полный цикл:

  • Прием и первичная обработка файла
  • Распознавание и извлечение текста
  • ИИ-анализ и структурирование
  • Категоризация и валидация
  • Сохранение в CRM с соответствующим статусом
Ссылка на готовые файлы для личного тестирования бота: Google Drive

/РЕЗУЛЬТАТ

Система продемонстрировала выдающиеся результаты автоматизации:

✅ 600+ документов уже обработано автоматически без участия бухгалтера

✅ 99%+ точность распознавания данных (1 ошибка на 100 документов)

✅ 10+ часов экономии рабочего времени бухгалтера еженедельно

✅ ROI до x100 окупаемость вложений в разработку

✅ 3-4 часа ежедневно освобождено от рутинной работы
Для сотрудников: Простая отправка чека в момент получения - больше никаких потерянных документов и напоминаний бухгалтера.

Для бухгалтера: Переход от рутинной обработки к аналитической работе. Все документы структурированы, проверены и готовы к учету.

Для бизнеса: Полная прозрачность расходов в реальном времени, точная категоризация для управленческой отчетности.

Масштабируемость: Система адаптируется под любой объем документооборота и легко настраивается под специфику различных бизнесов.

Цифровой актив: Готовое решение, которое работает 24/7 без отпусков, больничных и человеческих ошибок. Система становится активом компании, способным обрабатывать документы на любом языке и в любом формате.
Arthur Klintsevich
CEO TechConstruction

Искренне благодарю команду за создание системы автоматизации учета расходов, которая кардинально изменила нашу ежедневную работу! Больше 100 наших инженеров теперь просто отправляют чеки в Telegram-бот, а наш бухгалтер получает уже структурированные данные вместо хаоса из сотен документов разных форматов.
Система безошибочно распознает даже самые сложные PDF-инвойсы и плохо сфотографированные чеки, что упрощает жизнь и работу.
За первый месяц работы обработано уже порядка тысячи документов с высокой точностью, понятно, что первое время бухгалтер ещё проверяет каждый чек, чтобы удостоверится в надежности решения, но это все больше мотивирует использовать новый инструмент для упрощения своей работы.
И самое главное - мы получили полный контроль над процессом и можем масштабировать систему под любые потребности нашего растущего бизнеса и изменять каждый интересующий нас параметр, если это требуется!