Быстрое извлечение реквизитов из карточки контрагента, счета или акта

от автора

Распознование документов

Распознование документов

Привет, Хабр!»

Каждый, кто работает с документами юрлиц, знает эту ситуацию. Контрагент присылает договор в Word или карточку компании в PDF. Бухгалтер или менеджер вручную переносит ИНН, КПП, расчетный счет в 1С или CRM. Статистика: каждый третий раз в данных закрадывается ошибка. Дальше — счет уходит не туда, платеж зависает, клиент нервничает, сделка срывается. Штрафы от ФНС за неверные реквизиты в документах — отдельная боль.

Можно нанять стажера перепечатывать. А можно автоматизировать процесс за 1 секунду.

Мы в своей компании давно решали эту задачу для интеграции 1С с документооборотом. В итоге обкатали решение и сделали из него публичный API. Расскажу, как он работает, покажу пример кода для 1С (куда без него) и честно скажу, где могут быть нюансы.

Зачем бизнесу автоматическое распознавание реквизитов?

Вы запускаете B2B-платформу или интернет-магазин. Новый клиент регистрируется и вводит реквизиты своей фирмы. Статистика жестокая: каждый третий ошибается хотя бы в одной цифре ИНН или расчетного счета. Дальше — цепочка: невыставленный счет → потерянная сделка → негатив к бренду.

Наш API решает это одним запросом:

  • Берет файл: договор, счет, акт, карточку компании.

  • На выходе — чистые, проверенные реквизиты.

Что поддерживается:

  • Форматы: PDF (только текстовый слой), DOCX, DOC, TXT, RTF, HTML.

  • Важно: Отсканированные картинки и PDF без текстового слоя — нет. Только текстовые документы. Если файл — просто сканы, нужен отдельный OCR.

Как работает «под капотом» (для понимающих)

Многие думают, что это просто поиск по маске «10-12 цифр». Нет. Это контекстный анализ и валидация.

  1. Загрузка файла — через обычный POST-запрос (multipart/form-data).

  2. Извлечение текста — парсим PDF-текст, DOCX через внутренний конвертер, остальные форматы — штатными парсерами.

  3. Нормализация — чиним кодировки (да, CP1251 без BOM до сих пор в ходу), склеиваем разорванные слова.

  4. NER (поиск сущностей) — собственная модель ищет именно юридически значимые блоки: ИНН, КПП, ОГРН, расчетный счет, БИК, банк.

  5. Валидация — мы не просто выдергиваем числа. Мы проверяем контрольные суммы ИНН, ОГРН, логику БИК. Если контроль не прошел — поле не вернется, чтобы вы не сохранили мусор в базу.

Честные цифры точности (бенчмарк на 10 000 документах)

  • ИНН / ОГРН — 99,7% (ошибки только на очень кривой верстке)

  • Расчетный счет — 98,9% (редко путаем цифры при «плывущем» шрифте)

  • БИК — 99,5%

Скорость и ограничения:

  • Легкий DOCX (2 страницы) — 1,5 секунды.

  • Тяжелый PDF с графикой — до 45 секунд.

  • Максимальный размер файла — 2 МБ.

  • Таймаут операции — 120 секунд.

Пример кода для 1С (самый важный для бухгалтеров)

Вот как выглядит вызов API из 1С Бухгалтерия 3.0 (обработку целиком можно скачать по ссылке в конце):

Функция ИзвлечьРеквизитыИзФайла(ПутьКФайлу)      URL = "https://api.sb-poisk.ru/v1/extract";      Заголовки = Новый Соответствие;      Заголовки.Вставить("X-API-Key", "ВАШ_КЛЮЧ");          ДанныеФормы = Новый Структура;      ДанныеФормы.Вставить("file", Новый ДвоичныеДанные(ПутьКФайлу));  HTTPСоединение = Новый HTTPСоединение(URL);  Ответ = HTTPСоединение.ОтправитьДляОбработки("POST", Заголовки, ДанныеФормы);  Результат = ПрочитатьJSON(Ответ.ПолучитьТелоКакСтроку());        // На выходе готовые поля    Возврат Результат;КонецФункции

На выходе получаете структуру:

  1. inn, kpp, ogrn

  2. account (расчетный счет)

  3. bic, bank_name

Где это уже работает (и кому полезно)

  • Интернет-магазины и B2B-платформы — автозаполнение реквизитов при регистрации юрлица.

  • Банки — проверка карточек клиентов без ручного ввода.

  • Бухгалтерия — автоматическое создание контрагентов в 1С по загруженному договору.

  • CRM и ERP — исключение человеческого фактора.

Как попробовать бесплатно (30 дней)

Мы даем тестовый доступ к API на 30 дней — 100 запросов на сервис.

Промокод: 1MHABR2026
Срок действия промокода: до 30.05.2026 г.

Как получить API-ключ:

  1. Перейти по ссылке на обмен промокода https://api-k.ru

  2. Или написать на почту: info@sb-poisk.ru

Ссылка на готовую обработку для 1С Бухгалтерия 3.0:
https://disk.yandex.ru/d/NeMIRoOzgsATrw

Вместо итога

Этот API уже месяц работает в продакшне. Мы сами используем его для автоматизации документооборота и интеграции с 1С. Если вы устали от ручного перепечатывания реквизитов, регулярных выражений, которые не работают, и ошибок, которые стоят денег — попробуйте. Тестового доступа хватит, чтобы все проверить на своих документах.

ссылка на оригинал статьи https://habr.com/ru/articles/1025364/