Ушедший 2022 год стал для многих компаний в некотором смысле испытанием: после успешной «перестройки» бизнес-процессов, спровоцированной COVID-19, пришлось экстренно адаптироваться к новой реальности. Несмотря на возникшую турбулентность, мы в Smart Engines хорошо поработали и достигли отличных результатов как в технологиях и науке, так и в бизнесе. Даже об экологии не забыли. За деталями — заглядывайте под кат.
Сегодняшнюю статью мы решили разбить на несколько частей. Сначала мы вкратце расскажем про новые фичи и технологические достижения (естественно, ведь Хабр — это прежде всего технологическая площадка), которые удалось реализовать в ушедшем году. Далее — бегло коснемся научной составляющей, качественно и количественно поделимся нашими результатам в этой области. Третья часть настоящей статьи — совсем короткая, сухая, про бизнес и цифры. А в заключение расскажем про наш вклад в борьбу с глобальным потеплением!
Новые за 2022 год фичи в продуктах
Начнем мы с раздела, который нам особенно приятно писать! Ведь помимо общего развития системы и повышения качества распознавания (на минуточку, за 2022 год количество допускаемых ошибок системы Smart Engines при распознавании ID документов сократились на четверть, было добавлено 566 новых документов и 1160 новых шаблонов, доведя тем самым число поддерживаемых документов до солидных 2427 с 3703 шаблонами) мы разработали немало уникальных технологий, которые уже сегодня доступны в наших продуктах!
Полнотекстовое распознавание
В 2022 году Smart Engines, в рамках Smart Document Engine, представила систему распознавания текста нового поколения, которая умеет находить документ на фотографии или скане и распознавать все текстовые данные на 102 языках. Решение получилось чрезвычайно быстрым: система распознает 15 страниц в секунду и полностью обрабатывает фотографию листа А4 за 3-4 секунды (внимание!) на смартфоне! В серверных решениях на 32-ядерном HPC без применения GPU скорость полнотекстового распознавания достигает 15 страниц в секунду.
Созданная технология способна распознать текст, даже если оригинальный бумажный документ до этого был сложен. Другими словами, она превращает обычный смартфон в мгновенный сканер, делая при этом традиционные планшетные сканеры попросту ненужными. Smart Document Engine позволяет даже создавать PDF/A, если требуется отправить отсканированный образ в стандартизованном виде.
Полнотекстовое распознавание является ключевым элементом ввода документов в системах электронного документооборота, управления бизнес-процессами, электронных архивах и RPA-системах. От скорости и точности извлечения данных напрямую зависит трудоемкость и возможная глубина автоматизации процесса обработки документов. Все это позволяет нам уверенно говорить, что Smart Document Engine на сегодняшний день является мощным инструментом, готовым с легкостью заместить соответствующие программные продукты ABBYY и созданные на их основе решения, а также другое иностранное ПО в корпоративном и государственном секторах. При этом технология создания компактной PDF/A-версии документа с текстовым слоем нативно поддерживается всеми современными архивными системами.
Распознавание первичных документов
В 2022 году Smart Engines выпустила систему распознавания первичной бухгалтерской и финансовой документации, которая работает не только на серверах для обработки документов с потоковых сканеров, но и на мобильных телефонах. Система автоматически классифицирует и распознает счета-фактуры, ТОРГ-12, УПД, товарно-транспортные накладные, акты и счета на оплату и др. На сегодняшний день Smart Document Engine поддерживает 57 различных первичных, кадровых и регистрационных документов, детализированный список поддерживаемых документов в спойлере.
Список поддерживаемых документов Smart Document Engine
-
АДИ-РЕГ
-
Акт
-
Акт по форме 1с
-
Акт МХ-1 (приема-передачи товарно-материальных ценностей на хранение)
-
Акт МХ-3 (о возврате товарно-материальных ценностей, сданных на хранение)
-
Акт ОС-1а (о приеме-передачи здания (сооружения))
-
Акт ОС-1 (о приеме-передачи объекта основных средств (кроме зданий, сооружений))
-
Акт КС-2 (о приемке выполненных работ)
-
Акт ОС-4 (о списании объекта основных средств (кроме автотранспортных средств))
-
Акт сверки
-
Бухгалтерский баланс
-
Выписка из Единого Государственного Реестра Индивидуальных Предпринимателей
-
Выписка из Единого Государственного Реестра Недвижимости
-
Выписка из Единого Государственного Реестра Юридических Лиц
-
График отпусков
-
Диплом
-
Договор
-
Дополнительное соглашение к договору
-
Инвентаризационная опись основных средств
-
Корректировочный счет-фактура
-
Накладная на передачу готовой продукции в места хранения
-
Отчет о финансовых результатах
-
Платежное поручение
-
Платежное требование
-
Приказ (распоряжение) о приеме работника на работу (Форма Т-1)
-
Личная карточка работника (Форма Т-2)
-
Приказ (распоряжение) о предоставлении отпуска работнику (Форма Т-6)
-
Приказ (распоряжение) о прекращении (расторжении) трудового договора с работником (увольнении) (Форма Т-8)
-
Приказ (распоряжение) о прекращении (расторжении) трудового договора с работниками (увольнении) (Форма Т-8а)
-
Протокол согласования цен поставки лекарственных препаратов
-
Реестр сертификатов и деклараций (приложение к накладной)
-
Сведения о трудовой деятельности по форме СТД-Р
-
Свидетельство ИНН
-
Свидетельство о внесении записи в Единый государственный реестр юридических лиц о юридическом лице, зарегистрированном до 1 июля 2002 года, Форма №P57001
-
Свидетельство о внесении записи в Единый государственный реестр юридических лиц, Форма №P50003
-
Свидетельство о государственной регистрации юридического лица, Форма №P51001
-
Свидетельство о государственной регистрации юридического лица, Форма №P51003
-
Свидетельство о постановке на учет организации в налоговом органе по месту ее нахождения, Форма №1-1-Учет
-
Свидетельство о постановке на учет юридического лица в налоговом органе по месту нахождения на территории Российской Федерации, Форма №09-1-2
-
Сличительная ведомость результатов инвентаризации товарно-материальных ценностей
-
Справка 182н с предыдущего места работы
-
Справка о доходах физ. лица
-
Справка о постановке на учет (снятии с учета) физического лица в качестве налогоплательщика налога на профессиональный доход
-
Справка о стоимости выполненных работ и затрат
-
Счет на оплату
-
Счет на оплату по форме 1С
-
Счет-фактура
-
Тест ПЦР
-
Тест ПЦР на английском языке
-
Титульный лист Устава
-
Товарная накладная ТОРГ-12
-
Товарно-транспортная накладная
-
Транспортная накладная
-
Требование-накладная
-
Универсальный корректировочный документ
-
Универсальный передаточный документ
-
Штатное расписание
Высокое качество и уникальные скоростные характеристики продукта позволяют реализовать концепцию мобильного бэк-офиса, когда сотрудники сканируют и вводят данные первичных документов при помощи смартфона или планшета. Использовать решение можно не только в единых центрах ввода, куда централизованно поступают на обработку бумажные документы, но и непосредственно при приеме документов от контрагентов.
Сканер номера
Команда Smart Engines обучила нейронные сети сканировать и распознавать не только печатные номера телефонов, но и написанные от руки. Для того чтобы отсканировать номер в режиме реального времени, пользователю достаточно показать его камере телефона.
Эта технология уже позволила некоторым банкам (МКБ, Альфа-Банк) сделать переводы для клиентов значительно удобнее: в случаях, когда номер телефона получателя платежа написан от руки (например, на ярмарках, рынках и других объектах мелкой розницы), можно больше не вводить номер вручную.
Улучшение клиентского пути и совершенствование качества сервиса невозможно без применения новейших технологических продуктов. Это особенно важно сегодня, когда конкуренция за клиента выросла. Решение наших партнеров из Smart Engines сократило время и повысило удобство пользователей «МКБ Онлайн» на совершение денежных переводов через СБП.
Владислав Ермаков
Начальник управления развития дистанционного
банковского обслуживания МКБ
Любые платежи прямо в браузере
В 2022 году крупнейшие российские банки оказались в сложном положении: их мобильные приложения были удалены из App Store и Google Play, а пользователи лишились привычного и удобного способа оплаты.
Smart Engines предложила банкам собственное инновационное решение, способное считывать разные данные – например, QR-коды или банковские карты – с камеры смартфона непосредственно в браузере с помощью WebAssembly (WASM).
Как это работает? Решение Smart Engines на основе WASM интегрируется в PWA банка (progressive web app — технология в веб-разработке, которая визуально и функционально трансформирует сайт в мобильное приложение), сохраняя функционал для клиента. WASM позволяет запускать программы непосредственно на веб-странице интернет-банка на смартфоне. Таким образом, этот способ дает возможность использовать версию, более близкую к нативному мобильному приложению, в обход привычных магазинов на iOS и Android
Forbes.ru, статья «Распознавание доходов: как AI-компания заработала на попавших под санкции банках» от 23.01.2023 г.
Опрошенные Forbes эксперты назвали решение Smart Engines уникальным, безопасным и востребованным среди компаний российского финансового сектора.
Действительно, внедрение этой технологии дало возможность владельцам смартфонов совершать ежедневные платежи в интернет-версиях банков с таким же уровнем комфорта, как в мобильном приложении. Теперь ею ежедневно пользуются миллионы клиентов ВТБ, банка “РОССИЯ” и Альфа-Банка.
Кстати, про эту технологию, на примере внедрения в бизнес-процесс Альфа-Банка, мы уже писали на Хабре во всех красках.
Мобильное приложение Альфа-Банка высоко оценили независимые аналитики: оно заняло первую строчку в рейтинге агентства Markswebb. Альфа-Онлайн лидерует во всех номинациях – ежедневный банкинг (daily banking) и цифровой офис (digital office) со значительным отрывом от всех конкурентов.
Качественный скачок в распознавании паспорта РФ
В ушедшем году мы полностью переработали все компоненты технологии обработки российского паспорта. Это позволило улучшить качество распознавания всего документа, снизив число ошибок в 3,2 раза при сохранении скоростных характеристик системы. Время распознавания данных основного разворота паспорта на 1 кадре на мобильном телефоне составляет 0,15 секунды, а на сервере – 55 изображений в секунду без применения GPU.
Достигнутый уровень качества распознавания позволяет заявить о переходе процесса сканирования, извлечения и последующего введения данных в корпоративные системы в автоматический режим. С помощью решения Smart Engines компании, отказавшись от ручного ввода паспортных данных, смогут переориентировать операторов на более важные задачи, а заодно снизить риски – вызванные человеческим фактором ошибки, утечки данных через операторов и мошеннические действия сотрудников.
Сейчас наша система в реальном времени распознает все страницы и данные паспорта РФ, в том числе рукописные поля, а также проверяет его подлинность. Выпустив новую версию, мы сделали процесс распознавания и ввода паспортных данных автоматическим. Качество распознавания паспорта РФ, которого мы достигли в 2022 году, существенно превосходит качество ручного ввода операторами. Это позволяет поднять уровень клиентского обслуживания в отделениях и в дистанционных каналах.
канд. тех. наук Владимир Арлазаров
Генеральный директор Smart Engines
Технологии определения фальсификаций документов
Продукты Smart Engines теперь позволяют не только распознать данные, но и проверить предъявляемый документ на предмет наличия признаков фальсификации. Разработанная нашей командой в 2022 году комплексная система искусственного интеллекта решит задачи обнаружения цифровой и физической подделки документов и предупредит факт мошенничества.
За счет использования последних достижений в области ИИ система обнаруживает и предотвращает широкий спектр атак на предъявление фальсифицированных документов, включая предъявление ксерокопии документа или даже изображения документа на мониторе или планшете.
За счет реализации принципа “Fraud Detection via Recognition”, в рамках которого ИИ использует все данные и признаки, выявленные на всех этапах распознавания документов, система позволяет выявлять множество способов подделки документов как на обычных сканах, фотографиях и видео, так и на мультиспектральных изображениях, полученных с помощью специальных устройств.
Подход Science First
Несмотря ни на какие разговоры (где-то беспочвенные, а где-то, к сожалению, реальные) о притеснении ученых из России, в 2022 году нам удалось достигнуть грандиозных научных результатов:
-
Опубликовано 32 научных статьи в ведущих международных и российских рецензируемых журналах, 19 из которых индексируется Web of Science (WoS) и Scopus, причем 10 из них — в журналах из Q1
-
Опубликовано 20 докладов в сборниках конференций, 11 из которых индексируются Web of Science (WoS) и Scopus
-
Представлено 13 докладов на международных конференциях, включая ICPR, ICMV, Synchrotron and Free electron laser Radiation: generation and application (SFR-22), Современная рентгеновская оптика — 2022, ИТИС и другие
За минувший год в сумме сотрудники Smart Engines представили 65 научных работ.
Помимо научных публикаций мы совместно с французскими коллегами из университета La Rochelle выпустили два новых датасета в области распознавания и проверки подлинности документов:
-
MIDV-2020: A Comprehensive Benchmark Dataset for Identity Document Analysis [ссылка]
-
Document Liveness Challenge Dataset (DLC-2021) [ссылка]
Мы продолжили работу по изучению возможностей предложенной нами в 2020 году новой технологии “Томография под контролем реконструкции”. Она позволяет сократить лучевую нагрузку, получаемую в ходе томографического исследования, до 30%. В 2023 году в журнал «Kомпьютерная оптика» принята к печати наша новая научная работа, выполненная совместно с немецкими коллегами, в которой проанализированы результаты реконструкции в случае использования алгоритмов разного типа.
Кроме того, в работе “Reprojection-based numerical measure of robustness for CT reconstruction neural networks algorithms” [ссылка], опубликованной в журнале Mathematics, мы представили результаты исследования устойчивости нейросетевых моделей, используемых в томографической реконструкции, к возможным атакам.
Мы гордимся тем, что наши показатели — относящиеся как к коммерческой, так и научной деятельности — продолжают неуклонно расти. Это свидетельствует о том, что бизнес и наука в нашей компании гармонично сосуществуют и стимулируют взаимное развитие.
канд. тех. наук Владимир Арлазаров
Генеральный директор Smart Engines
Эти и другие прикладные и фундаментальные исследования мы ведем совместно с учеными из ведущих институтов РАН в области ИИ и Компьютерной томографии – ФИЦ ИУ РАН, ИППИ РАН, ФНИЦ “Кристаллография и фотоника” ИК РАН.
В этом году мы сместили фокус по стажировкам студентов с МФТИ на Мехмат и ВМК МГУ. И не пожалели! Как и предполагалось, МГУ готовит отличные кадры с фундаментальным математическим образованием, что как раз и требуется для исследований в области ИИ, компьютерного зрения и компьютерной томографии.
Кстати, в 2023 году мы планируем расширять программы стажировки для студентов МГУ (факультеты Мехмат, ВМК, Физфак) и Физтеха, начиная с 4 курса. Если заинтересовала стажировка у нас в команде – присылайте резюме по адресу job@smartengines.ru.
Сильные бизнес-результаты
Все проделанное закономерно принесло свои бизнес-плоды. Несмотря на сильную турбулентность рынка сбыта высоких технологий нам удалось практически вдвое увеличить количество проданных распознаваний документов и, естественно, размер выручки.
Таким образом, наши значимые бизнес-достижения в 2022 году тезисно можно сформулировать следующим образом:
-
Количество проданных распознаваний для безопасного извлечения данных в мобильных приложениях, интернет-решениях и других информационных системах составило 216 млн — это на 91% больше, чем в 2021 году;
-
Выручка компании в 2022 году превысила 400 млн рублей, что на 43% больше, чем в 2021 году;
-
Использовать программные продукты Smart Engines начали ВТБ, Банк Открытие, Банк Россия, Банк Точка, ювелирная сеть SOKOLOV;
-
МТС на основе решения Smart Engines выстроила собственный сервис, позволяющий распознавать документы и верифицировать данные пользователей;
-
Активное развитие получили проекты в Альфа-Банке, Газпромбанке, ОТП Банке, Райффайзенбанке, НСПК, ЕАБР, в компании “АльфаСтрахование” и других.
Наш вклад в борьбу с глобальным потеплением
Как мы уже несколько раз писали на Хабре, алгоритмы Smart Engines с применением фирменной природосберегающей технологии GreenOCR® на смартфоне позволяют распознать паспорт РФ за 0,15 секунды. На каждое распознавание выделяется 0,0001432891146 грамм СО2. Мы подсчитали, что высадка 1 гектара дубового леса компенсирует ~3,8 миллиарда распознаваний.
В октябре 2022 года в национальном парке “Угра” в Калужской области – на участке площадью 1 гектар – мы высадили 4000 сеянцев дуба черешчатого. Этот дубовый лес способен поглотить 556,7 тонн углерода за 50 лет.
Важный момент — компания Smart Engines не просто “скинулась” деньгами ради получения заветного сертификата. От Smart Engines в Калужскую область была направлена делегация во главе с PR-директором, лично участвовавшем в посадке деревьев.
Мы – компания, разрабатывающая программное обеспечение для распознавания изображений, основанных на многолетних фундаментальных трудах российских учёных в области искусственного интеллекта и машинного зрения. Используем в своей работе мощные компьютеры, потребляющие электроэнергию и выбрасывающие в воздух углерод. И чтобы компенсировать этот вред на десять лет вперёд, мы решили посадить в “Угре” четыре тысячи молодых дубов. Это наш первый, но не последний шаг
Владислав Новый
PR-директор Smart Engines
А что в заключении? Прогноз на 2023 год!
Самое логичное, что может быть в заключении в сегодняшней статье — это представить нашему читателю планы Smart Engines на 2023 год. Пожалуй, сформулировать это лучше генерального директора Владимира Арлазарова никто не сможет:
В 2023 году с технологической точки зрения мы собираемся расти по трем направлениям. Кроме томографии, которую мы в 2023 году намерены обозначить как бизнес-направление, мы планируем расширить область распознавания во всех обычных отраслях. Сделать так, чтобы для бизнес-сообщества именно обработка фотографий документов на мобильных телефонах и серверах стала стандартом.
канд. тех. наук Владимир Арлазаров
Генеральный директор Smart Engines
В интервью CNews 23.12.2022 г.
Желаем в наступившем году всем читателям Хабра, и себе, конечно, же тоже, достижения всех поставленных целей, продуктивной работы, успехов на творческом пути!
ссылка на оригинал статьи https://habr.com/ru/company/smartengines/blog/712678/
Добавить комментарий