Сервис распознавания и создание архива документов на базе AI Yandex.Vision

Вводные

1. Электронный архив (далее Архив) – база данных сканов документов

2. Для распознавания документа необходимо:

a. Зарегистрировать аккаунт на Yandex.

b. Подключить сервис Yandex Vision (базовая стоимость распознавания около 0,12 ₽).

c. Создать и настроить облако, получить API (далее API key).

3. Файл скана в формате pdf счета фактуры (далее Документ). На один счет фактура (УПД) один многостраничный pdf файл или несколько файлов с наличием кода документа.

4. Приложение распознавания документа на базе сервиса Yandex Vision, работающее в качестве функции в процедуре SQL Server (далее Процедура)

5. Форма просмотра и привязки не распознанных документов в БУХта (далее Бухта)

6. Интерфейс поиска документов по заданным параметрам (далее Приложение)

7. База данных Архив (далее база Архив)

8. База данных БУХта (далее база Бухта)

9. Ограничения по файлу сервиса Yandex Vision:

a. Поддерживаемые форматы файлов: PDF, PNG.

b. Максимальный размер файла: 1 МБ.

c. Размер изображения не должен превышать 20 мегапикселей (длина x ширина).

Алгоритм

1. Пользователь сканирует Документ в папку на общем сетевом ресурсе (далее Папка)

2. На сервере запущена Процедура с заданным интервалом, которая проверяет наличие файлов в Папке. Процедура имеет параметры Папка и API key, Файл. В случае наличия файла:

a. Процедура производит распознавание документа и выдает данные (номер, дата, инн Покупателя, инн Продавца, id документа).

b. Процедура производит проверку наличия в базе Бухта документа с распознанными данными.

c. Процедура записывает в базу Архив:

i. таблицу Файл Статус документа характеризуется наличием найденного совпадения документа в базе БУХта.

ii. таблицу Документы

d. Файл удаляется

Интерфейсы

1. Бухта

Форма администрирования пользователей. На форме отображаются список пользователей.

Форма привязки нераспознанных документов- пользователь запускает форму привязки документов. На форме отображаются данные таблицы Файл, базы Архив. В ручном режиме пользователь выбирает документ из базы БУХта для привязки. После привязки заполняются данные в таблице Документ.

Форма просмотра реестров документов. На форме отображаются данные таблицы Документ с возможностью редакритьвания записей.

2. WEB-интерфейс (приложение)

Вводные: приложение разрабатывается в среде ASP.NET Core 3.0 запускается на сервере Windows. Доступ к приложению осуществляется через веб-интерфейс на стороне клиента.

Web интерфейс – пользователь получает пароль от администратора, после авторизации в приложении, вводит данные для фильтра по периоду и контрагенту и получает представление в виде:

a. Списка документов в базе БУХта с наличием документа в Архиве.

b. Документы могут быть выгружены в zip файл.

Проекты Яндекс

Еще интересное

 
Поговорим

Привет, Ваше удовлетворение является нашим главным приоритетом...