|   |   | 
| 
 | Сервисы распознавания полей и таблиц в документах | ☑ | ||
|---|---|---|---|---|
| 0
    
        ИС-2 22.11.24✎ 15:20 | 
        В продолжении тем про промт-инженеров операторов 1C.
 Есть потребность не просто распознавать унифицированные формы, но произвольные документы и таблицы. В моем понимании выглядит так - фотографируем документ и на выходе получаем JSN файл с информацией в каком поле какой текст и какие таблицы есть в документе. Сейчас занят поиском таких сервисов. Может кто-то реализовывал такую систему | |||
| 1
    
        Garykom гуру 22.11.24✎ 15:37 | 
        (0) Таких нет и невозможны без стандартизации форм/данных входящих документов
 И во времена ИТ не нужны и вредны Использовать стандарты/протоколы обмена данными между отправителем и получателем | |||
| 2
    
        Garykom гуру 22.11.24✎ 15:39 | 
        есть старый мем/байка про печать 3 камазов бумаги в одной конторе
 чтобы перевести в соседнюю контору и там распознавать их | |||
| 3
    
        программистище 22.11.24✎ 17:16 | 
        конторка Эффективные решения, делала конфигурацию: электронная загрузка документов, ну это так к слову, помню такое в 2009 году было, сейчас не смотрел, может они сервис организовали
 они даже сотрудничали с ABBYY | |||
| 4
    
        Звездец 22.11.24✎ 17:15 | 
        есть такое понятие, универсальное не может быть хорошим во всем. Перочинный ножик тебе в пример.
 Сервис подобный сделать не проблема, но все-таки для нормального результата, его нужно будет обучать примерами того, что нужно распознавать. А если у тебя каждый раз новый документ, никак не похожий на предыдущий, то и результат будет никакой | |||
| 5
    
        Звездец 22.11.24✎ 15:43 | 
        (3) сервис распознавания есть даже в типовых, но туда не все что угодно засовывать можно     | |||
| 6
    
        Звездец 22.11.24✎ 15:44 | 
        (2) как-то и у меня ФНС просила распечатать и принести то, что было подписано по ЭДО     | |||
| 7
    
        CepeLLlka 22.11.24✎ 15:45 | 
        (0)В 2024 идти по этой дорожке это бредятина     | |||
| 8
    
        ИС-2 29.11.24✎ 07:32 | 
        (7) согласен. Но система нужна для работы не УПД и чеками, данные по которым могу взять из интернета.
 Ее цель облегчить работу с произвольными таблицами. | |||
| 9
    
        Лодырь 29.11.24✎ 07:42 | 
        (8) Так речь про произвольные таблицы или про произвольные документы? Потому что правильно определить структуру формы и понять разбить абзацы на поля - это вообще небанальная задача так то. Сервисы распознавания (аля correct.su) конечно не ограничиваются только упд и чеками, но и даже могут настроить практически что угодно по вашей просьбе, но они все равно привязаны к шаблонам. Почему? Потому что их надо обучать, о чем указано в (4). Например мы используем активно такого рода распознавания, но ошибок достаточно много. Даже есть ошибки классификации типа документа.     | |||
| 10
    
        Garykom гуру 29.11.24✎ 08:20 | 
        (6) это тупизна исполнителей     | |||
| 11
    
        Garykom гуру 29.11.24✎ 08:24 | 
        (9) Не работает на практике с бумажными доками почти никак
 Банально чуть похуже качество скана Или еще прикол с нестандартным шрифтом И все, приехали Прога распознавания ничего не возьмет, даже крутая от ABBYY/Content AI Чтобы смогла - придется посимвольно обучать | |||
| 12
    
        Garykom гуру 29.11.24✎ 08:27 | 
        (8) >цель облегчить работу с произвольными таблицами
 позвонить/написать автору таблицы и попросить прислать исходник в электронном виде подразумеваю не фото/скан а xls/xlsx | |||
| 13
    
        ИС-2 09.12.24✎ 13:27 | 
        Появилась новая потребность - найти сервис, который проверит наличие печати и подписи на документе. 
 задача исключить на первичном уровне документы, которые приходят от клиентов совсем без подписи и печати. Валидность печати пока проверять не надо. Печать и подпись будут в определенном месте Есть что-то где-нибудь подобное? | |||
| 14
    
        Волшебник 09.12.24✎ 13:29 | 
        (13) На одном из мест работы наш программист написал интеллектуальный алгоритм по поиску синих точек. Потом доработали так, что печати могли быть любого цвета.
 Подпись найти ещё сложнее. И вообще невозможно определить, чья подпись, может секретарь расписался за гендира | |||
| 15
    
        Garykom гуру 09.12.24✎ 13:46 | 
        (13) Использовать ЭДО!
 Для бумажных сканов для каждого контрагента хранить образцы печатей и подписей Далее OpenCV https://habr.com/ru/articles/742460/ - тут глянь комменты например https://habr.com/ru/articles/547218/ https://habr.com/ru/articles/736190/ | |||
| 16
    
        maxab72 09.12.24✎ 13:54 | 
        "может секретарь расписался за гендира" У моего приятеля была давно история. У него тогда было ИП, и надо было открыть в каком-то определенном банке расчетный счет. Он оформил документы, но сам поехать в банк не мог, слег с гриппом. Поехала его супруга, а в банке оказалось, что в бумагах опечатка, и надо их переделать. Ей перепечатали договор, и попросили принести с подписью мужа, а она возьми, и для экономии времени распишись за него (умела ставить подпись, очень похожую на подпись мужа). Эту подпись в банке сверили с росписью в паспорте приятеля, нашли схожей и приняли за образец. с тех пор ей пришлось подписывать все документы для этого банка.     | |||
| 17
    
        СвинТуз 09.12.24✎ 14:46 | 
        На одной из работ внешний контрагент выкладывал 
 файл, информацию из которого требовалось загрузить. Файл был плохо структурированной таблицей эксель. Ну в общем по цвету текста. | |||
| 18
    
        Волшебник 09.12.24✎ 14:56 | 
        (16) Настало время охуительных историй... Конечно, это чушь. Если роспись сверили с паспортом мужа, то почему ей ПРИШЛОСЬ? Неужели муж не мог уже расписаться, как у СЕБЯ в паспорте? Жена стала расписываться лучше мужа? Ну хватит уже...     | |||
| 19
    
        mmg 09.12.24✎ 15:26 | 
        (13) Сейчас проверил на двух тестовых изображениях (с печатью-подписью и без).
 GPT-4o-mini от OpenAI нормально отрабатывает. Можно пользоваться | |||
| 20
    
        Волшебник 09.12.24✎ 15:34 | 
        (19) Это будет разглашением коммерческой информации. Пользоваться нельзя.     | 
 
 | Форум | Правила | Описание | Объявления | Секции | Поиск | Книга знаний | Вики-миста |