Skip to main content

What can we help you with?

Search

Распознавание документа в таблицу

Comments

3 comments

  • Vadim Khambaleev

    Добрый день, Дмитрий! 

    Для решения задачи распознавания документов есть три разных подхода: 

    1.  Используя действие "Считать текст" из группы действий "PDF". Результатом работы данного действия будет переменная pdf_content. Для того чтобы извлечь данные из полученной строки (переменная pdf_content) и записать, к примеру, в excel в виде таблицы вам нужно использовать методы JS (к примеру IndexOf  - вычислить номер символа в строке; slice - обрезать строку), сохранять "обрезанные" значения в переменные, а затем записывать их в нужную ячейку таблицы excel, см. пример алгоритма ниже: 


    Данный метод имеет ограничения: строка не имеет форматирования (к примеру не известно, где начинается новая строка или столбец; строка не содержит линий таблицы и т.п).  Данный метод удобен если в таблице есть ключевые слова, по которым вы можете выцепить нужные вам значения.   

    2.  В качестве следующего метода мы рекомендуем рассмотреть действия из группы "OCR". К примеру рассмотрим действие "Yandex Cloud OCR", см. скриншот:



    ​Преимуществом данного метода по сравнению с первым методом (поиск по строке) является то, что вы получаете в результате переменную yandex_ocr_content, которая содержит массив объектов, для каждого распознанного слова, с размерами (элементы height, width) и координатами (элементы x, y). На основании координат можно сделать вывод в каком столбце и строке находиться элемент (к примеру если у нескольких элементов не изменяется координата Y это означает что элементы находятся на одной строке, т.к. высота не изменилась). 


    3. Автоматическое преобразование с форматированием реализовано в действии "Распознать документ в таблицу" из группы действий "OCR" , см. статью в нашей базе знаний; данное действие предоставляется за отдельную плату. 
    Если вы заинтересованы в данном действии, мы можем подключить к задаче вашего менеджера для обсуждения деталей.

    0
  • Дмитрий Волков

    спасибо! да, давайте подключим менеджера ... пусть свяжется со мной в личку...

    0
  • Vadim Khambaleev

    Добрый день, Дмитрий! 

    Передал информацию вашему менеджеру. 

     

    0

Please sign in to leave a comment.