Описание
Распознает текст с картинки при помощи Google OCR.
Примечание. Мы не храним обрабатываемые через OCR картинки на наших серверах.
Учетные данные Google Cloud Platform
Для работы облачных сервисов Google необходимо авторизоваться на портале, создать проект и активировать сервис «Cloud Vision API». Подробнее об этом можно прочитать в документации к продукту. Далее перейти в меню «APIs & Services» → «Credentials». На открывшейся странице вы найдете ключ API (API Key). Именно его и необходимо использовать в качестве пароля при создании аккаунта. Подробнее об этом мы рассказываем в следующем разделе этой статьи.
Параметры
Ключ API
Вы можете подключить свой аккаунт сервиса Google Cloud Platform к Studio Pro для работы с этим действием. Чтобы это сделать, нажмите на кнопку «ДОБАВИТЬ НОВЫЙ АККАУНТ».
В открывшемся окне вы увидите форму создания аккаунта:
- Сервис — это поле можно заполнить произвольным образом, оно не будет влиять на работу данного действия.
- Логин — это поле можно заполнить произвольным образом, оно не будет влиять на работу данного действия.
- Пароль — в этом поле необходимо указать
Ключ API
.
В целях тестирования и разработки в Studio Pro вы можете воспользоваться комплиментарным пакетом OCR, который предоставляется компанией ElectroNeek в соответствии с вашим тарифным планом. Для использования комплиментарного пакета в параметре действия выберите вариант «Не указано».
Обратите внимание, что так как продукт Bot Runner является бесплатным, то при экспорте бота в формат .neex комплиментарный пакет использоваться не будет. Таким образом, для построения системы attended-автоматизации необходимо указать свой аккаунт в сервисе OCR при работе с .neek-файлом, а затем экспортировать бота в .neex.
Путь к файлу
-
Задать значение: позволяет в явном виде задать путь к файлу. При нажатии на кнопку «Выбрать» можно указать путь вручную с использованием проводника.
-
Сохранить результат предыдущего шага: в качестве пути берет результат действия из предыдущего шага workflow.
-
Вычислить значение: позволяет воспользоваться особой формулой или специальным методом для задания пути.
Поддерживаемые форматы файлов
-
jpeg
-
png
-
bmp
-
gif
-
svg
Максимальный размер файла: 20 МБ
Размер изображения: 7500х7500 пикселей (75M пикселей)
Область распознавания
Если выбрать опцию «Использовать область распознавания», то робот будет распознавать текст внутри заданной прямоугольной области. Чтобы задать область, нужно задать левый верхний угол прямоугольника и его длину и ширину.
-
Задать значение: позволяет указать координату левого верхнего угла по горизонтальной оси.
-
Вычислить значение: позволяет воспользоваться особой формулой или специальным методом для вычисления координаты.
-
Задать значение: позволяет указать координату левого верхнего угла по вертикальной оси.
-
Вычислить значение: позволяет воспользоваться особой формулой или специальным методом для вычисления координаты.
-
Задать значение: позволяет указать ширину прямоугольной области.
-
Вычислить значение: позволяет воспользоваться особой формулой или специальным методом для задания ширины.
-
Задать значение: позволяет указать высоту прямоугольной области.
-
Вычислить значение: позволяет воспользоваться особой формулой или специальным методом для задания высоты.
Комментарий
Позволяет добавить поясняющий текст к блоку. Текст будет отображаться внутри блока сверху от названия функции.
Результат
Вместе с блоком действия «Распознать текст» на рабочей области появляется и блок «Сохранить значение в переменную google_ocr_content». Именно в эту переменную и будет сохранен текст, распознанный с изображения.
Результатом является массив объектов вида «ключ-значение». Один объект содержит следующие ключи и значения:
{
"text": "распознанное слово",
"location": {
"y": "координата y левого верхнего угла прямоугольной области с текстом",
"x": "координата x левого верхнего угла прямоугольной области с текстом",
"width": "ширина прямоугольной области, содержащей распознанное слово",
"height": "высота прямоугольной области, содержащей распознанное слово"
},
"language": "язык, на котором написано распознанное слово"
}
Рекомендации к использованию
Помимо очевидного смысла использования данного действия (распознавание текста с изображения) обратите внимание и на то, что в массиве объектов возвращаются так же и координаты слов. Эта информация может быть полезна в некоторых RPA-процессах.