RPA: роботы для сбора, заполнения и автоматизации

Собираем данные, заполняем формы, кликаем за людей. RPA снимает рутину: скрейпинг вакансий, вбивание отчётов, проверка статусов, выгрузки и сверки. Надёжно, с логами и алертами.

Размер курсора:
Мухи:0

Сценарии для RPA

  • Скрейпинг вакансий и компаний (500+ источников) с антибот‑обходами.
  • Заполнение веб‑форм и CRM: заявки, отчёты, статусы.
  • Проверка цен/наличия конкурентов, сбор данных для прайс‑мониторинга.
  • Загрузка файлов, рассылка писем, выгрузки, сводки и сверки.

Демо: курсоры действуют сами

Прокрутите сюда — курсор сам введёт текст и нажмёт «Старт». В реальном проекте роботы управляют браузером и API, имитируя действия пользователя и обходя блокировки.

Курсор двигается по всей странице, как робот‑кликер. А кнопка сверху – для красоты.

Пример: распознаём карточку и заполняем Excel

Дом
ЖК «Сосны»AI
Санкт‑Петербург, пр. Просвещения, 12Адрес
12 300 000 ₽Цена
Площадь
52 м²
Комнат
2
Этаж
7/18
excel.xlsx — Лист1
Название
Цена
Адрес
Площадь
Комнат
ЖК «Кедры»
9 900 000 ₽
СПб, ул. Пилотов, 22
46 м²
1
ЖК «Ольховый»
15 200 000 ₽
СПб, пр. Культуры, 5
64 м²
2
ЖК «Лайм»
8 450 000 ₽
СПб, ул. Савушкина, 140
38 м²
1
ЖК «Речной»
13 700 000 ₽
СПб, пр. Маршала Блюхера, 9
58 м²
2

Пример: автопереименование фото на основе распознавания

zsh — ai-rename
$
🍌
IMG_005.png
🌭
IMG_006.png
🚗
IMG_007.png

Что ещё автоматизируем c комрьютерным зрением

Мы решаем рутину и сложные задачи зрением и текстом. Собираем данные, понимаем, что на фото и видео, извлекаем факты из документов и кладём в базы. Подключаем ботов и RPA, чтобы всё работало без человека и по регламенту.

  • Подключаем VLM‑модели и строим пайплайны: Claude Computer Use, собственные агенты, интеграция с RPA (Selenium/Playwright). Модели читают экран, кликают, заполняют формы, проверяют результаты.
  • Делаем OCR‑конвейеры: Docling, PDFPlumber и ещё 10+ моделей. Читаем сканы, договоры, счета. Размечаем, валидируем, нормализуем поля.
  • Встраиваем Azure Document Intelligence: быстрый парсинг документов и извлечение таблиц. Возвращаем аккуратные структуры.
  • Векторизуем данные и ищем смыслы: модели эмбеддингов + хранилища pgvector, Chroma, FAISS. Делаем RAG, похожие кейсы, поиск по контексту.
  • Обучаем и применяем CV‑модели: YOLO, модели Meta/ Facebook, OpenCV, Torch. Дообучаем на ваших данных (Kaggle/внутренние наборы).
  • Работаем с видео: EVR, VideoMAE, ViT, MTV. Узнаём действия, события, аномалии в реальном времени.
  • Собираем конвейеры слежения: допустим, YOLO + EVR + ActionFormer + NMS. Отслеживаем объекты, фиксируем события, отправляем алерты.
  • Ищем и переводим текст на экране: MORT и Windows OCR, локальный перевод HelsinkiNLP. Делаем приложения на Electron для офиса/цеха.

Кейс “Производство”. На линии важно видеть, что люди делают и как движется товар. Мы ставим камеры и модели. Система отслеживает рабочие места, руки, жесты, события. Видит: сотрудник сортирует, стоит без дела, уронил коробку, взял лишнее. Считает эффективность по операциям и времени. Уведомляет, если что-то пошло не так: дым, огонь, падение, травма, остановка конвейера.

Как это работает. Камера → поток кадров → распознавание (детекция, трекинг, классификация, action recognition) → бизнес‑правила → алерты, отчёты и дашборды. Если нужно — сразу команды в систему: остановить линию, вызвать мастера, записать инцидент.

Результат. Рутина уходит к роботам. Ошибки и воровство режутся на корню. Руководитель видит цифры: кто чем занят, где узкие места, сколько времени уходит на каждую операцию. Регламенты соблюдаются, безопасность — под контролем.

Векторизация документов и поиск

Тысячи документов компании
📄
🖼️
📊
📑
🧾
🗂️
🖋️
📦
🧮
🗞️
📜
🗃️
Классификация типа
изображение/таблица/текст
🦆 IMG📊 XLSX📄 TXT
Разбиение
страницы/блоки/таблицы
📄🏭▮▮ ▮▮ ▮
Эмбеддинг
векторизация
101010 001001 101110
010110 110010 010001
111000 100101 011010
Vector Store
pgvector/chroma/faiss
Вопрос
ПользовательЧто мы покупали у LLC "上海小鸭子有限公司"?
Ответ
Нашли в векторном поиске: закупали утки (🦆) — поставщик LLC "上海小鸭子有限公司". Источник: договор и накладная.

Технологии и интерфейсы

  • Оркестрация: n8n‑воркфлоу или самописные пайплайны на Node.js/Python.
  • Интерфейсы: веб и десктоп — Electron, Streamlit, Next.js (админка/портал).
  • Доставка: фоновые задания, CLI, API‑эндпоинты, очереди/ретраи.

Как строим RPA‑контур

  • Headless‑браузеры, очереди, ретраи и антибот‑обходы.
  • Храним сессии и куки, меняем прокси и отпечатки.
  • Пишем логи и скриншоты шагов, шлём алерты при сбоях.
  • Сохраняем данные в PostgreSQL/ClickHouse/S3 по задаче.
Data Engineering Projects | Koveh Studio