Сценарии для RPA
- Скрейпинг вакансий и компаний (500+ источников) с антибот‑обходами.
- Заполнение веб‑форм и CRM: заявки, отчёты, статусы.
- Проверка цен/наличия конкурентов, сбор данных для прайс‑мониторинга.
- Загрузка файлов, рассылка писем, выгрузки, сводки и сверки.
Демо: курсоры действуют сами
Прокрутите сюда — курсор сам введёт текст и нажмёт «Старт». В реальном проекте роботы управляют браузером и API, имитируя действия пользователя и обходя блокировки.
Курсор двигается по всей странице, как робот‑кликер. А кнопка сверху – для красоты.
Пример: распознаём карточку и заполняем Excel

Пример: автопереименование фото на основе распознавания
Что ещё автоматизируем c комрьютерным зрением
Мы решаем рутину и сложные задачи зрением и текстом. Собираем данные, понимаем, что на фото и видео, извлекаем факты из документов и кладём в базы. Подключаем ботов и RPA, чтобы всё работало без человека и по регламенту.
- Подключаем VLM‑модели и строим пайплайны: Claude Computer Use, собственные агенты, интеграция с RPA (Selenium/Playwright). Модели читают экран, кликают, заполняют формы, проверяют результаты.
- Делаем OCR‑конвейеры: Docling, PDFPlumber и ещё 10+ моделей. Читаем сканы, договоры, счета. Размечаем, валидируем, нормализуем поля.
- Встраиваем Azure Document Intelligence: быстрый парсинг документов и извлечение таблиц. Возвращаем аккуратные структуры.
- Векторизуем данные и ищем смыслы: модели эмбеддингов + хранилища pgvector, Chroma, FAISS. Делаем RAG, похожие кейсы, поиск по контексту.
- Обучаем и применяем CV‑модели: YOLO, модели Meta/ Facebook, OpenCV, Torch. Дообучаем на ваших данных (Kaggle/внутренние наборы).
- Работаем с видео: EVR, VideoMAE, ViT, MTV. Узнаём действия, события, аномалии в реальном времени.
- Собираем конвейеры слежения: допустим, YOLO + EVR + ActionFormer + NMS. Отслеживаем объекты, фиксируем события, отправляем алерты.
- Ищем и переводим текст на экране: MORT и Windows OCR, локальный перевод HelsinkiNLP. Делаем приложения на Electron для офиса/цеха.
Кейс “Производство”. На линии важно видеть, что люди делают и как движется товар. Мы ставим камеры и модели. Система отслеживает рабочие места, руки, жесты, события. Видит: сотрудник сортирует, стоит без дела, уронил коробку, взял лишнее. Считает эффективность по операциям и времени. Уведомляет, если что-то пошло не так: дым, огонь, падение, травма, остановка конвейера.
Как это работает. Камера → поток кадров → распознавание (детекция, трекинг, классификация, action recognition) → бизнес‑правила → алерты, отчёты и дашборды. Если нужно — сразу команды в систему: остановить линию, вызвать мастера, записать инцидент.
Результат. Рутина уходит к роботам. Ошибки и воровство режутся на корню. Руководитель видит цифры: кто чем занят, где узкие места, сколько времени уходит на каждую операцию. Регламенты соблюдаются, безопасность — под контролем.
Векторизация документов и поиск
101010 001001 101110 010110 110010 010001 111000 100101 011010
Технологии и интерфейсы
- Оркестрация: n8n‑воркфлоу или самописные пайплайны на Node.js/Python.
- Интерфейсы: веб и десктоп — Electron, Streamlit, Next.js (админка/портал).
- Доставка: фоновые задания, CLI, API‑эндпоинты, очереди/ретраи.
Как строим RPA‑контур
- Headless‑браузеры, очереди, ретраи и антибот‑обходы.
- Храним сессии и куки, меняем прокси и отпечатки.
- Пишем логи и скриншоты шагов, шлём алерты при сбоях.
- Сохраняем данные в PostgreSQL/ClickHouse/S3 по задаче.