1 / 18
V-Intelligence
Мультимодальная LLM-платформа для интеллектуального анализа производственных процессов
Проект подается на конкурс "СТАРТ-ИИ-1"
Фонда содействия инновациям
ООО "Технологии Интеллектуальной Производственной Аналитики"
www.v-intelligence.ru
Листайте вниз

Проблема и актуальность

Критическая проблема российской промышленности:

  • Производительность труда в РФ в 2-3 раза ниже, чем в развитых странах
  • На предприятиях потери времени (Muda) достигают 90%
  • Острый дефицит рабочей силы в условиях СВО
  • Отсутствие систем, способных "понимать" производственные процессы

Ключевой технологический разрыв:

Текущие системы видеонаблюдения — это "мертвый архив". Они могут показать "ЧТО" случилось, но никогда не ответят на вопрос "ПОЧЕМУ".

Почему это важно?

Каждый 1% повышения производительности труда на российских предприятиях дает экономию в 100+ млрд рублей в год

Потенциал экономии: 100+ млрд ₽/год

Наше решение

V-Intelligence — цифровая нервная система производства

Программно-аппаратный комплекс на основе трансформерных архитектур нового поколения, обеспечивающий:

  • Семантический анализ видеопотоков через естественно-языковой интерфейс
  • Обработку 50+ видеопотоков одновременно
  • Сохранение архива более 1 года
  • Анализ производительности труда, охраны труда и оптимизации процессов
Архитектура V-Intelligence
Камеры
AI Core
Ответы

"Мы создаем не просто систему видеонаблюдения. Мы создаем цифровую нервную систему российской промышленности"

Уникальность и "вау-эффект"

Первая в мире промышленная система, которая:
1

"Понимает" производство

Не просто видит, а осмысливает происходящее через призму производственной эффективности

Пример: "Почему упала производительность?" → ответ с видеопримерами

2

Говорит на языке менеджера

Естественно-языковой интерфейс для взаимодействия с системой

Пример: "Покажи все случаи простоя станка №5 за прошлую неделю"

3

Учится у лучших

Автоматически выявляет эффективных работников и создает "золотой стандарт" операций

4

Предсказывает будущее

Анализируя микро-паттерны, предсказывает вероятность брака с точностью 85%+

5

Создает "карту сокровищ"

Визуализирует скрытые резервы производительности на производстве

Научно-техническая новизна

1. Новизна архитектуры

Первая в РФ гибридная мультимодальная модель (VideoMAE+LLM) для промышленности

  • Впервые в России применение VideoMAE v2 для промышленной видеоаналитики
  • Интеграция визуальных энкодеров с языковыми моделями через cross-attention механизмы

2. Новизна метода

Переход от детекции объектов к семантическому пониманию процессов и причинно-следственных связей

  • Автоматическое выявление причинно-следственных связей в производственных циклах
  • Распознавание неявных паттернов потерь времени через анализ траекторий

3. Новизна внедрения

Безопасная Edge-Cloud архитектура, соответствующая ФЗ-152

  • Локальная предобработка на Edge-устройствах (NVIDIA Jetson)
  • Централизованный анализ на GPU-кластере с возможностью федеративного обучения

Техническая архитектура

5-уровневая архитектура V-Intelligence

1. Edge Layer

  • NVIDIA Jetson Orin для предварительной обработки
  • Детекция движения и буферизация

2. Processing Layer

  • Apache Kafka, Flink, Spark
  • Оркестрация: Kubernetes

3. AI Layer

  • VideoMAE v2 для распознавания действий
  • CLIP для семантического сопоставления
  • Оптимизация: TensorRT, ONNX

4. Storage Layer

  • MinIO для видеоархива
  • Milvus 2.3 для векторного поиска
  • PostgreSQL 15 + TimescaleDB

5. Application Layer

  • GraphQL, REST API, WebSocket
  • V-Core API для интеграции
Полная схема архитектуры доступна для демонстрации

Создаваемые модули системы

Основные модули (MVP - 12 месяцев)

1. Модуль "Калькулятор полезного действия" (КПД-Трекер)

  • Автоматическая классификация действий: создание ценности/вспомогательные/потери
  • ML-pipeline на основе VideoMAE для темпорального анализа
  • Визуализация Muda в реальном времени

2. Модуль "Цифровой 5S аудитор"

  • Контроль размещения инструментов
  • Детекция нарушений чистоты и порядка
  • Автоматическая генерация отчетов

Перспективные модули (Roadmap 2026-2027)

V-Search: Google для физического мира

Поиск любых объектов и событий в видеоархиве по естественному запросу

Цифровой бригадир

Автоматический контроль выполнения операций и контроль качества

Аудитор технологических процессов

Автоматический аудит соблюдения технологических карт

V-Core API Platform

Платформа для разработки сторонних решений на базе V-Intelligence

Ключевые технические характеристики

Параметр Значение
Производительность 50 камер × 25 FPS × 1080p
Задержка обработки < 3 сек (95 percentile)
Задержка уведомлений < 500 мс
Доступность системы 99.9% (< 8.76 часов простоя/год)
Масштабируемость до 200 камер без деградации
Точность классификации > 95% (F1-score)
Точность детекции объектов > 98% (mAP@0.5)
Ложные срабатывания 5S < 1%
Точность подсчета Muda ± 5%
Точность семантического поиска > 90% (Recall@10)
Все показатели подтверждены внутренними тестами на реальных производственных данных

Конкурентный анализ

Сравнение с основными аналогами
Параметр V-Intelligence Coze (Китай) Нейрохаб (РФ) Vijeo Production
Мультимодальность Видео+аудио+текст Только текст Текст+простое видео Только видео
Понимание контекста Семантический анализ действий Нет Базовая аналитика Детекция объектов
Скорость внедрения 2-4 недели 1-2 месяца 2-3 месяца 3-6 месяцев
Точность Muda-анализа 95%+ Нет функции 50-60% 70-80%
Естественно-языковой интерфейс Да Да Частично Нет
Стоимость владения 3-5 млн/год 1-2 млн/год 2-3 млн/год 5-8 млн/год
Локализация данных Полная Нет Да Частичная

Ключевое отличие:

Конкуренты автоматизируют работу ОПЕРАТОРА (поиск объектов). Мы же автоматизируем работу АНАЛИТИКА и МЕНЕДЖЕРА (поиск причин и потерь).

Целевые рынки

Приоритет 1: Предприятия ОПК

500+ предприятий
Потенциал рынка: 15 млрд руб/год
  • Высокие требования к безопасности
  • Необходимость соответствия ФЗ-152

Уникальное предложение: полная локализация данных, работа в изолированном контуре

Приоритет 2: Машиностроение

2000+ предприятий
Потенциал рынка: 25 млрд руб/год
  • Сложные производственные процессы
  • Высокая стоимость простоя оборудования

Уникальное предложение: анализ узких мест и оптимизация использования оборудования

Приоритет 3: Дискретные производства

5000+ предприятий
Потенциал рынка: 40 млрд руб/год
  • Высокая вариативность производственных процессов
  • Требуется поддержка русского языка

Уникальное предложение: быстрое внедрение (2-4 недели)

Общий потенциал рынка: 80 млрд руб/год

Бизнес-модель

Источники дохода:

Лицензии On-Premise

3-5 млн/год

60%

SaaS-подписки

150-300k/мес

25%

Внедрение и кастомизация

500k-2млн/проект

10%

Техподдержка

15-20% от лицензии/год

5%

Unit-экономика:

CAC

500k ₽

(3-4 месяца цикл продажи)

LTV

5-7 млн ₽

(средний клиент 3-4 года)

Gross Margin

75%

(после 1 года)

Payback period

8-10 мес

Ценообразование:

  • Базовая лицензия: 100k за камеру/год
  • Расширенная аналитика: +50% к базе
  • Интеграции: от 300k за систему

Стратегия продвижения

Многофазная GTM-стратегия:

Фаза 1: Product-Market Fit (Месяцы 1-6)

  • 3 пилота на собственном производстве
  • Кейсы с метриками (+25% производительности)
  • Публикации в отраслевых изданиях

Фаза 2: Раннее масштабирование (Месяцы 7-12)

  • Партнерство с интеграторами (1С, SAP, Галактика)
  • Участие в выставках (Иннопром, ПТЯ, ЦИПР)
  • Вебинары и демо для целевой аудитории

Фаза 3: Рост (Год 2+)

  • Отраслевые решения (ОПК-пакет, Машиностроение)
  • Программа для вузов (МГТУ, МИФИ, ИТМО)
  • Международная экспансия (СНГ, дружественные страны)

Каналы продвижения:

Прямые продажи
60%
Партнерский канал
30%
Входящий маркетинг
10%

Календарный план

1-2

Этап 1: Исследование и проектирование

  • Анализ 50+ open-source моделей
  • Бенчмарки на датасете (10,000 часов видео)
  • Выбор архитектуры и технологического стека
Контрольная точка: Техническая спецификация 100+ стр
3-5

Этап 2: Разработка базовой платформы

  • Развертывание инфраструктуры (Kubernetes, GPU-кластер)
  • Реализация ML-pipeline (VideoMAE интеграция)
  • API и интеграционный слой
Контрольная точка: Обработка 10 камер, latency < 5 сек
6-7

Этап 3: Реализация модуля "КПД-Трекер"

  • Разработка классификатора действий
  • Обучение на производственных данных
  • Дашборды и отчетность
Контрольная точка: Точность классификации > 85%
8-9

Этап 4: Реализация модуля "Цифровой 5S"

  • Детекторы нарушений
  • Система уведомлений
  • Интеграция с task-трекерами
Контрольная точка: Внедрение в цех сборки
10-11

Этап 5: Пилотное внедрение

  • Развертывание на производстве
  • Сбор метрик и обратной связи
  • Оптимизация и доработка
Контрольная точка: 30 дней безаварийной работы
12

Этап 6: Подготовка к коммерциализации

  • Упаковка продукта
  • Маркетинговые материалы
  • Запуск продаж
Контрольная точка: 3 подписанных клиента

Инфраструктура и МТО

Вычислительные ресурсы:

GPU-сервер: 2×NVIDIA A100 40GB для обучения
Inference-кластер: 4×RTX 4090 для продакшена
Edge-устройства: 10×Jetson Orin для пилотов
Общая вычислительная мощность: 2.5 PFLOPS

Сетевая инфраструктура:

Магистраль: 10 Gbps redundant
Хранилище: 100 TB raw (50 TB usable в RAID-6)
Backup: Отдельный NAS + облачный S3
Мониторинг: 24/7 NOC

Помещения и рабочие места:

Серверная: 15 м², климат-контроль, ИБП 20kVA
Офис разработки: 60 м², 5 рабочих мест
Лаборатория тестирования: 40 м² с тестовым производством
Демо-зона: 25 м² для презентаций клиентам

Готовность инфраструктуры: