Новости Enbisys

Технологии платформы EVOIS для создания голосовых помощников нового поколения

Технологии ИИ

Технологии EVOIS. Рассказываем как и почему они работают эффективно.

В основе интеллектуального голосового ассистента EVOIS для автомобильной промышленности лежит несколько взаимосвязанных модулей, обеспечивающих комплексное решение для управления функциями автомобиля голосом.

Как мы создаем собственные технологии и адаптируем существующие для создания голосовых ассистентов нового поколения нашим клиентам: КАМАЗ, АТОМ и другим автопроизводителям.

KWS (Keyword Spotting)

В реальном времени распознает ключевые фразы ("Эй, автомобиль") и быстрые команды ("Громче", "Тише" и т.д.).

Решение ENBISYS энергоэффективно, может работать на CPU/GPU/NPU и обеспечивает высокую точность срабатывания и минимальное время реакции (Latency).

ASR (Automatic Speech Recognition)

Точное преобразование речи в текст в сложных акустических условиях с поддержкой потоковой и пакетной обработки.

Решение ENBISYS основано на SOTA алгоритмах, глубоко переработанных для работы на мобильных, embedded и edge устройствах.

NLU (Natural Language Understanding)

Преобразует текст в структурированные команды (JSON) в машиночитаемом виде.

Ноу-хау ENBISYS — оптимальное соотношение между разнообразием реплик, вычислительными ресурсами и скоростью разработки.

Embedded LLM (Large Language Model)

Продвинутый модуль NLU для обработки неявных запросов, генерации ответов и поиска информации в локальной базе (RAG).

Преимущество подхода ENBISYS:

✓ Минимизация RAM/CPU
✓ Ускорение на мобильных GPU/NPU
✓ Кастомная версия LLama.cpp
✓ SFT/RLHF на синтетических данных

LOGIC (Business Logic)

Управляет выполнением команд, обработкой ответов LLM и системными действиями.

Бизнес-логика подключается к CAN-шине и гарантирует безопасное выполнение команд благодаря технологии NLua.

RAG (Retrieval-Augmented Generation)

Технология извлечения релевантной информации из базы знаний и генерации ответа на вопрос пользователя на основе извлеченных знаний.

Полностью решает проблему “галлюцинаций” больших лингвистических моделей. Расширяет кругозор компактных LLM.

TTS (Text-to-Speech)

Преобразует текстовые ответы в естественную речь.

Решение ENBISYS основано на SOTA алгоритмах, глубоко переработанных для работы на мобильных, embedded и edge устройствах.

Скоро расскажем как технологии помогают водителям и пассажирам безопасно управлять функциями автомобиля голосом и получать новый опыт взаимодействия.