Технологии EVOIS. Рассказываем как и почему они работают эффективно.
В основе интеллектуального голосового ассистента EVOIS для автомобильной промышленности лежит несколько взаимосвязанных модулей, обеспечивающих комплексное решение для управления функциями автомобиля голосом.
Как мы создаем собственные технологии и адаптируем существующие для создания голосовых ассистентов нового поколения нашим клиентам: КАМАЗ, АТОМ и другим автопроизводителям.
KWS (Keyword Spotting)
В реальном времени распознает ключевые фразы ("Эй, автомобиль") и быстрые команды ("Громче", "Тише" и т.д.).
Решение ENBISYS энергоэффективно, может работать на CPU/GPU/NPU и обеспечивает высокую точность срабатывания и минимальное время реакции (Latency).
ASR (Automatic Speech Recognition)
Точное преобразование речи в текст в сложных акустических условиях с поддержкой потоковой и пакетной обработки.
Решение ENBISYS основано на SOTA алгоритмах, глубоко переработанных для работы на мобильных, embedded и edge устройствах.
NLU (Natural Language Understanding)
Преобразует текст в структурированные команды (JSON) в машиночитаемом виде.
Ноу-хау ENBISYS — оптимальное соотношение между разнообразием реплик, вычислительными ресурсами и скоростью разработки.
Embedded LLM (Large Language Model)
Продвинутый модуль NLU для обработки неявных запросов, генерации ответов и поиска информации в локальной базе (RAG).
Преимущество подхода ENBISYS:
✓ Минимизация RAM/CPU ✓ Ускорение на мобильных GPU/NPU ✓ Кастомная версия LLama.cpp ✓ SFT/RLHF на синтетических данных
LOGIC (Business Logic)
Управляет выполнением команд, обработкой ответов LLM и системными действиями.
Бизнес-логика подключается к CAN-шине и гарантирует безопасное выполнение команд благодаря технологии NLua.
RAG (Retrieval-Augmented Generation)
Технология извлечения релевантной информации из базы знаний и генерации ответа на вопрос пользователя на основе извлеченных знаний.
Полностью решает проблему “галлюцинаций” больших лингвистических моделей. Расширяет кругозор компактных LLM.
TTS (Text-to-Speech)
Преобразует текстовые ответы в естественную речь.
Решение ENBISYS основано на SOTA алгоритмах, глубоко переработанных для работы на мобильных, embedded и edge устройствах.
Скоро расскажем как технологии помогают водителям и пассажирам безопасно управлять функциями автомобиля голосом и получать новый опыт взаимодействия.