Технологии EVOIS. Рассказываем как и почему они работают эффективно.
В основе интеллектуального голосового ассистента EVOIS для автомобильной промышленности лежит несколько взаимосвязанных модулей, обеспечивающих комплексное решение для управления функциями автомобиля голосом.
Как мы создаем собственные технологии и адаптируем существующие для создания голосовых ассистентов нового поколения нашим клиентам: КАМАЗ, АТОМ и другим автопроизводителям.
KWS (Keyword Spotting)
В реальном времени распознает ключевые фразы ("Эй, автомобиль") и быстрые команды ("Громче", "Тише" и т.д.).
Решение ENBISYS энергоэффективно, может работать на CPU/GPU/NPU и обеспечивает высокую точность срабатывания и минимальное время реакции (Latency).
Решение ENBISYS энергоэффективно, может работать на CPU/GPU/NPU и обеспечивает высокую точность срабатывания и минимальное время реакции (Latency).
ASR (Automatic Speech Recognition)
Точное преобразование речи в текст в сложных акустических условиях с поддержкой потоковой и пакетной обработки.
Решение ENBISYS основано на SOTA алгоритмах, глубоко переработанных для работы на мобильных, embedded и edge устройствах.
Решение ENBISYS основано на SOTA алгоритмах, глубоко переработанных для работы на мобильных, embedded и edge устройствах.
NLU (Natural Language Understanding)
Преобразует текст в структурированные команды (JSON) в машиночитаемом виде.
Ноу-хау ENBISYS — оптимальное соотношение между разнообразием реплик, вычислительными ресурсами и скоростью разработки.
Ноу-хау ENBISYS — оптимальное соотношение между разнообразием реплик, вычислительными ресурсами и скоростью разработки.
Embedded LLM (Large Language Model)
Продвинутый модуль NLU для обработки неявных запросов, генерации ответов и поиска информации в локальной базе (RAG).
Преимущество подхода ENBISYS:
✓ Минимизация RAM/CPU
✓ Ускорение на мобильных GPU/NPU
✓ Кастомная версия LLama.cpp
✓ SFT/RLHF на синтетических данных
Преимущество подхода ENBISYS:
✓ Минимизация RAM/CPU
✓ Ускорение на мобильных GPU/NPU
✓ Кастомная версия LLama.cpp
✓ SFT/RLHF на синтетических данных
LOGIC (Business Logic)
Управляет выполнением команд, обработкой ответов LLM и системными действиями.
Бизнес-логика подключается к CAN-шине и гарантирует безопасное выполнение команд благодаря технологии NLua.
Бизнес-логика подключается к CAN-шине и гарантирует безопасное выполнение команд благодаря технологии NLua.
RAG (Retrieval-Augmented Generation)
Технология извлечения релевантной информации из базы знаний и генерации ответа на вопрос пользователя на основе извлеченных знаний.
Полностью решает проблему “галлюцинаций” больших лингвистических моделей. Расширяет кругозор компактных LLM.
Полностью решает проблему “галлюцинаций” больших лингвистических моделей. Расширяет кругозор компактных LLM.
TTS (Text-to-Speech)
Преобразует текстовые ответы в естественную речь.
Решение ENBISYS основано на SOTA алгоритмах, глубоко переработанных для работы на мобильных, embedded и edge устройствах.
Решение ENBISYS основано на SOTA алгоритмах, глубоко переработанных для работы на мобильных, embedded и edge устройствах.
Скоро расскажем как технологии помогают водителям и пассажирам безопасно управлять функциями автомобиля голосом и получать новый опыт взаимодействия.