Dispositivos inteligentes já fazem parte da vida de muitas pessoas, a Alexa, assistente virtual da Amazon, não só comprova isso, mas também constata o crescimento deste dispositivo no mercado.
Em 2020, a procura por dispositivos inteligentes e assistentes virtuais por voz cresceu 47%, aponta matéria do Olhar Digital.
Além de possuir inteligência artificial integrada para aprender novos padrões, a assistente virtual possui uma forma quase humana de se comunicar, deixando no passado a voz robotizada.
Isso é possível pois novos algoritmos são criados deixando a interface de usuário de voz cada vez melhor.
Para atender as constantes modificações e inovações do mercado de dispositivos inteligentes, a Espressif lançou as soluções AI Lab. Tratam-se de algoritmos de áudio (AFE) qualificados para dispositivos integrados com a Alexa e que rodam nos módulos ESP32-S3.
Solução Espressif – AI Lab
O aumento de dispositivos inteligentes com comunicação por voz aumentou as expectativas dos clientes quanto ao desempenho de interface de usuário de voz, o VUI – do inglês voice-user interface.
Como estes dispositivos podem ser utilizados em ambientes barulhentos ou ter de responder a comandos de voz enquanto está reproduzindo músicas, um VUI precisa ser responsivo nestes ambientes. Ou seja, precisa diferenciar o som reproduzido e o ruído do ambiente do comando de voz recebido.
Para isso, o AI Lab da Espressif desenvolveu algoritmos de front-end de áudio (AFE) que foram qualificados como “Software Audio Front-End Solution” para dispositivos integrados Amazon, como a Alexa.
Os algoritmos AFE da Espressif tiram proveito do recém-anunciado ESP32-S3 SoC, que integra IA e aceleração DSP.
A combinação de ESP32-S3 com os algoritmos AFE fornece uma solução de alto desempenho para dispositivos Alexa Built-in, ou seja, dispositivos que integrem a inteligência Alexa.
Vale destacar que, os algoritmos AFE também funcionarão nos futuros SoCs da Espressif que terão suporte para AI e aceleração DSP.
Desta forma, o AI Lab da Espressif atendeu a esses requisitos de comunicação por voz desenvolvendo um conjunto de algoritmos que incluem cancelamento de eco acústico multicanal, separação cega da fonte (formação de feixe), detecção de atividade de voz e redução de ruído.
Funcionamento:
Esses algoritmos funcionam com dois microfones separados por uma distância de apenas 2 cm, fornecendo um sinal de áudio filtrado para a interface de voz do usuário, que pode então processá-lo com eficácia tanto offline quanto online.
O ESP32-S3 SoC da Espressif está equipado com AI e aceleração DSP, e os algoritmos AFE são otimizados para uso no ESP32-S3. Esses algoritmos consomem apenas 12-20% da CPU, bem como 220 KB de memória interna e 240 KB de memória externa. Isso deixa espaço adicional para outros aplicativos rodarem no mesmo SoC.
A Espressif fornece produtos com o design acústico de seus produtos otimizado, para que o desenvolvedor possa se concentrar na aplicação principal do seu produto.
Para obter mais informações sobre as soluções da Espressif, entre em contato conosco. Além do suporte às soluções da linha, contamos com um time de engenheiros capacitados para lhe auxiliar no desenvolvimento do seu projeto com integração Alexa.
Saiba mais sobre os algoritmos AFE.
Leia também:
Seu dispositivo conectado a Alexa
Nos acompanhe nas Redes Sociais