Maqueen Plus V3 x UNIHIKER K10 Lição 8: Carro robô com controle por voz

auroraAA Aug 05.2025

0 608 Easy

Na era da inteligência atual, a tecnologia de controle por voz já é amplamente utilizada em diversos dispositivos, como casas inteligentes, alto-falantes inteligentes e smartphones. Através de comandos de voz simples, podemos controlar facilmente os dispositivos para realizar diversas tarefas. Então, podemos aplicar essa tecnologia em carrinhos robóticos?

A seguir, utilizaremos o UNIHIKER K10 e um carrinho para construir um veículo inteligente com "capacidade de compreensão de voz", onde os usuários poderão controlar as operações correspondentes através de comandos de voz simples. Este não é apenas um projeto interessante, mas também nos ajuda a compreender melhor a aplicação da tecnologia de reconhecimento de voz no controle de robôs.

Objetivos da Tarefa

Os usuários podem controlar o carrinho com comandos de voz em inglês simples, como avançar, recuar, virar à esquerda, virar à direita, ligar/desligar os faróis, entre outros.

Pontos de Aprendizado

1. Dominar o uso básico da função de reconhecimento de voz

2. Implementar a exibição em tempo real dos resultados do controle por voz na tela do UNIHIKER K10

3. Aprender a analisar o conteúdo de voz e convertê-lo em comandos de controle para operar o carrinho

4. Melhorar a praticidade e a capacidade de resposta do sistema de interação por voz

Lista de Materiais

Hardware necessário:

HARDWARE LIST

1 Maqueen Plus V3

Link

1 UNIHIKER K10

Link

Software necessário:

Software de programação Mind+ (versão V1.8.1 RC1.0 ou superior) ×1

Link para download: https://mindplus.cc/

Hands-On Practice

Em um sistema inteligente de controle por voz, a ideia de “dar um comando verbal para fazer o carro robótico se mover” parece empolgante e desafiadora. Este projeto irá guiá-lo passo a passo para entender como funciona o reconhecimento de voz. Por meio de exercícios de programação, você irá construir um sistema inteligente de controle por voz que pode “ouvir, agir e responder”.

Prática

Em um sistema inteligente de controle por voz, "falar um comando para o carrinho se mover" parece muito legal e desafiador. Este projeto irá guiá-lo passo a passo para entender como funciona o reconhecimento de voz e, através de exercícios de programação, construir um sistema de controle por voz inteligente que "obedece, se move e responde".

Tarefa 1: Inicialização do Reconhecimento de Voz

Configure o banco de dados de comandos de voz e ative a função de reconhecimento de voz. Após o reconhecimento bem-sucedido, exiba os comandos reconhecidos em tempo real na tela do UNIHIKER K10, criando uma conexão entre voz e feedback visual.

Tarefa 2: Controle de Movimento

Faça com que o carrinho "compreenda os comandos e execute ações" — com base nos comandos de voz reconhecidos, execute as instruções correspondentes, como avançar, recuar, virar à esquerda ou à direita, alcançando um controle preciso do comportamento do carrinho por voz.

Tarefa 1: Inicialização do Reconhecimento de Voz

1. Conexão de Hardware

Utilize um cabo USB 3.0 para Type-C para conectar o carrinho montado ao computador. Observação: A extremidade Type-C deve ser conectada ao UNIHIKER K10.

2. Preparação do Software

Abra o Mind+ e complete os preparativos do software conforme ilustrado abaixo.

3. Programação

(1) Inicializar a função de reconhecimento de voz No "UNIHIKER K10 na partida", utilize o comando "Configurar reconhecimento de fala tempo de ativação língua" para inicializar o modo de reconhecimento de voz como contínuo, definir o tempo de ativação para 6 segundos e selecionar o idioma como Inglês. Esta etapa garante que o módulo de reconhecimento de voz seja iniciado corretamente e entre em estado de escuta após ser ativado pelo usuário.

Atenção: atualmente, o reconhecimento de voz só suporta os idiomas chinês e inglês.

(2) Adicionar palavras de comando para reconhecimento de voz:

Utilize o comando "Adicionar comando de fala ID comando" para atribuir um ID único a cada palavra de comando, facilitando posterior reconhecimento e processamento. Por exemplo:

- Palavra de comando "Forward" → ID 0

- Palavra de comando "Backward" → ID 1

- Palavra de comando "Left Turn" → ID 2

- Palavra de comando "Right Turn" → ID 3

- Palavra de comando "Turn On Headlights" → ID 4

- Palavra de comando "Turn Off Headlights" → ID 5

(3) Verificar se o reconhecimento de voz foi ativado

Na instrução "repita sempre", use a estrutura "se...então...senão" para avaliar a condição "O estado atual do reconhecimento de fala está em modo de despertar?". Quando o usuário disser a palavra de ativação pré-definida "Hi, Telly", a função de reconhecimento de voz entrará em modo de escuta, pronta para receber comandos de voz.

(4) Reconhecer e exibir comandos de voz

Após ativação do reconhecimento de voz, verifique se o comando dito pelo usuário é "temperatura". O método específico é verificar se a condição "Comando de fala ID 0 detectado?" é verdadeira.

Se for detectado o ID de comando 0 (indicando que o usuário disse “Forward”), use o comando “mostrar conteúdo em cache” seguido do comando “Cache exibir texto nas coordenadas X Y tamanho da fonte cor quebrar linha após caracteres limpar automaticamente” para mostrar o comando reconhecido “avançar” na tela do UNIHIKER K10.

Os comandos "Backward", "Turn left", "Turn right", "Turn on headlights", and "Turn off headlights" também devem ser exibidos na tela do UNIHIKER K10 usando o mesmo método.

Quando o reconhecimento de voz estiver no estado ativado, exiba os comandos de voz reconhecidos na tela do UNIHIKER K10. Caso contrário, exiba o texto de aviso "Por favor, diga a palavra de ativação 'Hi, Telly' para ativar o reconhecimento de voz". O programa completo segue abaixo:

4. Execução do Programa

Antes de executar o programa, certifique-se que o UNIHIKER K10 está corretamente conectado ao computador via cabo USB. Após verificação, clique no botão "Executar" no software. Após o upload bem-sucedido do programa, ative o reconhecimento de voz com a palavra-chave "Hi, Telly", então pronuncie os comandos de voz - os comandos reconhecidos serão exibidos na tela do UNIHIKER K10.

Tarefa 2: Controle de Movimento

1. Programação

Na Tarefa 1, já implementamos a funcionalidade básica de reconhecimento de voz. Agora, vamos expandir esta funcionalidade adicionando o controle de movimentos.

Quando o comando ID 0 ("Forward") for detectado, use o comando "Configurar tudo motor direção girar para frente velocidade 100" e "espere 1 segundo" para mover o carro para frente por 1 segundo. Em seguida, use "Configurar tudo motor parar" para pausar o carro.

Quando o comando ID 1 ("Backward") for detectado, use o mesmo método para configurar o carro para mover-se para trás por 1 segundo e depois parar.

Quando o comando ID 2 ("Turn Left") for detectado, use os comandos "Configurar direita motor direção girar para frente velocidade 200", "Configurar esquerda motor direção girar para frente velocidade 0" e "espere 1 segundo" para virar o carro à esquerda por 1 segundo. Depois, use "Configurar tudo motor parar" para pausar o carro.

Quando o comando ID 3 ("Turn Right") for detectado， use o mesmo método do giro à esquerda para virar o carro à direita por 1 segundo e depois pausar.

Quando o comando ID 4 ("Turn On Headlights") for detectados, use o comando "Cor para luzes todo do veículo" para controlar os dois faróis dianteiros do carro, exibindo vermelho para acender as luzes.

Quando o comando ID 5 ("Turn Off Headlights") for detectado, usese o comando "Cor para luzes todo do veículo" para controlar os dois faróis dianteiros do carro, exibindo preto para desligar as luzes.O programa completo segue abaixo:

2. Execução do Programa

Antes de executar o programa, verifique se o UNIHIKER K10 está corretamente conectado ao computador via cabo USB. Após confirmação, clique no botão "Executar" no software. Após o upload bem-sucedido do programa, ative o reconhecimento de voz com a palavra de ativação "Hi，Telly" - ao reconhecer os comandos de voz configurados, o carrinho executará as operações correspondentes.

Base de Conhecimento

1. As Tecnologias por Trás do Reconhecimento e Síntese de Voz

Na Lição 4, aprendemos o fluxo comum de controle por voz: reconhecimento → correspondência → reprodução. Reconhecimento refere-se ao reconhecimento de voz, e reprodução à síntese de voz. Mas você conhece as tecnologias avançadas por trás desses processos? Quando dizemos "entender" e "falar", na verdade estamos nos referindo a essas duas tecnologias principais: reconhecimento e síntese de voz.

Reconhecimento de Voz (Speech Recognition)

É o processo de converter sinais de voz em texto. A tecnologia subjacente geralmente utiliza Redes Neurais Profundas (DNN) ou Redes Neurais Recorrentes (RNN), treinando modelos para compreender características fonéticas da linguagem humana. Sistemas modernos também incorporam detecção de atividade vocal, segmentação de fala e reconhecimento contextual, permitindo que o sistema "ouça" com maior precisão.

Síntese de Voz (Text-to-Speech, TTS)

É a tecnologia que "lê" texto em voz alta. Os primeiros sistemas TTS soavam mecânicos, enquanto os novos (como WaveNet e FastSpeech) geram vozes mais naturais, podendo até imitar diferentes gêneros, idades ou estilos, fazendo seu carrinho não apenas "falar", mas ter "personalidade".

2. Voz vs Botões: Qual é Melhor para Interações Futuras?

Embora estejamos acostumados a clicar em botões ou deslizar telas, a voz como "método de interação sem contato" mostra vantagens únicas em muitos cenários:

- Direção: Controle por voz de navegação e chamadas mantém as mãos livres para segurança

- Casa Inteligente: Controle vocal de luzes, ar-condicionado e cortinas torna a vida mais inteligente

- Tecnologia Assistiva: Mais acessível que botões visuais para idosos ou deficientes visuais

- Ambientes Especiais: Laboratórios, hospitais e oficinas onde o uso das mãos é limitado

Reflita:

Seu projeto de carrinho poderia ter um "modo silencioso" ou controle híbrido "voz+botões"?

Robôs futuros deveriam reconhecer vozes individuais para interações personalizadas?

Desafio Prático

Já dominamos a habilidade de controlar os movimentos do carrinho através de comandos de voz. Agora, experimente adicionar o comando "Tocar música interna em segundo plano" para implementar funcionalidade de feedback sonoro. Por exemplo, ao reconhecer o comando "avançar", o carrinho primeiro executa o movimento de avanço e depois ativa o feedback sonoro, tornando a interação mais natural e dinâmica.

Dica: A reprodução de voz deve ocorrer somente após a conclusão da ação correspondente pelo carrinho.