Configuração de Voz

Resumo

ItemValor
auto_ttstrue
TTS Providergoogle-wavenet
Vozpt-BR-Wavenet-B (masculino)
STT Providerlocal (faster-whisper)
Modelo STTbase

Regras de Espelhamento

Padrão: Responder em Áudio

Quando o usuário envia uma mensagem de áudio, o Hermes responde com áudio (TTS via Google WaveNet).

Exceção: Responder por Escrito

Se no áudio o usuário disfrase como “me responda por escrito”, “não grave áudio”, “apenas por escrito” — o Hermes responde em texto, mesmo sendo áudio.

Entrada de Texto

Quando o usuário escreve, o Hermes responde por escrito (sem TTS).

TTS: Google WaveNet B

  • Provider: google-wavenet (custom command)
  • Comando: python3 ~/.hermes/scripts/gcloud_tts_provider.py --text {input_path} --output {output_path}
  • Formato: OGG
  • Chave API: em ~/.hermes/docs/ (protegida)

STT: faster-whisper

  • Modelo: base (bom equilíbrio velocidade/precisão)
  • Execução: local (sem custo de API)
  • Idioma: auto-detect (configurado para PT-BR)