Configuração de Voz
Resumo
| Item | Valor |
|---|---|
| auto_tts | true |
| TTS Provider | google-wavenet |
| Voz | pt-BR-Wavenet-B (masculino) |
| STT Provider | local (faster-whisper) |
| Modelo STT | base |
Regras de Espelhamento
Padrão: Responder em Áudio
Quando o usuário envia uma mensagem de áudio, o Hermes responde com áudio (TTS via Google WaveNet).
Exceção: Responder por Escrito
Se no áudio o usuário disfrase como “me responda por escrito”, “não grave áudio”, “apenas por escrito” — o Hermes responde em texto, mesmo sendo áudio.
Entrada de Texto
Quando o usuário escreve, o Hermes responde por escrito (sem TTS).
TTS: Google WaveNet B
- Provider: google-wavenet (custom command)
- Comando:
python3 ~/.hermes/scripts/gcloud_tts_provider.py --text {input_path} --output {output_path} - Formato: OGG
- Chave API: em
~/.hermes/docs/(protegida)
STT: faster-whisper
- Modelo: base (bom equilíbrio velocidade/precisão)
- Execução: local (sem custo de API)
- Idioma: auto-detect (configurado para PT-BR)