Suporte a SSML

4 min read

SSML (Speech Synthesis Markup Language) é uma marcação no estilo XML que controla como o texto é falado. Use para controle preciso de ênfase, pausas, tom e pronúncia. Disponível nos planos Pro e Agency.

Ativar o SSML

  1. Vá para Texto a Voz - TTSWP → Conteúdo.
  2. Ative Permitir SSML no conteúdo do post.
  3. Salve.

Com o recurso ativado, qualquer tag SSML dentro do conteúdo do post é enviada diretamente ao ElevenLabs em vez de ser lida como texto.

Tags SSML básicas

Pausas

Insira um silêncio de qualquer duração.

<break time="500ms" />

Valores: de 100ms a 10s. Use para pausas dramáticas ou ritmo natural.

Ênfase

Destaque uma palavra ou frase.

<emphasis level="moderate">palavra importante</emphasis>

Níveis: none, reduced, moderate, strong.

Forma falada de números e datas

Force uma leitura específica.

<say-as interpret-as="date">2026-04-18</say-as>
<say-as interpret-as="telephone">555-1234</say-as>
<say-as interpret-as="characters">NASA</say-as>

Valores comuns de interpret-as: date, time, telephone, characters, cardinal, ordinal.

Pronúncia fonética

Especifique a pronúncia em IPA (Alfabeto Fonético Internacional).

<phoneme alphabet="ipa" ph="təˈmeɪtoʊ">tomato</phoneme>

Útil para termos técnicos, palavras estrangeiras ou nomes de marcas que a pronúncia padrão não acerta.

SSML no editor de blocos

Adicione SSML dentro de um bloco HTML personalizado. Blocos de texto comuns escapam < e >, então as tags SSML seriam exibidas como texto simples.

<!-- Bloco HTML personalizado -->
Bem-vindo ao meu artigo.
<break time="500ms" />
Hoje vamos falar sobre <emphasis level="strong">texto a voz</emphasis> no WordPress.

SSML em shortcodes

Shortcodes aceitam SSML dentro do conteúdo:

[mementor-tts]
Aqui temos uma <break time="700ms" /> pausa dramática.
[/mementor-tts]

O que não é suportado

O ElevenLabs não suporta todos os recursos do SSML. As tags abaixo são ignoradas ou causam erros:

  • <audio> para arquivos de áudio inline
  • <mark> para marcadores de evento
  • <voice> para trocar vozes no meio de uma frase
  • <w> com atributos POS

Use substituição de palavras ou uma voz diferente no lugar dessas tags.

Quando usar SSML versus alternativas mais simples

Objetivo Use
Corrigir pronúncia de uma palavra Substituição de palavras (mais fácil)
Adicionar pausas curtas Pausas personalizadas (sem SSML)
Enfatizar uma frase SSML <emphasis>
Formato específico de data/número SSML <say-as>
Pronúncia fonética SSML <phoneme>

Páginas relacionadas