Soporte SSML

4 min read

SSML (Speech Synthesis Markup Language) es un marcado de estilo XML que controla cómo se pronuncia el texto. Úsalo para un control preciso sobre el énfasis, las pausas, el tono y la pronunciación. Disponible en los planes Pro y Agency.

Activar SSML

  1. Ve a Texto a Voz - TTSWP → Contenido.
  2. Activa Permitir SSML en el contenido del artículo.
  3. Guarda.

Una vez activado, las etiquetas SSML dentro del contenido del artículo se envían directamente a ElevenLabs en lugar de leerse como texto.

Etiquetas SSML básicas

Pausas

Inserta un silencio de cualquier duración.

<break time="500ms" />

Valores: de 100ms a 10s. Úsalas para pausas dramáticas o ritmo natural.

Énfasis

Destaca una palabra o frase.

<emphasis level="moderate">palabra importante</emphasis>

Niveles: none, reduced, moderate, strong.

Forma hablada de números y fechas

Fuerza una lectura específica.

<say-as interpret-as="date">2026-04-18</say-as>
<say-as interpret-as="telephone">555-1234</say-as>
<say-as interpret-as="characters">NASA</say-as>

Valores comunes de interpret-as: date, time, telephone, characters, cardinal, ordinal.

Pronunciación fonética

Especifica la pronunciación en IPA (Alfabeto Fonético Internacional).

<phoneme alphabet="ipa" ph="təˈmeɪtoʊ">tomato</phoneme>

Útil para términos técnicos, palabras extranjeras o nombres de marca que la pronunciación predeterminada no capta bien.

SSML en el editor de bloques

Añade SSML dentro de un bloque HTML personalizado. Los bloques de texto normales convierten < y > en caracteres de escape, por lo que las etiquetas SSML aparecerían como texto plano.

<!-- Bloque HTML personalizado -->
Bienvenido a mi artículo.
<break time="500ms" />
Hoy hablamos de <emphasis level="strong">texto a voz</emphasis> en WordPress.

SSML en shortcodes

Los shortcodes aceptan SSML dentro del contenido:

[mementor-tts]
Aquí hay una <break time="700ms" /> pausa dramática.
[/mementor-tts]

Qué no está soportado

ElevenLabs no es compatible con todas las funciones de SSML. Estas etiquetas se ignoran o generan errores:

  • <audio> para archivos de audio en línea
  • <mark> para marcas de eventos
  • <voice> para cambiar voces a mitad de una oración
  • <w> con atributos POS

Usa la sustitución de palabras o una voz diferente en lugar de estas etiquetas.

Cuándo usar SSML frente a alternativas más simples

Objetivo Usa
Corregir la pronunciación de una palabra Sustitución de palabras (más fácil)
Añadir pausas cortas Pausas personalizadas (sin SSML)
Enfatizar una frase SSML <emphasis>
Formato específico de fechas/números SSML <say-as>
Pronunciación fonética SSML <phoneme>

Páginas relacionadas