SSML(语音合成标记语言)是一种 XML 风格的标记语言,用于控制文本的朗读方式。可对重音、停顿、音调和发音进行精细控制。适用于 Pro 和 Agency 计划。
启用 SSML
- 前往 文字转语音 → 内容。
- 开启 允许在文章内容中使用 SSML。
- 保存。
启用后,文章内容中的任何 SSML 标签都会直接传递给 ElevenLabs,而不会被当作普通文本朗读。
基础 SSML 标签
停顿
插入任意时长的静音。
<break time="500ms" />
可选值:100ms 至 10s。适用于戏剧性停顿或自然节奏。
重音
突出某个词语或短语。
<emphasis level="moderate">重要词语</emphasis>
级别:none、reduced、moderate、strong。
数字和日期的朗读形式
强制指定特定读法。
<say-as interpret-as="date">2026-04-18</say-as>
<say-as interpret-as="telephone">555-1234</say-as>
<say-as interpret-as="characters">NASA</say-as>
常用 interpret-as 值:date、time、telephone、characters、cardinal、ordinal。
音标发音
指定 IPA(国际音标)发音。
<phoneme alphabet="ipa" ph="təˈmeɪtoʊ">tomato</phoneme>
适用于默认发音不准确的技术术语、外来词或品牌名称。
在区块编辑器中使用 SSML
在 自定义 HTML 区块中添加 SSML。普通文本区块会对 < 和 > 进行转义,导致 SSML 标签以文本形式显示。
<!-- 自定义 HTML 区块 -->
欢迎阅读本文。
<break time="500ms" />
今天我们将讨论 WordPress 中的 <emphasis level="strong">文字转语音</emphasis> 功能。
在短代码中使用 SSML
短代码内容中可以使用 SSML:
[mementor-tts]
这里有一个 <break time="700ms" /> 戏剧性停顿。
[/mementor-tts]
不支持的功能
ElevenLabs 并不支持所有 SSML 特性。以下标签会被忽略(或导致错误):
<audio>用于内嵌音频文件<mark>用于事件标记<voice>用于句中切换声音- 带有 POS 属性的
<w>
遇到这些情况,请改用词语替换或其他声音。
SSML 与简单替代方案的选择
| 目标 | 使用方式 |
|---|---|
| 修正单个词的发音 | 词语替换(更简便) |
| 添加短暂停顿 | 自定义停顿(无需 SSML) |
| 强调某个短语 | SSML <emphasis> |
| 指定日期/数字格式 | SSML <say-as> |
| 音标发音 | SSML <phoneme> |