SSML 支持

4 min read

SSML(语音合成标记语言)是一种 XML 风格的标记语言,用于控制文本的朗读方式。可对重音、停顿、音调和发音进行精细控制。适用于 Pro 和 Agency 计划。

启用 SSML

  1. 前往 文字转语音 → 内容
  2. 开启 允许在文章内容中使用 SSML
  3. 保存。

启用后,文章内容中的任何 SSML 标签都会直接传递给 ElevenLabs,而不会被当作普通文本朗读。

基础 SSML 标签

停顿

插入任意时长的静音。

<break time="500ms" />

可选值:100ms10s。适用于戏剧性停顿或自然节奏。

重音

突出某个词语或短语。

<emphasis level="moderate">重要词语</emphasis>

级别:nonereducedmoderatestrong

数字和日期的朗读形式

强制指定特定读法。

<say-as interpret-as="date">2026-04-18</say-as>
<say-as interpret-as="telephone">555-1234</say-as>
<say-as interpret-as="characters">NASA</say-as>

常用 interpret-as 值:datetimetelephonecharacterscardinalordinal

音标发音

指定 IPA(国际音标)发音。

<phoneme alphabet="ipa" ph="təˈmeɪtoʊ">tomato</phoneme>

适用于默认发音不准确的技术术语、外来词或品牌名称。

在区块编辑器中使用 SSML

自定义 HTML 区块中添加 SSML。普通文本区块会对 <> 进行转义,导致 SSML 标签以文本形式显示。

<!-- 自定义 HTML 区块 -->
欢迎阅读本文。
<break time="500ms" />
今天我们将讨论 WordPress 中的 <emphasis level="strong">文字转语音</emphasis> 功能。

在短代码中使用 SSML

短代码内容中可以使用 SSML:

[mementor-tts]
这里有一个 <break time="700ms" /> 戏剧性停顿。
[/mementor-tts]

不支持的功能

ElevenLabs 并不支持所有 SSML 特性。以下标签会被忽略(或导致错误):

  • <audio> 用于内嵌音频文件
  • <mark> 用于事件标记
  • <voice> 用于句中切换声音
  • 带有 POS 属性的 <w>

遇到这些情况,请改用词语替换或其他声音。

SSML 与简单替代方案的选择

目标 使用方式
修正单个词的发音 词语替换(更简便)
添加短暂停顿 自定义停顿(无需 SSML)
强调某个短语 SSML <emphasis>
指定日期/数字格式 SSML <say-as>
音标发音 SSML <phoneme>

相关页面