Conformité audio WCAG 2.2 pour WordPress : guide 2026
L'audio WordPress doit satisfaire au moins quatre critères de succès WCAG 2.2 : 1.4.2 Contrôle du son, 2.1.1 Clavier, 2.5.8 Taille de la cible (nouveau dans la version 2.2) et 4.1.2 Nom, rôle, valeur. La directive européenne sur l'accessibilité, en vigueur depuis le 28 juin 2025, en fait une obligation légale pour tout site servant des clients dans l'UE. Le lecteur audio WordPress par défaut et la plupart des plugins audio tiers ne respectent pas plusieurs de ces exigences sans modification.
Ce guide est la liste de contrôle pratique que nous utilisons chez Mementor lors des audits de conformité WCAG 2.2 sur des sites WordPress. Nous abordons les deux aspects de la question audio : l'audio en tant que contenu soumis à ses propres règles d'accessibilité, et l'audio en tant que fonctionnalité d'accessibilité pour le contenu textuel.
Pourquoi la conformité audio est un enjeu majeur en 2026
Trois facteurs se sont combinés en 2025 pour en faire un sujet urgent. La directive européenne sur l'accessibilité est entrée en vigueur le 28 juin 2025. Le rapport WebAIM Million 2025 a relevé des manquements WCAG détectables sur 96,3 % des pages d'accueil. Les litiges ADA aux États-Unis ont continué d'augmenter, avec les sites WordPress en bonne place parmi les plus de 4 000 affaires d'accessibilité web déposées dans l'année.
Le schéma que nous observons dans nos audits est constant. Les propriétaires de sites supposent que leur thème gère l'accessibilité. Le thème hérite de ce que le plugin audio fournit. Et le plugin audio fournit des boutons trop petits, des curseurs qui bloquent les utilisateurs au clavier, et des ratios de contraste qui échouent dès la première vérification manuelle.
La liste de contrôle WCAG 2.2 complète pour l'audio
Huit critères de succès concernent directement l'audio sur un site WordPress. Le tableau ci-dessous indique ce que chacun signifie en pratique, ce que le lecteur audio WordPress par défaut réussit ou rate, et comment le lecteur TTSWP y répond. Les critères marqués NOUVEAU sont apparus avec WCAG 2.2 en octobre 2023.
| Critère | Niveau | Ce que cela implique | Audio WP par défaut | Lecteur TTSWP |
|---|---|---|---|---|
| 1.2.1 Alternative audio | A | Un contenu uniquement audio nécessite une alternative textuelle | Dépend du thème | Le texte de la page fait office d'alternative |
| 1.4.2 Contrôle du son | A | Mettre en pause ou arrêter tout audio lancé automatiquement pendant plus de 3 secondes | Contrôles natifs du navigateur | Lecture uniquement à la demande de l'utilisateur |
| 1.4.3 Contraste (minimum) | AA | Ratio de 4,5:1 pour le texte de l'interface et les icônes significatives | Dépend du thème | Toutes les valeurs par défaut atteignent 4,5:1 |
| 2.1.1 Clavier | A | Tous les contrôles accessibles et utilisables au clavier | Dépend du navigateur | Prise en charge complète du clavier |
| 2.4.11 Focus non masqué NOUVEAU | AA | Les éléments fixes ne doivent pas masquer l'élément ciblé par le focus | Non applicable | La barre fixe s'adapte en cas de conflit de focus |
| 2.5.7 Gestes de glisser NOUVEAU | AA | Les interactions par glisser nécessitent une alternative à pointeur unique | Glisser uniquement sur le curseur | Clic pour positionner et touches fléchées |
| 2.5.8 Taille de la cible NOUVEAU | AA | Les cibles interactives doivent faire au moins 24 x 24 pixels CSS | Dépend du thème | Tous les contrôles font 24 pixels ou plus |
| 4.1.2 Nom, rôle, valeur | A | Chaque contrôle expose un nom, un rôle et un état accessibles | Partiel | Implémentation ARIA complète |
La page Media Accessibility User Requirements du W3C est la référence officielle pour ces critères. Nous nous concentrons sur les huit ci-dessus car ils s'appliquent aux lecteurs audio eux-mêmes. Les sous-titres (1.2.2) et l'audiodescription (1.2.3) sont également pertinents, mais concernent la vidéo et non la narration audio pure.

L'exception de l'alternative média pour le texte
Voici la règle que 95 % des articles sur la conformité passent sous silence. Le WCAG définit une alternative média pour le texte comme un média ne présentant aucune information au-delà de ce qui figure déjà dans le texte. Quand une narration de synthèse vocale lit un article existant, l'audio est une alternative média au texte de la page. Le texte de la page lui-même constitue la transcription.
Cela signifie qu'une version audio générée par synthèse vocale d'un article ne nécessite pas de fichier de transcription séparé. WebAIM l'explique clairement. La condition est que l'audio soit clairement identifié comme alternative média, afin que les utilisateurs comprennent qu'ils ne manquent aucune information en le passant. Un titre comme «Écouter cet article» ou un lecteur étiqueté «Version audio de cet article» suffit.
Cette exception ne s'applique pas si l'audio ajoute des commentaires, une musique de fond porteuse de sens ou des passages absents du texte. La narration pure du contenu de la page est bien éligible. Nous nous appuyons régulièrement sur ce point quand nous conseillons des clients éditeurs qui craignent que l'ajout d'audio crée de nouvelles obligations de transcription.
Les nouveautés WCAG 2.2 pour l'audio
Trois nouveaux critères de niveau AA affectent directement les lecteurs audio.
2.5.8 Taille de la cible (minimum)
Chaque contrôle interactif doit offrir une cible d'au moins 24 x 24 pixels CSS. C'est le critère qui met en défaut le plus grand nombre de plugins audio WordPress. Dans nos audits de sites WordPress utilisant des plugins audio tiers, les boutons de retour et d'avance rapide sont systématiquement en dessous du seuil. Les designers ont privilégié la compacité avant que WCAG 2.2 n'introduise la règle des 24 pixels, et peu de mainteneurs de plugins ont rattrapé ce retard. Les styles du thème par défaut réduisent parfois encore les cibles.
La correction passe généralement par les marges internes, pas par la taille de l'icône. Une icône SVG de 16 pixels dans un bouton avec 4 pixels de rembourrage sur chaque côté atteint le seuil de 24 pixels sans modifier l'apparence visuelle.
2.4.11 Focus non masqué
Les barres audio fixes en bas de page recouvrent l'élément sur lequel l'utilisateur au clavier a son focus. Si un lien ciblé se retrouve derrière la barre, le critère échoue. La solution consiste soit à rendre la barre fermable, soit à laisser de l'espace au-dessus de l'élément ciblé, soit à utiliser scroll-padding-bottom sur le document pour que les éléments avec focus restent visibles.
2.5.7 Gestes de glisser
Les barres de progression et les curseurs de volume qui ne fonctionnent qu'en glisser-déposer échouent à ce critère. Chaque interaction par glissement nécessite une alternative à pointeur unique. Le clic pour se positionner sur une barre de progression satisfait à cette exigence. Le contrôle par touches fléchées sur un élément correctement construit avec role="slider" aussi.
Erreurs courantes sur les sites WordPress auditées
Les mêmes problèmes reviennent sur les sites clients. Nous observons quatre types d'échecs le plus souvent.
Le bloc <audio> natif de WordPress affiche le lecteur du navigateur. Les contrôles audio natifs ont un long historique de comportements incohérents avec les lecteurs d'écran, et le contrôle au clavier de la position de lecture varie entre Chrome, Firefox et Safari. Les utilisateurs de NVDA ou JAWS entendent souvent les horodatages mais ne peuvent pas déplacer la position de manière fiable avec le clavier. La solution consiste à envelopper l'audio dans un lecteur personnalisé qui expose role="slider" avec les attributs ARIA de valeur appropriés.
Les lecteurs des plugins incluent des boutons inférieurs au seuil de 24 pixels. Le designer a optimisé pour la compacité avant que WCAG 2.2 n'introduise la règle. Les thèmes remplacent ensuite les styles du plugin, ce qui aggrave parfois les choses et les améliore parfois.
Les barres audio fixes masquent le contenu ciblé. Nous avons vu ce problème apparaître sur tous les sites qui utilisent un lecteur fixe en bas de page sans tester la navigation au clavier.
Le contraste sur les formes d'onde est systématiquement inférieur à 4,5:1. Les designers aiment l'onde gris clair sur fond blanc. Les lecteurs d'écran s'en moquent, mais pas les utilisateurs malvoyants, et le critère 1.4.3 échoue.
Construire un lecteur audio conforme : la liste technique
- Entourer le lecteur d'un
role="region"avec unaria-labeldescriptif. - Utiliser un vrai
<button>pour lecture, pause, avance et sourdine. Jamais un<div>avec un gestionnaire de clic. - Définir
aria-pressedsur le bouton de lecture pour exposer l'état de bascule. - Donner à chaque contrôle une cible minimale de 24 x 24 pixels CSS via le rembourrage.
- Attribuer aux curseurs de progression et de volume
role="slider"avecaria-valuemin,aria-valuemaxetaria-valuenow, et répondre aux touches fléchées. - Proposer un clic pour se positionner sur la barre de progression comme alternative sans glissement.
- Vérifier le contraste de chaque élément textuel et icône significative avec un minimum de 4,5:1.
- S'assurer que les anneaux de focus sont visibles et ne sont jamais rognés par les règles de débordement.
- Si le lecteur est fixe, laisser de l'espace focus au-dessus ou le rendre fermable.
- Identifier les lecteurs de narration par synthèse vocale comme «Version audio de cet article» pour que l'exception d'alternative média s'applique clairement.
Un bouton de lecture accessible minimal ressemble à ceci.
<div role="region" aria-label="Article audio player">
<button type="button"
aria-pressed="false"
aria-label="Play article narration"
style="min-width:24px;min-height:24px;padding:8px">
<svg aria-hidden="true" width="16" height="16">...</svg>
</button>
<input type="range"
aria-label="Playback position"
min="0" max="100" value="0">
</div>
C'est la structure de base. Stylisez le bouton, masquez les visuels natifs du range si vous souhaitez une piste personnalisée, mais conservez la sémantique sous-jacente.
Comment la narration par synthèse vocale améliore la conformité WCAG globale
L'audio n'est pas seulement un contenu à rendre accessible. C'est en soi une fonctionnalité d'accessibilité. L'Organisation mondiale de la santé estime que 1,3 milliard de personnes, soit environ 16 % de la population mondiale, vivent avec un handicap significatif. Beaucoup bénéficient d'un accès multimodal au contenu textuel : les personnes dyslexiques, atteintes de TDAH, malvoyantes ou présentant divers troubles cognitifs lisent plus facilement avec l'audio en complément du texte.
Ajouter la narration par synthèse vocale est l'un des rares investissements en accessibilité qui aide les utilisateurs avant même de satisfaire un audit. Ajouter la synthèse vocale à WordPress prend moins de 15 minutes avec le plugin Synthèse vocale – TTSWP. Le lecteur est livré avec des paramètres conformes WCAG 2.1 AA, des cibles de 24 pixels ou plus, la prise en charge du clavier et les rôles ARIA appropriés.

La charge utile minimale au chargement est d'environ 35 à 40 Ko compressés (151 Ko non minifiés), couvrant à la fois la logique JavaScript du lecteur et le CSS partagé. Nous avons lancé GTmetrix sur un article publié avec le lecteur actif et obtenu la note A avec 93 % en performance, 99 % en structure, un Largest Contentful Paint à 1,3 seconde, un Total Blocking Time à 46 millisecondes et un Cumulative Layout Shift à zéro. Le bundle se charge en différé uniquement sur les pages contenant le lecteur, donc les pages statiques sans audio ne subissent aucun surcoût.
La documentation accessibilité est disponible sur notre page de confiance accessibilité. La narration utilise le moteur génératif ElevenLabs, qui améliore suffisamment la prosodie pour que les auditeurs terminent réellement les articles au lieu d'abandonner face à une lecture robotique.
La directive européenne sur l'accessibilité en pratique
La directive européenne sur l'accessibilité est applicable depuis le 28 juin 2025. Les nouveaux services numériques mis sur le marché de l'UE après cette date doivent déjà être conformes. Les services existants ont jusqu'au 28 juin 2030 pour se mettre en conformité. La directive s'applique à toute entreprise servant des clients dans l'UE, quel que soit le lieu d'établissement de l'entreprise.
La norme technique à laquelle la directive fait référence est EN 301 549. La version harmonisée actuelle (V3.2.1, août 2021) repose sur WCAG 2.1 niveau AA. Le projet V4.1.0 publié en novembre 2025 met à jour les clauses 9, 10 et 11 pour s'aligner sur WCAG 2.2, avec une harmonisation finale attendue en 2026. Jusqu'à ce que cette mise à jour soit référencée au Journal officiel de l'UE, WCAG 2.1 AA reste le minimum légalement contraignant, mais nous recommandons de cibler la version 2.2 dès maintenant, la transition étant à quelques mois plutôt qu'à quelques années.
Les sanctions varient selon les États membres. L'Allemagne et la France disposent des infrastructures de contrôle les plus actives, avec des autorités nationales d'accessibilité habilitées à instruire les plaintes et à prononcer des amendes. Nous avons vu des clients allemands et d'autres pays européens recevoir des réclamations formelles d'utilisateurs finaux dans les mois suivant la date d'entrée en vigueur, généralement concernant des composants audio et des formulaires. Les réclamations arrivent avant les amendes, donc une fenêtre de correction de trente jours est généralement atteignable si l'équipe est préparée.
Comment tester la conformité
Les outils automatisés détectent environ 30 à 40 % des problèmes. Les tests manuels sont indispensables pour le reste, notamment pour l'interaction au clavier et le contraste significatif sur les états dynamiques.
- NVDA sous Windows avec Chrome et Firefox. Gratuit.
- JAWS sous Windows pour les attentes des clients en entreprise.
- VoiceOver sur macOS et iOS. Intégré.
- TalkBack sur Android. Intégré.
- axe DevTools, extension navigateur pour les scans automatisés.
- Lighthouse dans les DevTools de Chrome pour les vérifications rapides.
- Navigation clavier seule. Débranchez la souris et actionnez chaque contrôle du lecteur.
La navigation clavier seule est le test le plus rentable. Si le lecteur fonctionne sans souris, la majeure partie de WCAG 2.2 est déjà satisfaite.
Questions fréquentes
WCAG 2.2 exige-t-il des sous-titres pour les podcasts audio ?
Non. Les sous-titres (1.2.2) s'appliquent aux vidéos préenregistrées avec audio synchronisé. Pour un contenu uniquement audio comme les podcasts, le critère applicable est le 1.2.1, qui exige une alternative textuelle telle qu'une transcription ou un résumé détaillé. Sous-titres et transcriptions ont des finalités différentes. Un podcast a besoin d'une transcription. Un tutoriel vidéo a besoin à la fois de sous-titres et d'une audiodescription pour les informations visuelles uniquement.
La lecture automatique est-elle interdite par la directive européenne sur l'accessibilité ?
Non, mais elle est encadrée. Le critère WCAG 1.4.2 Contrôle du son, auquel la directive fait référence via EN 301 549, exige que tout audio démarrant automatiquement pendant plus de trois secondes propose une option de pause, d'arrêt ou de contrôle indépendant du volume. Une lecture automatique sans ce contrôle échoue au niveau A et constitue un manquement à la conformité. La plupart des autorités de contrôle traitent cela comme une violation claire plutôt qu'un cas limite.
Ai-je besoin d'une transcription si mon article propose une version audio ?
En général, non. Quand l'audio est une narration directe du texte de l'article sans ajouter d'informations nouvelles, le texte de l'article lui-même constitue la transcription au sens de la définition WCAG «alternative média pour le texte». Identifiez clairement le lecteur comme version audio de l'article et l'exception s'applique. Si l'audio inclut des commentaires, une musique porteuse de sens ou des passages absents du texte, une transcription séparée est bien nécessaire.
Quelle est la taille minimale des boutons pour les lecteurs audio en WCAG 2.2 ?
Les cibles interactives doivent faire au moins 24 x 24 pixels CSS en vertu du critère de succès 2.5.8 Taille de la cible (minimum) au niveau AA. La cible inclut le rembourrage, donc une icône de 16 pixels avec 4 pixels de rembourrage sur chaque côté satisfait à l'exigence. Des exceptions existent pour les liens dans le corps du texte et les contrôles déterminés par l'agent utilisateur, mais les boutons d'un lecteur autonome ne bénéficient d'aucune exception et doivent atteindre le seuil.
WCAG 2.2 s'applique-t-il aux sites hébergés sur WordPress.com ?
Oui. WCAG s'applique à tout contenu web, quel que soit l'hébergeur. Les sites WordPress.com sont soumis aux mêmes obligations légales au titre de la directive européenne sur l'accessibilité, de l'ADA et des lois nationales équivalentes que WordPress en auto-hébergement. Le modèle d'hébergement ne change pas l'obligation. Ce qui change, c'est le niveau de contrôle du propriétaire du site sur le balisage du lecteur. Les plans Business et Commerce de WordPress.com autorisent les plugins personnalisés, les offres inférieures non.
Par où commencer
Choisissez un article de votre site, parcourez le lecteur audio en navigation clavier seule et vérifiez chaque bouton par rapport à la règle des 24 pixels. Cet audit unique révèle si votre configuration actuelle est proche ou loin de la conformité WCAG 2.2. Ensuite, le choix est soit de corriger le lecteur existant, soit de le remplacer par un lecteur livré conforme par défaut. Notre documentation accessibilité présente la configuration que nous recommandons pour les sites soumis aux exigences de la directive européenne.
Articles connexes
Loi européenne sur l'accessibilité et WordPress : guide de conformité 2026
Ce que la loi européenne sur l'accessibilité signifie pour les propriétaires de sites WordPress en 2026 : qui est concerné, les sanctions et la déclaration d'accessibilité que personne ne mentionne.
Les meilleurs plugins de synthèse vocale pour WordPress (2026)
Un comparatif neutre des sept meilleurs plugins WordPress de synthèse vocale pour 2026, avec les points forts, les limites et un tableau complet de fonctionnalités.
Synthèse vocale pour les sites WordPress avec Weglot : ce qui fonctionne vraiment
La plupart des plugins de synthèse vocale se vantent d'être compatibles avec Weglot, mais lisent la base de données plutôt que la traduction. Voici ce qu'une vraie compatibilité Weglot exige.