Chiffre homophonique

Le chiffre homophonique est la première tentative sérieuse de briser l’analyse de fréquence. Apparu au XVᵉ siècle dans les courriers diplomatiques du Duché de Mantoue, il associe à chaque lettre claire plusieurs symboles chiffrés (homophones), dont le nombre est proportionnel à la fréquence naturelle de la lettre dans la langue source.

Comment fonctionne Chiffre homophonique ?

Dans un alphabet français :

E (≈ 15 % des lettres) reçoit 10 à 15 codes différents.
A (≈ 8 %) reçoit 6 à 8 codes.
Z (< 0,5 %) n’a qu’un seul code.

L’émetteur choisit l’un des codes possibles à chaque occurrence, souvent de façon aléatoire ou cyclique. Résultat : dans le ciphertext, chaque symbole apparaît avec une fréquence proche d’un symbole quelconque (environ 1 / nombre total de symboles). La distribution devient plate, l’analyse de fréquence simple ne donne plus rien.

Les codes sont souvent des nombres à 2 ou 3 chiffres (000-999), mais peuvent aussi être des symboles graphiques comme dans la correspondance de Marie Stuart.

À quoi ressemble un texte chiffré avec Chiffre homophonique ?

Pour le clair CIPHE avec une table fictive où E a plusieurs codes :

C → 42
I → 07
P → 51
H → 23
E → 14   (ou 28, ou 33, ou 09, ou 61…)

Résultat : 42 07 51 23 14.

Quelles sont les faiblesses de Chiffre homophonique ?

La méthode reste cassable, mais pas par la fréquence brute. On exploite :

L’analyse de fréquence des digrammes et trigrammes : les combinaisons TH, HE, ER en anglais ont des signatures statistiques même si les lettres individuelles sont masquées.
Les contextes : les mots courts (LE, DE, ET) restent identifiables par leur structure.
Le nombre fini de codes : avec un texte long, on finit par voir que certains codes partagent une fréquence d’apparition élevée → ils correspondent à la même lettre claire.

Le chiffre de Marie Stuart (1586) a été cassé exactement par cette méthode.

Quelles sont les variantes de Chiffre homophonique ?

Chiffre de Beale (1820, Virginie) — utilise un texte de référence pour générer les codes. Un des trois textes reste non cassé à ce jour.
Chiffre de Marie Stuart — homophonique enrichi d’un nomenclator (mots entiers codés).
Chiffre d’Arnold — homophonique par chiffre de livre, utilisé pendant la révolution américaine.

Dans CipherChronicle

L’homophonique est la première étape vers la sécurité statistique : le joueur découvre que la multiplication des codes masque les fréquences. Les grilles associées peuvent proposer des textes longs où l’analyse des digrammes devient essentielle.

Grille

CléTable à plusieurs codes par lettre

1
Texte chiffré
Des nombres à deux chiffres, parfois répétés sur des lettres différentes du clair.
2
Distribution de fréquence plate
Aucun symbole ne domine — signe qu'on a lissé artificiellement les fréquences.
3
Hypothèse : chiffre homophonique, table attribuant plusieurs codes aux lettres fréquentes
E (la plus fréquente) a plusieurs codes possibles, chacun apparaît peu.
4
Consultation de la table
42 = C, 07 = I, 51 = P, 23 = H, 14 = E (ou 28 E, ou 33 E…).
5
Message révélé
Le texte clair émerge après identification des codes multiples.

Chiffrer votre contenu Déchiffrer un contenu