Aller au contenu principal
CipherChronicle

Méthodes de chiffrement Homophonique

Chiffre homophonique

Chaque lettre claire a plusieurs symboles chiffrés possibles, choisis pour aplatir la distribution de fréquence.

Famille :
Homophonique
Difficulté :
Avancé
Époque :
XVᵉ siècle (Duché de Mantoue), généralisé Renaissance

Aussi appelé : homophonic substitution · chiffre à homophones

Le chiffre homophonique est la première tentative sérieuse de briser l’analyse de fréquence. Apparu au XVᵉ siècle dans les courriers diplomatiques du Duché de Mantoue, il associe à chaque lettre claire plusieurs symboles chiffrés (homophones), dont le nombre est proportionnel à la fréquence naturelle de la lettre dans la langue source.

Principe

Dans un alphabet français :

  • E (≈ 15 % des lettres) reçoit 10 à 15 codes différents.
  • A (≈ 8 %) reçoit 6 à 8 codes.
  • Z (< 0,5 %) n’a qu’un seul code.

L’émetteur choisit l’un des codes possibles à chaque occurrence, souvent de façon aléatoire ou cyclique. Résultat : dans le ciphertext, chaque symbole apparaît avec une fréquence proche d’un symbole quelconque (environ 1 / nombre total de symboles). La distribution devient plate, l’analyse de fréquence simple ne donne plus rien.

Les codes sont souvent des nombres à 2 ou 3 chiffres (000-999), mais peuvent aussi être des symboles graphiques comme dans la correspondance de Marie Stuart.

Exemple

Pour le clair CIPHE avec une table fictive où E a plusieurs codes :

C → 42
I → 07
P → 51
H → 23
E → 14   (ou 28, ou 33, ou 09, ou 61…)

Résultat : 42 07 51 23 14.

Faiblesses

La méthode reste cassable, mais pas par la fréquence brute. On exploite :

  • L’analyse de fréquence des digrammes et trigrammes : les combinaisons TH, HE, ER en anglais ont des signatures statistiques même si les lettres individuelles sont masquées.
  • Les contextes : les mots courts (LE, DE, ET) restent identifiables par leur structure.
  • Le nombre fini de codes : avec un texte long, on finit par voir que certains codes partagent une fréquence d’apparition élevée → ils correspondent à la même lettre claire.

Le chiffre de Marie Stuart (1586) a été cassé exactement par cette méthode.

Variantes célèbres

  • Chiffre de Beale (1820, Virginie) — utilise un texte de référence pour générer les codes. Un des trois textes reste non cassé à ce jour.
  • Chiffre de Marie Stuart — homophonique enrichi d’un nomenclator (mots entiers codés).
  • Chiffre d’Arnold — homophonique par chiffre de livre, utilisé pendant la révolution américaine.

Dans CipherChronicle

L’homophonique est la première étape vers la sécurité statistique : le joueur découvre que la multiplication des codes masque les fréquences. Les grilles associées peuvent proposer des textes longs où l’analyse des digrammes devient essentielle.

Grille

4
2
0
7
5
1
2
3
1
4
Q
R
S
T
U
V
W
X
Y
Z
A
B
C
D
E
CléTable à plusieurs codes par lettre
  1. 1

    Texte chiffré

    Des nombres à deux chiffres, parfois répétés sur des lettres différentes du clair.

  2. 2

    Distribution de fréquence plate

    Aucun symbole ne domine — signe qu'on a lissé artificiellement les fréquences.

  3. 3

    Hypothèse : chiffre homophonique, table attribuant plusieurs codes aux lettres fréquentes

    E (la plus fréquente) a plusieurs codes possibles, chacun apparaît peu.

  4. 4

    Consultation de la table

    42 = C, 07 = I, 51 = P, 23 = H, 14 = E (ou 28 E, ou 33 E…).

  5. 5

    Message révélé

    Le texte clair émerge après identification des codes multiples.