Méthodes de chiffrement Homophonique
Chiffre homophonique
Chaque lettre claire a plusieurs symboles chiffrés possibles, choisis pour aplatir la distribution de fréquence.
- Famille :
- Homophonique
- Difficulté :
- Avancé
- Époque :
- XVᵉ siècle (Duché de Mantoue), généralisé Renaissance
Aussi appelé : homophonic substitution · chiffre à homophones
Le chiffre homophonique est la première tentative sérieuse de briser l’analyse de fréquence. Apparu au XVᵉ siècle dans les courriers diplomatiques du Duché de Mantoue, il associe à chaque lettre claire plusieurs symboles chiffrés (homophones), dont le nombre est proportionnel à la fréquence naturelle de la lettre dans la langue source.
Principe
Dans un alphabet français :
E(≈ 15 % des lettres) reçoit 10 à 15 codes différents.A(≈ 8 %) reçoit 6 à 8 codes.Z(< 0,5 %) n’a qu’un seul code.
L’émetteur choisit l’un des codes possibles à chaque occurrence, souvent de façon aléatoire ou cyclique. Résultat : dans le ciphertext, chaque symbole apparaît avec une fréquence proche d’un symbole quelconque (environ 1 / nombre total de symboles). La distribution devient plate, l’analyse de fréquence simple ne donne plus rien.
Les codes sont souvent des nombres à 2 ou 3 chiffres (000-999), mais peuvent aussi être des symboles graphiques comme dans la correspondance de Marie Stuart.
Exemple
Pour le clair CIPHE avec une table fictive où E a plusieurs codes :
C → 42
I → 07
P → 51
H → 23
E → 14 (ou 28, ou 33, ou 09, ou 61…)
Résultat : 42 07 51 23 14.
Faiblesses
La méthode reste cassable, mais pas par la fréquence brute. On exploite :
- L’analyse de fréquence des digrammes et trigrammes : les combinaisons
TH,HE,ERen anglais ont des signatures statistiques même si les lettres individuelles sont masquées. - Les contextes : les mots courts (
LE,DE,ET) restent identifiables par leur structure. - Le nombre fini de codes : avec un texte long, on finit par voir que certains codes partagent une fréquence d’apparition élevée → ils correspondent à la même lettre claire.
Le chiffre de Marie Stuart (1586) a été cassé exactement par cette méthode.
Variantes célèbres
- Chiffre de Beale (1820, Virginie) — utilise un texte de référence pour générer les codes. Un des trois textes reste non cassé à ce jour.
- Chiffre de Marie Stuart — homophonique enrichi d’un nomenclator (mots entiers codés).
- Chiffre d’Arnold — homophonique par chiffre de livre, utilisé pendant la révolution américaine.
Dans CipherChronicle
L’homophonique est la première étape vers la sécurité statistique : le joueur découvre que la multiplication des codes masque les fréquences. Les grilles associées peuvent proposer des textes longs où l’analyse des digrammes devient essentielle.
Grille
- 1
Texte chiffré
Des nombres à deux chiffres, parfois répétés sur des lettres différentes du clair.
- 2
Distribution de fréquence plate
Aucun symbole ne domine — signe qu'on a lissé artificiellement les fréquences.
- 3
Hypothèse : chiffre homophonique, table attribuant plusieurs codes aux lettres fréquentes
E (la plus fréquente) a plusieurs codes possibles, chacun apparaît peu.
- 4
Consultation de la table
42 = C, 07 = I, 51 = P, 23 = H, 14 = E (ou 28 E, ou 33 E…).
- 5
Message révélé
Le texte clair émerge après identification des codes multiples.