Wiskunde 123

Zoeken


Ceasarcodering

Moeilijkheidsgraaad: Voortgezet onderwijs: bovenbouw

Inleiding

Coderen betekend het versleutelen van een boodschap. Bij coderingen draait het erom dat de boodschap zo wordt versleuteld dat iemand anders niet meer kan afleiden wat er staat. Om de code af te kunnen leiden heb je een sleutel nodig, deze sleutel is meestal alleen maar bekend bij de verzender en ontvanger. We laten in dit artikel een aantal oude coderingsmethoden zien om je een indruk te geven hoe het coderen werkt.

Caesarcodering

Caesarcoderingen zijn waarschijnlijk de oudste coderingen die er bestaan, maar is tegenwoordig een van de meest onveilige coderingsmethoden. Bij de Caesarcoderingen worden alle letters een bepaald aantal plaatsen verder verschoven. Het aantal plaatsen dat de letters verschoven werden werd genoemd in de sleutel. De sleutel werd als volgt aangeduid: K = 5. Dit betekend dat alle letters vijf plekken verder zijn verschoven in het alfabet. Stel je hebt de volgende zin:

"Deze zin gaan we coderen met de caesarcodering."

Met de sleutel K=5 schuiven alle letters dus vijf plaatsen verder. Een letter e wordt dan dus een j, want deze komt vijf plekken later voor in het alfabet: e -> f -> g -> h -> i -> j. De codering ziet er uiteindelijk als volgt uit:

"Ijej ens lffs bj htijwjs rjy ij hfjxfwhtijwnsl."

De codering is zoals gezegd echter niet helemaal veilig, ook al is de tekst nu niet meer begrijpbaar. Als iemand weet dat het met de Caesarcodering gecodeerd is en hij wil het decoderen hoef je alleen maar de letters te tellen. Omdat de letter die het meeste voorkomt in het Nederlands altijd een e is, kan je berekenen hoeveel plekken de verschuiving is. Je begint dan met het tellen van de letters, dat heet een frequentieanalyse. De frequentieanalyse voor de vorige zin ziet er als volgt uit:

Afbeelding: Frequentieanalyse met Caesarcodering
Frequentieanalyse met Caesarcodering

Je ziet duidelijk dat de letter J het meeste voorkwam in de tekst. Het is hierbij dan ook niet zo moeilijk te raden dat sleutel die bij de zin hoorde K=5 was.

Mono-alfabetische substitutiemethode

Lastiger wordt het als je voor elke letter een willekeurige andere letter neemt. Om hier een voorbeeld van te geven coderen we de eerste twee artikelen van het auteursrecht uit 1912:

"Artikel 1 Het auteursrecht is het uitsluitend recht van den maker van een werk van letterkunde, wetenschap of kunst, of van diens rechtverkrijgenden, om dit openbaar te maken en te verveelvoudigen, behoudens de beperkingen, bij de wet gesteld.

Artikel 2 1. Het auteursrecht gaat over bij erfopvolging en is vatbaar voor gehele of gedeeltelijke overdracht. 2. De levering vereist voor gehele of gedeeltelijke overdracht, geschiedt door een daartoe bestemde akte. De overdracht omvat alleen die bevoegdheden waarvan dit in de akte is vermeld of uit de aard of strekking van de titel noodzakelijk voortvloeit. 3. Het auteursrecht, hetwelk toekomt aan den maker van het werk, zoomede, na het overlijden des makers, het auteursrecht op niet openbaar gemaakte werken, hetwelk toekomt aan dengene, die het als erfgenaam of legataris van den maker verkregen heeft, is niet vatbaar voor beslag."

De cijfers coderen we niet. Verder treedt er bij het coderen ook een ander probleem op: de spaties zijn meestal verwijderd. Als we de bovenstaande tekst nu coderen krijgen we de volgende code:

Afbeelding: Letterverschuiving met een andere verschuiving voor iedere letter.
Letterverschuiving met een andere verschuiving voor iedere letter.

We kunnen deze tekst weer decoderen met behulp van frequentieanalyse. Als je de letters weet die het meeste voorkomen in de Nederlandse taal, dan weet je ook welke letters je ook met welke letters uit de bovenstaande tekst je de letters moet vervangen. Om te beginnen moet je dus over een frequentieanalyse van de Nederlandse taal beschikken en een frequentieanalyse van de bovenstaande gecodeerde tekst. Dit levert de volgende twee grafieken op:

Afbeelding: Een frequentieanalyse van de Nederlandse taal.
Een frequentieanalyse van de Nederlandse taal.
Afbeelding: Een frequentieanalyse van de bovenstaande gecodeerde tekst.
Een frequentieanalyse van de bovenstaande gecodeerde tekst.

Je ziet nu duidelijk dat in de gecodeerde tekst de letter b het meeste voorkomt, dit zal in de normale tekst de letter e wel moeten zijn. Omdat de gecodeerde tekst vrij kort is, klopt in dit voorbeeld de tweede letter al niet meer. In de gecodeerde tekst komt de letter l namelijk als het op een na meeste voor, maar in de normale tekst moet dit de letter t zijn (en niet de letter n zoals je in eerste instantie zou aannemen. Als de tekst langer zou zijn, zou decoderen geen probleem meer moeten zijn.

Reacties

Ga naar de pagina met reacties bij dit artikel om meningen van anderen te bekijken en zelf je mening te geven over dit artikel.

Oefenopgaven

Opgave

a. Codeer de volgende tekst met K=5: EZ CZWO YZUZ OZFNO BJZY BZXJYZZMY

b. Decodeer de volgende tekst die gecodeerd is met K=11: UP SPME OPKP ZARLGP RZPO ZARPWZDE.

Bekijk antwoord