Wir wollen nun einige Formen der Codierung von Texten
besprechen.
1) Ein Wort wird codiert, indem die Reihenfolge umsortiert wird.
Bestimmen Sie die Wahrscheinlichkeit dafür, dass ein Affe, der
die
Reihenfolge zufällig verändert, die folgenden
Wörter,
richtig decodiert?
a) "UMSA"
x
1) a)
Die Wahrscheinlichkeit für das Wort "Maus" beträgt $p
= \frac{1}{24}$.
b) "FAFE"
x
1) b) Die Wahrscheinlichkeit für das Wort "Affe" beträgt
$p = \frac{1}{12}$.
2) Die Anzahl $X$ an decodierten Texten eines
Entschlüsselungsprogramms sei binomialverteilt mit den
Parametern
$n$ und $p$. Der Erwartungswert beträgt 90 erfolgreich
decodierte
Texte. Die Standardabweichung beträgt 3 Texte.
a) Bestimmen Sie $n$ und $p$ der Verteilung. (Lösung: n = 100%)
x
2) a) Die Parameter lauten $n = 100$ und $p = 0{,}9$.
b) Bestimmen Sie die Wahrscheinlichkeit dafür, dass von 100
codierten Texten zwischen 80 und 85 Texte decodiert werden.
x
2) b) Die Wahrscheinlichkeit dass zwischen 80 und 85 Texte decodiert
werden beträgt $p = 7{,}177$%.
c) Ermitteln Sie die Wahrscheinlichkeit dafür, dass der 100-te
Text, der genau 90-te erfolgreich decodierte Text ist.
x
2) c) Die Wahrscheinlichkeit dass der 100-te Text genau der 90 decodierte
Text ist beträgt $p = 11{,}868$%.
3) Ausgehend von der Erfolgswahrscheinlichkeit aus Aufgabenteil 2)
wollen wir nun über die Bezahlung eines Unternehmens reden.
Der Auftrag sind 3 zu decodierenden Texte. Sollte das Unternehmen keinen
Text decodieren können, so würden sie leer ausgehen.
Bei
einem Text erhalten sie 10.000 Euro. Für jeden weiteren Text
verdoppelt sich das Honorar.
Wie groß ist die zu erwartende Bezahlung des Unternehmens?
x
3) Die erwartete Bezahlung des Unternehmens beträgt 34.290
Euro.
4) Für die Entschlüsselung eines Textes ist es oft
sinnvoll
die Häufigkeit eines Buchstabens mit statischen Tabellen zu
vergleichen. So hat das "e" in deutschen Texten einen Anteil von
17,40 % und ist somit der häufigste Buchstabe. In
französichen Texten ist wiederum das "e" der
häufigste
Buchstabe, hier aber nur mit einem Anteil von 12,70 %.
Bei einem zu entschlüssenden Text bestehend aus 1.600
Buchstabden,
kommt das "z" 220 mal vor und ist der häufigste Buchstabe.
a) Bestimmen Sie das Konfidenzintervall für die relative
Häufigkeit des Buchstabens "z" im codierten Text, zur
Sicherheitswahrscheinlichkeit von 90%.
x
4) a) Das Konfidenzintervall zur Sicherheitswahrscheinlichkeit von 90%
beträgt: $\left[ 0{,}1240 ~;~0{,}1522\right]$
b) Begründen Sie anschließend, um welchen Buchstaben
es sich
handelt und ob es sich um einen deutschen Text handeln kann?
x
b) Es handelt sich wohl um ein "e" und um einen französischen
Text. Ein deutscher Text ist eher unwahrscheinlich.