Ja, ich verstehe, was du meinst. Im Prinzip hast du damit auch recht, nur klappt das für meine Beispieltexte nicht wirklich. Das liegt aber wohl nicht am Verfahren an sich, sondern an der Kürze der Texte. Häufige Buchstaben kann ich relativ gut zuordnen, aber seltene gehen überhaupt nicht, weil die Häufigkeitswerte des Textes einfach gar nicht mit den erwarteten Häufigkeiten im Schriftenglisch übereinstimmen. Zudem ist mir vorher nicht aufgefallen, dass meine Ähnlichkeitsfunktion für die seltenen Zeichen natürlich nicht stimmt. Wenn j, q und x genau einmal im Klartext vorkommen, dann ist das im ersten Post genannte Kriterium ja erfüllt, dass zwischen je zwei Ersetzungen von j genau eine Ersetzung von q und eine von x kommt, mit dem Ergebnis, dass j, q und x als der gleiche Klartextbuchstabe gesehen werden. Damit wird dann ohnehin nach einer falschen Gesamthäufigkeit gesucht, aber ich glaube, um das Problem kümmere ich mich jetzt nicht weiter, weil dadurch nur die seltensten Zeichen falsch interpretiert werden, das kann ich verschmerzen. Die Trigramm-Analyse und der Wörterbuchvergleich haben ohnehin eine gewisse Fehlertoleranz, die das dann auffangen sollte.
Vielen Dank für dein Input! Wenn man sich in ein Problem vergräbt, erkennt man manchmal die einfachsten Lösungen nicht mehr...