Wer darf denn in den Urheberklub?

Nein, Urheberrecht ist immer noch nicht mein Thema. Aber irgendwie ist der Diskussion auch nicht zu entkommen. So war mir gestern morgen, als Frank Schirrmacher (nebenbei: Ein wirklich toller Twitterer) auf die neue Ausgabe der Zeit aufmerksam machte, relativ schnell klar, dass das ein interessanter Tag werden würde:

Die Offensive der Künstler bestand darin, dass sie irgendwen einen relativ dürftigen Text haben schreiben lassen, in dem in drei kurzen Absätzen das Geistige Eigentum, das bestehende Urheberrecht, aber auch Vermarkter/Verwerter als zentrale Säulen einer Bürgergesellschaft gefeiert werden. Zu finden ist das ganze unter der sprechenden Adresse wir-sind-die-urheber.de, die sich die deutsche Contentindustrie wahrscheinlich schon 1999 hat sichern lassen. Ich habe nichts gegen Leute, die mit ihren künstlerisch-geistigen Leistungen Geld verdienen. Nein, ich gebe ja sogar Geld für diese Leistungen aus. Und wenn ich mir Sachen umsonst besorge, dann entweder durch legale Kopien von Bekannten oder aus Bibliotheken - oder eben frei verfügbares Zeug von Leuten, die vor über sechzig Jahren unter die Erde gekommen sind.

Trotzdem bekomme ich jetzt aber dauernd dieses nervige Genöle um die Ohren gehauen, dass die "neue" Internetmentalität ja profanen Diebstahl legalisieren will und arme, entrechtete Urheber von global agierenden Internetkonzernen und der Nutzer "Gier und Geiz" entrechtet werden. Irgendwann im Laufe des Tages schrieb die FAZ, dass auch "Wissenschaftsautoren und Forscher" zu den Unterzeichnern gehören sollten. Ich hab diese jetzt nicht in der Unterschriftenliste erkannt. Aber was soll das werden? Eine Anti-Open-Access-Bewegung? Toll. Dachte ich. Wie gut, dass ich weiß, was gleich passiert.

Twitter, und jetzt könnte ich wieder einen Lobgesang anstimmen, lässt einen da ja nie im Stich - nur kurze Zeit später wurde ich über die entsprechende Gegenaktion (Reaktion passt irgendwie nicht, die anderen sind doch die Reaktionäre) informiert. 

Ich glaube, dass es sogar zwei Formulierungen von mir (die aber eher redaktioneller, denn inhaltlicher Art waren, nochmal sei auf den ersten Satz dieses Posts verwiesen) in den endgültigen Entwurf geschafft haben, ist aber ja auch gleich (ich verzichte hiermit auf alle Urheberrechte). Insgesamt halte ich die Gegeninitiative für sehr gelungen, der Text ist momentan hier am besten zu erreichen. Das Motto ist "Auch wir sind Urheber", irgendwie nahe dran am Titel meines letzten Blogposts "Ich, der Urheber". Ich hatte noch länger gezweifelt, ob ich mich als einer der Erstunterzeichner melden sollte. Schließlich hab ich ja noch gar nicht so viel urgehoben. Dann dachte ich aber an meine beiden Blogs, an meine Open-Access-Dissertation, an Tesla, das unter Open-Source-Lizenz steht. Ich dachte an das Potential des Internets, an die neuen Möglichkeiten des ungestörten Austauschs von persönlichem Kummer, politischen Meinungen, aktueller Information und fundiertem Wissen. Und dann dachte ich - ach komm, was solls. Du bist

Ich, der Urheber

Twitter lässt sich für so viele unterschiedliche Dinge nutzen, und dabei kenne ich die meisten wahrscheinlich noch gar nicht. Manchmal kommt es vor, dass gerade ein Mem unterwegs ist und mir sogar auf die Schnelle was dazu einfällt. So geschehen beim Mem #wasimhandelsblattfehlt, welches mir am Dienstag Mittag zwischen zwei Lehrveranstaltungen in meine Twitter-Timeline hineinflatterte. Weil Twitter einen ja immer am Puls der Zeit hält (danke, Timeline!) weiß man natürlich, dass das Mem sich auf eine - naja - Kampagne des Handelsblattes bezieht, das 100 oder 101 Leute, die irgendwie was mit Kreativität zu tun haben sollen, zu Wort kommen lässt gegen die "Umsonstkultur im Internet" und den politischen Arm dieser verhängnisvollen Bewegung - ihr ahnt es - die Piratenpartei. Das ganze lief unter dem Titel "Mein Kopf gehört mir", der irgendwie klar machen soll, dass böse Menschen (Piraten und Konsorten) so gut wie allen geistig Tätigen das Gehirn aussaugen würden, wenn man sie nur ließe. 

Ich gebe ehrlich zu, dass ich nicht unbedingt ein Fachmann auf dem Urheber-/Leistungsschutz-Rechtsgebiet bin - ich habe natürlich den unterhaltsamen Rant von Sven Regener gehört, den nicht minder unterhaltsamen, aber irgendwie geistreicheren Gegenrant von Anatol Stefanowitsch im Sprachlog. Das Handelsblatt selbst lese ich nie. Stefan Niggemeier hat sich geweigert, zur entsprechenden Ausgabe Stellung zu beziehen, weil es ihm einfach zu große Schmerzen bereitete. Dafür hat Thomas Knüwer aber eine recht detaillierte und nachvollziehbare Analyse geschrieben, die mich davon ausgehen lässt, dass im Handelsblatt wohl Schmu steht.

Ich bin übrigens Contentkäufer. Das gilt für Musik genauso wie für (auch elektronische) Bücher, Zeitungen und Zeitschriften. Das gilt auch für Serien-DVDs, auch wenn ich mich jedesmal dafür in den Hintern beiße, weil man bei jeder Scheibe erstmal drei Werbungs- und Raubkopie-Bedrohungsfilme wegbedienen muss. Das muss man doch bei illegal heruntergeladenen Serien sicher nicht? Das Urheberrechtsgelabers regt mich aber viel mehr auf, weil es den Wissenschaftsbetrieb aufhält. Oder kann mir mal jemand erklären, welche Rechte ich als Urheber an diesem Aufsatz habe? Auf meine Webseite darf ich ihn jedenfalls nicht stellen, die Rechte zur Veröffentlichung liegen ausschließlich beim Springer-Verlag. Der vertickt ein einzelnes Buch-Kapitel als PDF für 24,95 €. Dazu aber mal ein andermal mehr.

Eigentlich wollte ich ja hier erzählen, wie ich heute ein bisschen berühmt geworden bin, weil mir beim Mem-Spielchen folgendes eingefallen ist:

#wasimhandelsblattfehlt entwickelte sich überaus erfolgreich und war in Deutschland und sogar weltweit in den Trending Topics von Twitter. Am Handelsblatt selbst ist das offensichtlich nicht vorbeigegangen - anscheinend hat man da eine Social Media Expertin - und dann wollte man dort Humor beweisen, indem man sich selbst ein wenig aufs Korn nimmt, über das Twittermem berichtet und eine Klickstrecke mit den "besten Tweets" zusammenstellte. Offenbar gefiel da der meine besonders gut, denn er durfte diese Klickstrecke einleiten: 

Handelsblatt

Ich hatte schon durch eine Menge Retweet-Mitteilungen mitbekommen, dass mein Einfall ganz gut ankam (Ich glaube ich habe gestern sehr viel mehr Retweets erhalten als in meinem ganzen bisherigen knapp 2-jährigen Twitterleben zusammen). Irgendwie ist er ja auch ganz lustig, allerdings gibt es zur Zeit sicherlich Originelleres, als die FDP mit Häme zu überschütten. Scheinbar aber kaum etwas, das ähnlich gut aufgenommen wird. Eigentlich ist mir der Mandat-Tweet eingefallen, als ich mir gerade einen anderen zusammengebastelt habe, der auch, aber nicht ausschließlich mit FDP-Politikern zu tun hatte und den ich dann umgehend nachgeschoben habe. Die Retweet-Zahlen waren ähnlich gut, das Handelsblatt ließ ihn aber unberücksichtigt.  

Irgendwie finde ich, dass titelverlustige Plagiatoren die bessere Adresse für Spott sind, da sie ja nachweislich unehrenhaft gehandelt haben und sich - zumindest teilweise - durch unwürdige und kaum glaubhafte Ausreden an angebrachten Konsequenzen vorbeilavieren. Und Neuwahlen in NRW hätte, wenn ich das richtig sehe, jeder einzelne FDP-Parlamentarier in NRW verhindern können, indem er nämlich für den Haushalt der rot-grünen Minderheitsregierung gestimmt hätte. Deswegen sage ich hier: Sorry FDP. Ich tat Dir Unrecht. Wie aber hätte ich auch ahnen können, dass der Tweet so große Wellen schlägt. 

Der liebste meiner drei Tweets zum Mem ist mir aber der dritte und letzte (leider auch nur 4 mal retweetete), den ich abgesetzt habe. Der spricht nämlich ein Thema an, das mir wirklich am Herzen liegt: Die Ausbremsung wissenschaftlicher Forschung durch Geheimniskrämerei. Dazu schreibe ich aber drüben bestimmt nochmal was. 

Bemerkenswert an der Sache ist ja auch, dass das Handelsblatt einerseits so Partei ergreift für die Urheber und Verwerter geistigen Eigentums (die in den seltensten Fällen identisch sind), andererseits aber von einer Menge Twitterern den kostenlos zur Verfügung gestellten Content abgreift und - ohne die Urheber zu fragen - in einer mit Werbung durchsetzten Klickstrecke verwurstet. Christopher Lauer wollte angemessen an den Werbeeinnahmen beteiligt werden, erreichte aber nur die Streichung seines Beitrags. Ich bin genau den umgekehrten Weg gegangen und habe dem Handelsblatt meine Blogartikel zum kostenlosen Abdruck angeboten. Gehört habe ich aber noch nichts. Vielleicht kommt ja demnächst ein Schrieb vom Anwalt, weil ich den Screenshot oben nicht hätte einbinden dürfen. Mal abwarten.

The blog formerly known as...

Ich habe das meiste Zeug von hier jetzt nach drüben geschafft und bin mir noch immer nicht ganz klar darüber, wie es hier jetzt weitergeht. Momentan kann ich mir schon vorstellen, dass ich zwei Blogs parallel führen kann, drüben einen offiziellen (schließlich gibt es da ja auch eine Redaktion, die die Blogs mitliest und bei Gefallen auf der Startseite verlinkt), hier einen eher persönlichen. Wobei mein Blog bisher immer irgendwie auch persönlich war. Naja, kommt Zeit kommt Rat. Was ich allerdings bald machen sollte, ist eine Umbenennung des Spaces hier, denn TEXperimenTales kann es nur einmal geben. Vorschläge natürlich gerne gelesen. Aber was hoff ich...

Kinderuni-Nachlese

In meiner Vorlesung zur Kinderuni gestern habe ich versprochen, dass ich mein krakeliges Tafelbild nochmal lesbarer ins Internet stellen werde. Dem möchte ich hier nachkommen. Dazu werde ich auch noch ein paar Dokumente verlinken, in denen nachgeschaut werden kann, was ich gestern noch ansprechen wollte, was aber leider nicht mehr in die Vortragszeit gepasst hat.

Zuerst also das Tafelbild, in dem ich versucht habe, die einzelnen Verfahren, über die ich geredet habe, in einer Grafik zusammenzufassen. Wie man sieht, tauscht der Begriff "Kryptographie" zweimal auf. Einmal als "Kryptographie im weiteren Sinne" bezeichnet er die Überführung von einem Klartext (den jeder lesen kann) zu einem Geheimtext (der nicht ohne weiteres lesbar ist) und ist der  Gegensatz zur "Kryptoanalyse", in der ein Geheimtext zu einem Klartext überführt wird. Die andere Bedeutung, die man als "Kryptographie im engeren Sinne" bezeichnen könnte, fasst alle Verfahren zusammen, in denen ein Klartext zu einem Geheimtext verschlüsselt wird im Gegensatz zur "Steganographie", wo ein Klartext versteckt wird.

Kryptologie-klassifikation
Jetzt möchte ich noch auf folgende Webseiten hinweisen, die für euch vielleicht interessant sind:

  • In der Vorlesung wurde ja eine Fleißner-Schablone vorgeführt. Damit diese richtig funktioniert und jedes Feld unter der Schablone bei genau einer Drehstellung aufgedeckt ist, müssen die Lücken auf eine bestimmte Weise ausgeschnitten werden. Eine Anleitung, welche Muster dabei gültig sind, findet sich hier.
  • Auf Anagramme bin ich nur kurz zu sprechen gekommen, weil sie sich nur unter bestimmten Bedingungen zum Verschlüsseln von Botschaften eignen. Zur Erinnerung: Es gibt einfach zu viele mögliche Anagramme. Deshalb muss man einschränken, auf welche Art die Buchstabenumstellungen geschehen dürfen (z.B. durch einen Stab bei der Skytale oder einer Schablone wie bei Fleißner). Mit Anagrammen kann man aber schön herumspielen, z.B. mit Hilfe dieses Anagrammgenerators.
  • Was Leseempfehlungen angeht, tue ich mich ein bisschen schwer, da die meisten Bücher, die ich gelesen habe, für Erwachsene geschrieben wurden. Vielleicht können sich die Älteren von euch aber mal "Geheime Botschaften" von Simon Singh oder "Geheimsprachen" von Albrecht Beutesbacher anschauen. Beide Bücher richten sich an ein breites Publikum, sind wirklich gut geschrieben und sollten sich in jeder guten Ausleih-Bibliothek finden.
  • Vor allem von euren Elten habe ich gehört, dass sie vor allem an den noch nicht gelösten Geheimschriften interessiert waren. Ich bin ja leider nicht mehr dazu gekommen, Beispiele dafür vorzustellen. Ihr könnt euren Eltern ja mal diese Seite der Wikipedia empfehlen (leider gibt es die noch nicht auf deutsch), wo eine Reihe ungelöster Problemfälle der Kryptoanalyse aufgeführt sind. Das Manuskript, das ich vorstellen wollte, wird hier ganz schön beschrieben - allerdings noch ohne die Ergebnisse meiner Forschung. Vielleicht ändert sich das ja demnächst :-) - Bis dahin könnt ihr gerne hier in meinem restlichen Blog ein wenig herumschnuppern.
  • Und was ich fast vergessen hätte: Wer sich die Bildchen der Präsentation nochmal anschauen möchte, der sollte sich diese hier herunterladen.

Soweit zu meinen Nachtrag zur Vorlesung gestern. Ich hoffe, ihr hattet genau so viel Spaß wie ich dabei. Vielleicht sieht man sich im nächsten Jahr - zu einem anderen Thema - ja wieder.

 

Der letzte macht das Licht aus

Eigentlich mag ich Posterous ja, unsympathischer wird mir der Laden auch nicht, weil er von Twitter übernommen wurde.*  Trotzdem sieht es momentan danach aus, als wenn ich die Gefilde hier verlassen werde, um mich unter die vorgewärmte Decke des neu geschaffenen Blogportals für die Geisteswissenschaften hyotheses.org zu flüchten. Ich halte die Idee eines solchen Blogportals für unterstützenswert und habe mich deswegen darum beworben, dort bloggen zu dürfen, was mir nun auch gestattet wurde. Einerseits freue ich mich darüber, andererseits bin ich auch ein wenig traurig, dass ich die Geschichte hier wohl nicht auf die gleiche Art wie bisher weiterführen können werde. Jetzt muss ich mich halt doch mit WordPress rumschlagen statt mit dem schicken schmalen Posterous-Editor hier. Naja, dafür sehen die Fußnoten schöner aus. Ich halte euch auf dem Laufenden, wer möchte, kann sich ja schonmal mit dem neuen Design anfreunden.

* (Manchmal bekommt man in Twitter ja den Eindruck, der Twitter-Nutzer an sich sei allenfalls durch eine an Sucht grenzende Hassliebe an diesen Kurznachrichtendienst gebunden, soviel wie drüber geschimpft wird. Vor allem wird mit einer Vehemenz gegen jede noch so kleine Änderung des offiziellen Clients demonstriert. Wahrscheinlich bin ich aber einfach zu kurze Zeit bei Twitter dabei, als dass ich hier das Recht hätte, mich darüber zu äußern, schließlich habe ich ja die güldenen Zeiten gar nicht mitbekommen.)

Wie operationalisiert man Schrägheit? - Analyse des Voynich Manuskripts (I)

An verregneten Wochenenden kommt man ja manchmal dazu, die Artikel zu lesen, die man unter der Woche auf den ersten Blick interessant fand und die man aus Zeitmangel in die persönliche Instapaper-Liste aufgenommen hat. Zugegebenermaßen wird diese Liste bei mir oft zum Friedhof. Die Wetterlage heute hat es aber zusammen mit der gelassenen Grundstimmung meiner Kinder möglich gemacht, dass ich einen wirklich interessanten Artikel von Christian Reinboth auf den Scienceblogs in Ruhe lesen konnte. Dort wird auf anschauliche Weise dargelegt, wie ein Chronogramm aus dem 18. Jahrhundert entschlüsselt werden kann und welche Fehler einem dabei unterlaufen können, wenn man z.B. historische Zeichensätze missinterpretiert.

In diesem Blog habe ich ja vor kurzer Zeit selbst die Geschichte einer hinreißenden Entschlüsselungsleistung beschrieben (Teil 1, Teil 2), mit der ich zwar wenig (bis gar keine) Reaktion hier im Blog hervorgerufen habe, die ich aber dennoch wichtig fand zu erzählen - allein schon, um den beteiligten Kryptoanalytikern (Thomas Ernst, Jim Reeds, Wolfgang Ernst Heidel) zu huldigen. Reinboths Beitrag hat mich jetzt dazu ermutigt, das Thema Kryptologie hier im Blog weiter zu bearbeiten, auch weil ich es demnächst einem erfahrungsgemäß sehr anspruchsvollen Publikum (auf der KölnerKinderUni 2012) näherbringen darf.

Konkret möchte ich hier darlegen, was für eine Hypothese ich hinsichtlich des Textes aus dem Voynich-Manuskript habe, mit welchen Analysen ich diese Hypothese untermauere und wie ich die Analysen - für jedermann reproduzierbar - operationalisiert habe. Dazu wird es wahrscheinlich einer ganzen Reihe an Posts bedürfen, ich werde aber versuchen, die einzelnen Abschnitte möglichst modular zu halten, so dass sie auch einzeln konsumierbar sind. Eigentlich habe ich das alles schon in einer anderen Form hier gemacht, allerdings kommt die Form des Blogs doch dem ein oder anderen mehr entgegen als eine Monographie (auch wenn sie Open Access ist). Während ich im Buch auch erst einmal auf die wissenschaftstheoretische Einordung und die Benutzung von Tesla eingehe, kann ich hier unmittelbarer zur Sache kommen. Tesla wird aber immer wieder thematisiert werden, vor allem gedenke ich, einzelne Komponenten vorzustellen, auf denen mein Analyseprozess aufbaut. Jetzt aber genug der Vorrede.

Das Voynich Manuskript

Über das Voynich Manuskript (VMS) ist schon viel geschrieben worden, einen sehr guten Überblick erhält man auf der Themenseite von René Zandbergen. Möchte man das Phänomen VMS in einem Wort zusammenfassen, so wäre wohl "schräg" dasjenige, auf das meine Wahl fallen würde. Egal, welchen Aspekt dieses seltsamen Dokuments man betrachtet, die Dinge wollen sich einfach nicht recht zusammenfügen. Das gilt für das Manskript selbst, für sein Material, für die enthaltenen Zeichnungen und für den diese Zeichnungen umfließenden Text. Das gilt auch für die bisher rekonstruierte Geschichte und vor allem für die an ihm vorgenommenen kryptoanalytischen Versuche inklusive der daraus resultierenden Ergebnisse. Das VMS ist schräg. In jeglicher Hinsicht.

Wie man aus dem Titel dieses Blogs ("TEXperimenTales") und meines Buches ("Textprozessierung") ersehen kann, bin ich vor allem an der Analyse/Prozessierung/Verarbeitung von Texten interessiert. Es liegt also nahe, dass ich mich hier weniger mit der Geschichte und den Bildchen des VMS auseinandersetzen werde und dafür mehr auf das eingehe, was man als den Text des VMS bezeichnet (ein Ausschnitt findet man in der Abbildung unten. Quelle: wikimedia). Aus sprachwissenschaftlicher Sicht ist bisher nicht eindeutig festzustellen, ob es sich tatsächlich um einen Text handelt. Das liegt daran, dass noch niemand einen blassen Schimmer hatte, welche Information dieser Text tragen könnte. Bzw. konnte noch niemand eine kritische Masse anderer davon überzeugen, dass ihre/seine Hypothesen über den Inhalt des Textes die richtige ist. Die jüngsten publizierten Theorien zum VMS gehen davon aus, dass die Zeichen des Textes keine Inhaltsseite haben und lediglich sinnlos hintereinander geschrieben wurden. Weshalb auch immer sich jemand diese Mühe gemacht haben sollte - am glaubwürdigsten sind wohl finanzielle Interessen (man nennt diese Theorie auch Schabernack- oder Hoax-Hypothese). Markus Dahlem von den Scilogs hat eine weitere Erklärung parat (an der ich zugegebenermaßen nicht ganz unschuldig bin). Die Hoax-Hypothese wird deshalb von vielen als stimmig angesehen, als dass der VMS-Text eine Reihe von Unregelmäßigkeiten aufweist, die in dieser Kombination weder in verschlüsselten noch in unverschlüsselten natürlichsprachlichen Texten auftreten. 

Vms-text

Bevor der Post hier wieder zu lang wird, versuche ich einmal, diese Unstimmigkeiten, die von einer Reihe von Analytikern des VMS zusammengetragen wurden, in kompakter Form aufzuführen.

  1. Die Zeichen entstammen keinem bekannten Alphabet - Gängige Geheimschriften bedienen sich meist aus dem gleichen Zeichensatz wie die Sprache, die sie verschlüsseln. Einzelne Einheiten werden dann entweder gegen andere Zeichen an anderen Positionen im Text  (Transposition) oder durch andere Zeichen des Alphabets (Substitution) vertauscht.
  2. Die Zeichen sind zu Wörtern und Paragraphen gruppiert - Das kennen wir aus unseren (europäischen) Texten auch, in Chiffren werden diese Spatien aber meist gelöscht, da sie die unautorisierte Entschlüsselung erleichtern.
  3. Keine Interpunktionszeichen - damit trifft genau das Gegenteil von dem zu, was in (2) für Wörter und Paragraphen beschrieben wurde.
  4. Die Häufigkeitsverteilung der VMS-Zeichen entspricht im ungefähren der natürlicher Sprachen - Bestimmte Chiffren (so wie die sehr sichere polyalphabetische Substitution) sorgen für eine Gleichverteilung von Zeichen. Solche Methoden können den VMS-Text damit nicht erzeugen.
  5. Die Verbundentropie zwischen den einzelnen Zeichen ist signifikant niedriger als die aller natürlichen Sprachen - Lediglich polynesische Sprachen weisen annähernd ähnliche Werte auf.
  6. Die Wortlängen sind kurz und binomialverteilt - Letzteres ist unüblich für natürliche Sprachen.
  7. Die Wörter des VM gehorchen dem Zipfschen Gesetz - Das wurde lange Zeit als Argument gegen eine Nonsens-Sprache vorgebracht.    
  8. Die Information ist innerhalb der Wörter nahezu gleichverteilt - In natürlichen Sprachen tragen die ersten zwei Zeichen deutlich mehr Information als die weiteren.

Schon aus dieser Aufzählung ist ersichtlich, dass sich der Text des VMS hinsichtlich bestimmter Parameter wie ein natürlichsprachlicher Text verhält, hinsichtlich anderer wiederum nicht. Umgekehrt gilt dies auch in Bezug auf bekannte Chiffrierverfahren. Der VMS-Text hat aber noch mehr Oddness zu bieten:

  • Das Vokabular (die Anzahl der verschiedenen Wörter) ist sehr beschränkt
  • Bestimmte Zeichen kommen nur in bestimmten Regionen von Wörtern vor
  • Die Wörter haben einen morphologische sehr regelmäßigen Aufbau
  • Die Wörter unterscheiden sich oftmals lediglich durch ein einzelnes Zeichen von anderen
  • Gleiche oder ähnliche Wörter treten in unmittelbarer Nachbarschaft zueinander auf.
  • Verschiedene Seiten des VMS scheinen in unterschiedlichen Sprachen/Dialekten verfasst.
  • Zeilen bilden eine funktionale Einheit.
  • Eine Analyse zu langreichweiten-Korrelationen anhand eines Random-Walk-Modells deutet auf einen zufälligen Auswahl-Prozess bei der Erstellung des Manuskripts hin.

Vor allem der zuletzt aufgeführte Punkt wurde als Argument für die Theorie angesehen, dass das VMS keinen Inhalt habe, sondern dass es aus einer sinnlosen Aneinanderreihung von Phantasiewörtern ohne Bedeutung entstanden ist. Diese Theorie kann wohl auch am besten erklären, weshalb in den letzten 100 Jahren (das Manuskript wurde 1912 aufgefunden) niemand den Klartext des VMS herleiten konnte, obschon sich mit die größten Kryptoanalytiker des 20. Jahrhunderts damit herumgeschlagen haben. Und sie erklärt auch, weshalb keine Chiffriermethode gefunden wurde, die einen Text erzeugen kann, der ebenfalls die oben beschriebene Schrägheit des Manuskripts trägt. 

Nun, ich behaupte, eine solche Chiffriermethode gefunden zu haben. Ich musste sie nicht selbst erfinden, sondern sie wurde (lustigerweise im ersten jemals geduckten Buch zur Kryptologie) 1506 veröffentlicht. Wer nicht abwarten kann, kann hier schon einmal nachlesen, welches Verfahren das ist (Kapitel 5 führt es ein, untermauernde Analysen im Kapitel 6.1). Die anderen (so denn überhaupt welche da sind) vertröste ich auf den nächsten Post.

Wir sind jetzt kredibil

In meiner Arbeit habe ich unser System Tesla ja eher aus der Anwenderperspektive beschrieben und bin vor allem auf die Motivation eingegangen, die uns dazu bewegt hat, ein eigenes Komponentensystem zur Prozessierung von Texten zu entwickeln. Jetzt ist (endlich) auch Stephans Arbeit online, die mehr auf die technischen Grundlagen von Tesla eingeht (v.a. im Kapitel 4). Dabei setzt Stephan sich auch mit verwandten Systemen (vor allem GATE, UIMA und TextGrid) auseinander und zeigt auf, weshalb die Entwicklung eines Systems wie Tesla trotz dieser (von sehr viel größeren Einrichtungen getragenen) Konkurrenz unbedingt notwendig war.    

Dissstephan

Das Anwendungsgebiet, das Stephan beackert hat - kontrastive Evaluierung unterschiedlicher Verfahren zur automatischen Extraktion syntaktischer Strukturen - liest sich auf den ersten Blick etwas dröger als meine Analysen zum inhärent spektakulären Voynich-Manuskript. Es bietet aber die Möglichkeit aufzuzeigen, welch immens komplexe Versuchsaufbauten in Tesla möglich sind. Diese sind notwendig, da verschiedene Verfahren gegeneinander evaluiert werden. Die Ergebnisse der einzelnen Verfahren und ihrer Evaluierung sind dabei - durch die Arbeit mit Tesla garantiert - direkt reproduzierbar. Und alles natürlich - wie man es von uns gewohnt ist - Open Access. Also dann: Viel Spaß beim Lesen und der Reproduktion der Experimente!

 

Twitter, Blogs, Wissenschaft

Es gibt viele Dinge, für die Twitter geeignet ist, z.B. kann man seine Blogposts damit bewerben (was bei mir bisher allenfalls bescheidenen Erfolg hatte). Andererseits bekommt man einen nie versiegenden Datenstrom geliefert, aus dem man sich das eine oder andere interessante herausfischen kann.

So fand ich heute morgen dies in meiner Timeline:

Klar ist das ein Teaser, der vor allem auf Polemik ausgerichtet ist, im zugehörigen Blogpost vertritt der Autor (Carsten Hucho) die etwas differenzierte Einschätzung, dass wissenschaftliche Arbeitsweise und allgemeinverständliche Texte schwer zusammenzubringen sind. Und dass man mit den 140 Zeichen, die man auf Twitter zur Verfügung hat, schwerlich eine wissenschaftliche Kommunikation aufrechterhalten kann, die ihren Namen auch verdient. Womit er natürlich recht hat. Allerdings bin ich mit dem Schluss, den der Autor daraus zieht, nicht einverstanden. Das habe ich kurz über Twitter per "#agree #not" mitgeteilt, was mir den Vorwurf eingebracht hat, ich hätte nicht den Artikel, sondern lediglich die Überschrift gelesen.

Diese Einschätzung ist falsch. Ich bin nicht nur auf den Teaser hereingefallen, sondern halte den im Post ausgedrückten grundsätzlichen Zweifel an der wissenschaftichen Bloggerei für nicht gerechtfertigt. Ja, wissenschaftliche Erkenntnisse lassen sich nicht sämtlich in Alltagssprache formulieren - allgemeinverständliche Postings können dennoch die Grundideen vermitteln, die hinter der wissenschaftlichen Betätigung stehen. Diese Bloggerei ist nützlich, da man anderen dabei hilft, über ihren Tellerrand hinauszuschauen und weil man dadurch vielleicht Leute dafür gewinnen kann, eine bestimmte Forschungsrichtung einzuschlagen.

Auch der Autor des Posts hält öffentliche Wissenschaftsvermittlung für richtig und wichtig. Er äußert aber auch die Ansicht, Wissenschaftler sollten sich um Wissenschaft, und professionelle Wissenschaftsjournalisten um die öffentlichkeitsgeeignete Vermittlung kümmern. Diese kann ich so nicht teilen. Natürlich kann nicht jeder Wissenschaftler ein exzellenter Schreiberling sein, ebenso ist es aber wohl kaum möglich, jedem Wissenschaftler einen professionellen Textverfasser zur Seite zu stellen, nur weil der sich einmal populär darüber äußern will, was er die ganze Zeit so treibt.

Auf Twitter heißt das eben "#agree #not". Die anderen 129 Zeichen waren schon mit dem zitierten Retweet belegt. Dass hat im Ungefähren die gleiche Differenziertheit wie des Carsten Huchos Überschrift

Academics should be blogging? No.

Aber er hat ja angefangen ;)

 

 

Erwartungshaltung

Was mich sehr gefreut hat, vor allem, weil @tibub zehnmal mehr Follower hat als ich:

Setzt mich natürlich auch ein bisschen unter Zugzwang. Ich breche zwar nicht in Hektik aus, werde mich aber bemühen, in meinem Ehrenmonat dem Lob gerecht zu werden! Auch auf diesem Wege nochmal: Vielen Dank nach Hannover!

Sternstunden der Kryptoanalyse II - Die unbekannte Heldensage

Es folgt die Fortsetzung dieses Posts, den fertig zu schreiben mir vor dem Wochenende nicht gelungen war. Ich habe darin kurz, aber länger, als ich dies geplant hatte, in das erste kryptographische Werk des Johannes Trithemius, die Steganographia von 1499/1500, eingeführt. Die Rezeption des dreiteiligen Buches verläuft für Trithemius alles andere als günstig, denn der eigentlich fromme Kirchenmann wird in der Folge als gotteslästerlicher Magier verunglimpft. Als das Buch mit mehr als 100jähriger Verspätung gedruckt wird, landet es bald danach auf dem Index der katholischen Kirche - dennoch erscheinen im 17. Jahrhundert noch mehrere Auflagen: Katholisch indizierte Bücher waren damals ein willkommenes Druckerzeugnis protestantischer Drucker.

Media_httpuploadwikim_gqrhs

Kein Held der Kryptoanalyse, aber einer der Kryptographie im weiteren Sinne: Johannes Trithemius.

In den ersten beiden Teilen der Steganographia führt Trithemius mehrere Dutzend Chiffren ein, denen eigentlich ein simples steganographisches Prinzip zugrundeliegt. Das bedeutet, dass die Zeichen des Klartextes nicht durch Zeichen eines Geheimtextalphabets ausgetauscht, sondern dass sie lediglich versteckt wurden. Eine bekanntes derartiges Versteck sind die Anfangsbuchstaben von Wörtern, Sätzen oder Zeilen, die nach ihrer Zusammensetzung zusätzliche Information tragen (dies entspricht der literarischen Figur des Akrostichons). Die Chiffren des ersten Teils der Steganographia funktionieren allesamt auf diese Weise, allerdings sind nicht sämtliche Anfangsbuchstaben relevant. Vielmehr wird in arkanen Beschwörungsformeln, die Naturgeistern zugeordnet sind, codiert (daraus ergab sich auch Trithemius' Magierproblem), welche der Anfangsbuchstaben des folgenden Textes zum Klartext zusammengesetzt werden müssen. Hört sich kompliziert an, ist es auch - und fehleranfällig dazu (Ein ausführliches Beispiel findet sich in meiner Dissertation in Kapitel 5.3.2). Die Chiffren im zweiten Teil der Steganographia funktionieren prinzipiell auf die gleiche Weise, allerdings wird das steganographische Prinzip mit einem kryptographischen kombiniert (die versteckten Zeichen werden vorher zusätzlich substituiert).

Wie schon erwähnt, klärt Trithemius selbst darüber auf, wie mit den Chiffren aus Buch I und II der Steganographia zu verfahren ist. Für den dritten Teil dagegen hinterlässt er keine Anleitung. 1674, Trithemius weilt schon mehr als 150 Jahre nicht mehr unter den Lebenden, behauptet Wolfgang Ernst Heidel (ein Berater des Mainzer Erzbischofs), dass er die Chiffre der Steganographia III geknackt hat. Eine nachvollziehbare Erläuterung des Verschlüsselungsprinzip bleibt er allerdings schuldig. Den Klartext, an den er gelangt sein will, macht er nur durch eine eigene Chiffre verschlüsselt zugänglich, deren Funktionsweise kein Mensch versteht. Dies seltsame Gebahren lässt Zeitgenossen und Nachwelt daran zweifeln, dass Heidels Behauptungen der Wahrheit entsprachen.

Wieder vergehen mehr als 300 Jahre; wir schreiben inzwischen das Jahr 1998. Das Geheimnis der Steganographia ist nun schon fast 500 Jahre offenbar ungelöst und der Mathematiker Jim Reeds, angestellt bei der Firma AT&T macht sich daran, nochmal einen intensiven Blick auf die Tabellen zu werfen, die einen Großteil der Steganographia III ausmachen. Tatsächlich gelingt es ihm, hinter den Zahlenkolonnen eine Abfolge mehrerer verschiedener monoalphabetischer Ersetzungen zu entdecken, die dechiffriert und zusammengesetzt einen relativ unspektakulären Klartext ergeben:

branger dis brieff ist ein boser schalg und ein dieb. huet dich for eme. er wirt dich anderst bedringen und schedigen.

Es ist nicht der einzige verschlüsselte Text von Trithemius, der sich negativ über das zustellende Gewerbe äußert, möglicherweise wollte der Abt so unterstreichen, dass der Bote selbst keine Ahnung davon hatte, welche Information er da zustellte.

Reeds hatte Sensationelles geleistet. Dies sollte mit einer Veröffentlichung in der Cryptologia, dem Zentralorgan für Kryptologische Studien, gewürdigt werden. Der bedauernswerte Reeds selbst war es, der im Zuge intensiverer Recherchen im Vorfeld seiner Veröffentlichung auf einen Beitrag des Germanisten Thomas Ernst von 1996 stieß (im deutschsprachigen Zentralorgan für Mittlere Deutsche Literatur und Kultur der Frühen Neuzeit, der Zeitschrift Daphnis), in der dieser - weitgehend unbemerkt von der kryptologischen Öffentlichkeit - auf 200 Seiten darlegte, was Reeds auch, aber zu spät herausgefunden hatte. Nebenbei knackte Ernst auch Heidels verschlüsselte Entschlüsselung und wies damit nach, dass nicht ihm selbst der erste erfolgreiche Angriff auf  Steganographia III gelungen war.

Reeds aber ließ sich nicht lumpen und veröffentlichte statt seiner Entschlüsselung voller Bewunderung eine Rezension zu Ernsts Text. Nicht zur Sprache brachte er dabei, dass seine eigene Darlegung (die eines Mathematikers) im Draft auf 28 Seiten Platz fand, während Ernst (der Germanist) für seine derer 200 benötigte. Aber ebenso wie Reeds kann ich diese 200 Seiten aus vollem Herzen zur Lektüre empfehlen, denn viel unterhaltsamer als Ernst kann man seine Gelehrsamkeit nicht zu Papier bringen.

Ein Grund, weshalb ich die Geschichte hier im Blog erzählt habe, ist der, dass ich Heldensagen mag. Reeds, Ernst und Heidel ist etwas gelungen, an dem sich so viele andere die Zähne ausgebissen haben. Die drei legen außerdem ein so beeindruckendes, in seiner Konsequenz krudes, Maß an Understatement an den Tag, dass es mir eine wahre Freude ist, darüber zu berichten. In einem Interview mit der New York Times wird Ernst gefragt, weshalb um Himmels willen Heidel seine Entschlüsselung wiederum chiffrierte. "It was cryptological vanity" ist seine Antwort. Er selbst ist davon ja auch nicht frei - er wählte eben ein steganographisches Prinzip, indem er seine Lösung der Dinge in einer Zeitschrift mit kleiner Auflage versteckte. Darüber hinaus trug er das Wissen über seine Entschlüsselung mehrere Jahre mit sich herum, bevor es endlich veröffentlicht wurde.

Die Schilderung der Episode steht aber auch in einem Zusammenhang zu dem Zeug, das ich hier sonst so schreibe: Offenbar haben hier ein Natur- und ein Geisteswissenschaftler an ein- und demselben Problem gearbeitet. Trotz ihrer sehr unterschiedlichen Herangehensweisen (vor allem, was die Schilderung ihrer Leistungen angeht), bewältigen sie die Analyse der numerischen Daten aus den Tabellen der Steganographia III auf die gleiche Art. Bei dieser Analyse hätten sich beide von einem textprozessierenden System unterstützen lassen können, das ihre Ergebnisse im Anschluss an die Analysen nachvollziehbar hätte dokumentieren können. Hinsichtlich der oben geschilderten Heldentat kommt das Text Engineering Software Laboratory zu spät. Aber da sind ja noch ein paar andere Pfeile im Köcher.

Literatur

  • Ernst, T.: 1996, ‘Schwarzweiße Magie. Der Schlüssel zum dritten Buch der Steganographia des Trithemius’, Daphnis (25), 1–205.
  • Reeds, J.: 1998, ‘Solved: The Ciphers in Book III of Trithemius’s Steganographia’, Draft, angenommen von der Cryptologia, später überarbeitet. http://www.dtc.umn.edu/~reedsj/trit.pdf
  • Reeds, J.: 1999, ‘Breakthrough in Renaissance Cryptography. A Book Review’, Cryptologia 23(1), 59–62.

 

Posterous theme by Cory Watilo