Metricalizer

Über das Projekt

Das Projekt Metricalizer erforscht seit vielen Jahren, ob und wie es möglich ist, die metrische Struktur von deutschsprachigen Gedichten vollautomatisch vom Computer berechnen zu lassen. Perfektion lässt sich hier noch nicht erreichen, aber die Qualität der Bewertung ist besser als die händische Beurteilung, das zeigen unsere direkten Vergleiche mit den Standardwerken „Fritz Schlawe: Die deutschen Strophenformen‟ und „Horst J. Frank: Handbuch der deutschen Strophenformen‟.

Mit der neusten Version kann der Metricalizer nicht nur einzelne Gedichte analysieren sondern auch große Korpora metrisch bewerten. Hierfür sind derzeit zwei Korpora im Metricalizer eingebunden. Das Korpus der „Freiburger Anthologie‟ umfasst nur ca. 1500 Belege, das Korpus von „Textgrid‟ ca. 50.000 Belege. Alle Belege sind im Volltext und mit Metadaten abfragbar.

Für jedes Korpus können Statistiken erzeugt werden, die die historische Verteilung der unterschiedlichen Formen zeigen. Über ein Referenzsystem in die Nummern der beiden Standardwerke von Frank und Schlawe kann der Metricalizer alle Gedichte einer bestimmten Form im jeweiligen Korpus filtern. Zudem ist es möglich, sich eine bestimmte Form zusammenzustellen und sich alle entsprechenden Belege anzeigen zu lassen.

Aufgrund der kalkulierten „metrischen Komplexität‟ können wir mit dem Metricalizer historische Prosodie kalkulieren. Damit ist es erstmals möglich, die historische Aussprache eines Wortes in den letzten 500 Jahren zu untersuchen. Die Suche nach „lebendig‟ zeigt z.B., dass es im 17. Jahrhundert Belege gibt, in denen das Wort metrisch auf +-+ gesetzt wird. Geschieht das in signifikanter Zahl, so lässt das den Rückschluss zu, dass die historisches Aussprache eines Wortes anders ist als die rezente.

Metricalizer kann für ein Korpus auch die Reime berechnen und die häufigsten Reime eines Korpus ausgeben. „Lust und Brust‟ ist demnach der häufigste Substantiv-Reim der deutschen Sprache, „ein und sein/seyn‟ der häufigste Reim überhaupt. „Herz und Schmerz‟ landen auf Platz 18, „Sonne und Wonne‟ erst auf Platz 99.

Im Metricalizer ist ein gtop-converter (graphem to phonem converter) integriert. Alle Korpustexte können so per Knopfdruck in die phonetische Umschrift XSAMPA gewandelt werden. Betonungen und Vokallängen werden ebenfalls ausgegeben. Dies ermöglicht es erstmals, großflächige Untersuchungen zu phonetischen Strukturen in Gedichten anzustellen. In einem Gemeinschaftsprojekt mit der Akademie in Prag untersuchen wir derzeit, ob sich gängige Theorien aufgrund dieser neuen Möglichkeiten halten lassen oder nicht. In einem Testmodul können auch korpusfremde Wörter nach XSAMPA gewandelt werden. Da der Algorithmus nicht statistisch, sondern regelbasiert arbeitet, können alle Wandlungsschritte offengelegt werden.

Das Projekt ist wissenschaftlich beschrieben in:

Bobenhausen und Gehl (2009): Klemens Bobenhausen / Günter Gehl: Automatisches metrisches Markup deutschsprachiger Gedichte.
In: Jahrbuch für Computerphilologie 9. mentis Verlag, Paderborn 2009, S. 61-85.

Bobenhausen (2011): Klemens Bobenhausen: The Metricalizer – Automated Metrical Markup of German Poetry.
In: Current Trends in Metrical Analysis. Hg. v. Christoph Küper. 2011. S. 119-131.

Bobenhausen und Hammerich (2015): Klemens Bobenhausen / Benjamin Hammerich: Métrique littéraire, métrique linguistique et métrique algorithmique de l'allemand mises en jeu dans le programme Metricalizer².
In: Langages n°199 (Septembre 2015) - Traitement automatique des textes versifiés: problématiques et pratiques. 2015. S. 67-87.

Die genannten Standardwerke lauten wie folgt. Der direkte Vergleich dieser Werke mit dem Metricalizer wird gerade für die Publikation vorbereitet:

Schlawe (1972a): Fritz Schlawe: Die deutschen Strophenformen. Systematisch-chronologisches Register zur deutschen Lyrik 1600-1950. J. B. Metzlersche Verlagsbuchhandlung. Stuttgart 1972.

Frank (1993): Horst J. Frank: Handbuch der deutschen Strophenformen. 2. durchgesehene Auflage. Francke Verlag. Tübingen / Basel 1993.