280 likes | 427 Views
Fotis Jannidis. Eine korpusbasierte Geschichte des deutschsprachigen Romans. Göttingen, 15.8.2012. Ziel. Monographische Darstellung (vulgo: Buch) Theoriebaustelle 1: Kritik an der (Literatur-)Geschichte Theoriebaustelle 2: Modelle historiographischer Präsentation
E N D
Fotis Jannidis Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012
Ziel • Monographische Darstellung (vulgo: Buch) • Theoriebaustelle 1: Kritik an der (Literatur-)Geschichte • Theoriebaustelle 2: Modelle historiographischer Präsentation • Zwischenstand: Patchwork von Mikronarrativen; Hypertext?
Komponenten (Mikronarrative) • Epochen • Gattungsentwicklungen (Bildungsroman usw.) • Werkentwicklungen • Narrative Muster • Synchrone Feldanalyse • Ausdiff. lit. Kommunikationssysteme, z.B. Populäre Lit. • Einzeltextinterpretation • …
Komponenten mit Korpusforschung • Epochen • Gattungsentwicklungen (Bildungsroman usw.) • Werkentwicklungen • Narrative Muster • Synchrone Feldanalyse • Ausdiff. lit. Kommunikationssysteme, z.B. Populäre Lit. • Einzeltextinterpretation • …
Forschungsstand: Material • USA: Bsp: ca. 3.000 Romane des 19. Jh. • D: 650 Romane (TextGridRep)
Forschungsstand: Methoden • Ngram-Verlauf in der Zeit • Stylometrie • Regelbasierte Analyse • Machinelles Lernen • Topic Modeling
The method • John Burrows: Delta • Basis: mostfrequentwords (mostlystopwords) • A measurefortherelative stilisticdistancebetweentexts • „themeanofthe absolute differencesbetweenthe z-scoresfor a setofword-variables in a given text-group andthe z-scoresforthe same setofword-variables in a targettext“
Z-score x is a raw score tobestandardized μ isthemeanofthepopulation σisthestandarddeviationofthepopulation
Validity Withtextslongerthan 2000 wordsBurrows‘ Delta is a goodindicatorforthecorrectauthor Withshortertexts in 85% of all casesthecorrectauthorisoneofthefirstfivenames
The tool • R Script byMaciej Eder, Jan Rybicki
Stand der Dinge: Eine Einschätzung • Kalibrierung der Instrumente • Fruchtbare Verwendungsformen • Viel Platz zwischen Heilsversprechen und Verteufelung
Probleme quantitativer Textanalyse Typische Probleme: Mangelndes historisches Wissen, unbrauchbare Texte, falsche Indikatoren, unzulänglich gehandhabte statistische Verfahren Wahrscheinlichkeitsaussagen in den Geisteswissenschaften Trivial?
Bagof Words Mapping Models und die der zu sie ich er in den das sich mit nicht so ein dem von es auf war als wie • Genre und Gender Konzepte Narrative, descriptionsoferoticactionsandtableaux, stagingofbodies, languageofseduction Most frequentwords
Quantitative Verfahren und die Literaturwissenschaft • Ersatz oder Ergänzung? • Ein neues Paradigma? • Empirische Psychologie und korpusbasierte Verfahren • Vs. oder Koop
Quantitative Ansätze basieren auf sehr diversen Kompetenzen. Das problem der Interdisziplinarität
Literatur • John Burrows: Delta: A Measure for Stylistic Difference and A Guide to Likely Authorship. In: LLC 17,3 (2002). • TextGridRephttp://textgridrep.de/repository.html • The R Script for Stylometric Analyseshttps://sites.google.com/site/computationalstylistics/ • Ryan Heuser, Long Le-Khac: A Quantitative Literary History of 2,958 Nineteenth-Century British Novels: The Semantic Cohort Method. Stanford LabReport May 2012. http://litlab.stanford.edu/LiteraryLabPamphlet4.pdf