Narrative Techniken: Unterschied zwischen den Versionen
Aus Kallimachos
Keine Bearbeitungszusammenfassung |
Keine Bearbeitungszusammenfassung |
||
| Zeile 11: | Zeile 11: | ||
inkonsistent sind und über Jahre hinweg verschieben können. Mit Hilfe verschiedener Dimensionen von Romanen wie des Handlungsverlaufs, der Beziehung zwischen Hauptfiguren sowie stilometrischer Analyseergebnisse (z.B. zu den verwendeten Themen und zur Emotionalität) soll überprüft werden, ob und wie sich bestimmte literarische Subgattungen mit computerphilologischen Methoden unterscheiden lassen. | inkonsistent sind und über Jahre hinweg verschieben können. Mit Hilfe verschiedener Dimensionen von Romanen wie des Handlungsverlaufs, der Beziehung zwischen Hauptfiguren sowie stilometrischer Analyseergebnisse (z.B. zu den verwendeten Themen und zur Emotionalität) soll überprüft werden, ob und wie sich bestimmte literarische Subgattungen mit computerphilologischen Methoden unterscheiden lassen. | ||
In | In Zusammenarbeit mit Prof. Evert (Professur für Korpuslinguistik, FAU Erlangen-Nürnberg) soll die literarische Autorschaftsattribution mit stilometrischen Abstandsmaßen verbessert werden. Außerdem ist die Trennung von Autor-, Gattungs- und Epochensignal in stilometrischen Analysen von großem Interesse, da dies wiederum der Zuverlässigkeit automatische Genreklassifikationen nutzen könnte. Darüber hinaus sollen zuverlässige statistische Methoden zur Signifikanzüberprüfung der festgestellten Entwicklungen ausgearbeitet, implementiert und erprobt werden. | ||
=Korpus= | =Korpus= | ||
| Zeile 28: | Zeile 28: | ||
Problematisch ist, dass derartige Experimente oft auf sehr kleinen Datenmengen erfolgen müssen, da Genrelabels aufwendig zu erheben sind und keine klaren Grenzen aufweisen - auch unter Experten herrscht hier oft Uneinigkeit. Entsprechend sind Methoden zur Signifikanzüberprüfung der Ergebnisse insbesondere bei kleinen Datenmengen wichtig. In weiterführenden Untersuchungen sollen Methoden zur Erkennung und Repräsentation von Plotstrukturen unternommen werden. | Problematisch ist, dass derartige Experimente oft auf sehr kleinen Datenmengen erfolgen müssen, da Genrelabels aufwendig zu erheben sind und keine klaren Grenzen aufweisen - auch unter Experten herrscht hier oft Uneinigkeit. Entsprechend sind Methoden zur Signifikanzüberprüfung der Ergebnisse insbesondere bei kleinen Datenmengen wichtig. In weiterführenden Untersuchungen sollen Methoden zur Erkennung und Repräsentation von Plotstrukturen unternommen werden. | ||
= | <!-- =Sentimentanalyse? = | ||
In den Romanen können narrative Techniken über regelbasierte Verfahren annotiert oder über Verfahren des maschinellen Lernens automatisch in den Text eingetragen werden. Zur Klassifikation der Techniken werden auf Basis vorhandener Metadaten für die Romansammlung und die Dramensammlung in einem iterativen Prozess Feature-Vektoren aufgebaut. Die Optimierung der Verfahren betrifft die verfeinerte linguistische Vorverarbeitung durch transformationsbasierte Fehlerbehebung oder Domänenadaption und die Kombination probabilistischer graphischer Modelle (CRF) und regelbasierter Verfahren. Die Professur für Korpuslinguistik (Prof. Evert, Universität Erlangen-Nürnberg) bringt zusätzliche korpuslinguistische Expertise ein, u.a. aus einem Shared Task zur Tokenisierung und Wortartenannotierung nicht-standardnaher Texte. Darüber hinaus werden zuverlässige statistische Methoden zur Signifikanzüberprüfung der festgestellten Entwicklungen ausgearbeitet, implementiert und erprobt. | In den Romanen können narrative Techniken über regelbasierte Verfahren annotiert oder über Verfahren des maschinellen Lernens automatisch in den Text eingetragen werden. Zur Klassifikation der Techniken werden auf Basis vorhandener Metadaten für die Romansammlung und die Dramensammlung in einem iterativen Prozess Feature-Vektoren aufgebaut. Die Optimierung der Verfahren betrifft die verfeinerte linguistische Vorverarbeitung durch transformationsbasierte Fehlerbehebung oder Domänenadaption und die Kombination probabilistischer graphischer Modelle (CRF) und regelbasierter Verfahren. Die Professur für Korpuslinguistik (Prof. Evert, Universität Erlangen-Nürnberg) bringt zusätzliche korpuslinguistische Expertise ein, u.a. aus einem Shared Task zur Tokenisierung und Wortartenannotierung nicht-standardnaher Texte. Darüber hinaus werden zuverlässige statistische Methoden zur Signifikanzüberprüfung der festgestellten Entwicklungen ausgearbeitet, implementiert und erprobt. | ||
--> | |||
= | ==Stilometrische Abstandsmaße mit Delta== | ||
Ausgehend von ''Burrows’s Delta'', einem etablierten stilometrischen Abstandsmaß, werden verschiedene Varianten von ''Delta'' weiterentwickelt, um einerseits eine Verbesserung der Ergebnisse beispielsweise der Autorschaftsattribution zu erreichen und andererseits zu einem besseren Verständnis der Funktionsweise dieses im Kern erstaunlich einfachen Abstandsmaßes zu gelangen. In verschiedenen Experimenten wird untersucht, welchen Einfluss Aspekte wie Textlänge oder verschiedene Vektornormalisierungen auf die Ergebnisse von ''Delta'' haben. Zukünftig ist besonders die Unterscheidung zwischen Autor-, Gattungs- und Epochensignal von Interesse, um stilometrische Methoden wie ''Delta'' für automatische Genreklassifikation nutzbar zu machen. | |||
=Publikationen= | =Publikationen= | ||