Projektbeschreibung: Unterschied zwischen den Versionen
Aus Kallimachos
| Zeile 154: | Zeile 154: | ||
'''Was bedeutet ''Text Mining?''''' | '''Was bedeutet ''Text Mining?''''' | ||
* Beim ''Text Mining'' werden schwach strukturierte Texte mithilfe | * Beim ''Text Mining'' werden schwach strukturierte Texte mithilfe statistischer und linguistischer Computeralgorithmen automatisch erschlossen, um auch ohne vorheriges Lesen des Textes Informationen über deren Inhalt zu erhalten und auszuzeichnen, etwa das Genre, die Themen und die Figuren eines literarischen Texts. Für die Erschließung großer Textkorpora sind Text-Mining-Verfahren von wachsender Bedeutung. Im Teilprojekt [[Leserlenkung | Leserlenkung in Bezug auf Figuren]] werden z.B. Verfahren erprobt, die das Personal literarischer Texte automatisch erkennen sollen (eine sog. ''Named Entity Recognition'') - und zwar nicht nur in Form von Eigennamen, sondern auch in Form von Personalpronomen etc. | ||
'''Was ist der Zweck von ''Stilometrie''?''' | '''Was ist der Zweck von ''Stilometrie''?''' | ||
*Genres, Autoren, Übersetzer, Epochen, literarische Vorbilder und andere Spezifika von Texten hinterlassen in Form von bestimmten Wort- und Phrasenhäufungen statistische Signale im Text. Diese lassen sich mithilfe stilometrischer Verfahren erkennen und zur Hypothesenformulierung verwenden. Stilometrische Verfahren werden z.B. im Teilprojekt [[Identifikation von Übersetzern]] verwendet, um die Identität anonymer Übersetzer in einem Korpus lateinischer Texter aufzudecken. | *Genres, Autoren, Übersetzer, Epochen, literarische Vorbilder und andere Spezifika von Texten hinterlassen in Form von bestimmten Wort- und Phrasenhäufungen statistische Signale im Text. Diese lassen sich mithilfe ''stilometrischer'' Verfahren erkennen und zur Hypothesenformulierung verwenden. Stilometrische Verfahren werden z.B. im Teilprojekt [[Identifikation von Übersetzern]] verwendet, um die Identität anonymer Übersetzer in einem Korpus lateinischer Texter aufzudecken. | ||