DROC: Unterschied zwischen den Versionen

Aus Kallimachos
Wechseln zu:Navigation, Suche
DeletedUser (Diskussion | Beiträge)
Keine Bearbeitungszusammenfassung
DeletedUser (Diskussion | Beiträge)
Keine Bearbeitungszusammenfassung
Zeile 10: Zeile 10:
*Sprecher und Adressaten für jede Instanz von direkter Rede
*Sprecher und Adressaten für jede Instanz von direkter Rede


(Einsatz als "Goldstandard" zur Erstellung/Validierung von  
 
* KallimachosEngine?
Noch ausarbeiten:
* Sonstiges?)
Einsatz als "Goldstandard" zur Erstellung/Validierung von KallimachosEngine (Sonstiges?)


</div>
</div>

Version vom 16. Mai 2017, 13:32 Uhr

Deutscher Romankorpus (DROC)

Dieses Repositorium enthält ein manuell annotiertes Korpus deutschsprachiger Erzähltexte. Es besteht aus 90 Fragmenten verschiedener Erzähltexte mit einer durchschnittlichen Anzahl von je 200 Sätzen und einer Gesamtlänge von 390.000 Tokens.

DROC enthält manuell erstellte Annotationen für:

  • Figurenreferenzen, die direkt auf einzelne (für gewöhnlich menschliche) Identitäten der Erzählung verweisen (ca. 50.000 Tokens)
  • Koreferenzen zu diesen Referenzen (z.B. Pronomen oder "Die Alte" anstelle des Namens)
  • Direkte Rede (2000 Tokens)
  • Sprecher und Adressaten für jede Instanz von direkter Rede


Noch ausarbeiten: Einsatz als "Goldstandard" zur Erstellung/Validierung von KallimachosEngine (Sonstiges?)