DROC: Unterschied zwischen den Versionen
Aus Kallimachos
Keine Bearbeitungszusammenfassung |
Keine Bearbeitungszusammenfassung |
||
| Zeile 1: | Zeile 1: | ||
<div class="notab"> | <div class="notab"> | ||
== | ==Deutsches Romankorpus (DROC)== | ||
Dieses [https://gitlab2.informatik.uni-wuerzburg.de/kallimachos/DROC-Release '''Repositorium'''] enthält ein manuell annotiertes Korpus deutschsprachiger Erzähltexte. Es besteht aus 90 Fragmenten verschiedener Erzähltexte mit einer durchschnittlichen Anzahl von je 200 Sätzen und einer Gesamtlänge von 390.000 Tokens. | Dieses [https://gitlab2.informatik.uni-wuerzburg.de/kallimachos/DROC-Release '''Repositorium'''] enthält ein manuell annotiertes Korpus deutschsprachiger Erzähltexte. Es besteht aus 90 Fragmenten verschiedener Erzähltexte mit einer durchschnittlichen Anzahl von je 200 Sätzen und einer Gesamtlänge von 390.000 Tokens. | ||
DROC enthält manuell erstellte Annotationen für: | Das DROC enthält manuell erstellte Annotationen für: | ||
*Figurenreferenzen, die direkt auf einzelne (für gewöhnlich menschliche) Identitäten der Erzählung verweisen (ca. 50.000 Annotationen) | *Figurenreferenzen, die direkt auf einzelne (für gewöhnlich menschliche) Identitäten der Erzählung verweisen (ca. 50.000 Annotationen) | ||
Version vom 17. Mai 2017, 07:59 Uhr
Deutsches Romankorpus (DROC)
Dieses Repositorium enthält ein manuell annotiertes Korpus deutschsprachiger Erzähltexte. Es besteht aus 90 Fragmenten verschiedener Erzähltexte mit einer durchschnittlichen Anzahl von je 200 Sätzen und einer Gesamtlänge von 390.000 Tokens.
Das DROC enthält manuell erstellte Annotationen für:
- Figurenreferenzen, die direkt auf einzelne (für gewöhnlich menschliche) Identitäten der Erzählung verweisen (ca. 50.000 Annotationen)
- Koreferenzen zu diesen Referenzen (z.B. Pronomen oder "Die Alte" anstelle des Namens)
- Direkte Rede (2000 Annotationen)
- Sprecher und Adressaten für jede Instanz von direkter Rede