DROC: Unterschied zwischen den Versionen

Aus Kallimachos
Wechseln zu:Navigation, Suche
DeletedUser (Diskussion | Beiträge)
Die Seite wurde neu angelegt: „<div class="notab"> ==Deutscher Romankorpus (DROC)== This repository contains a manually annotated corpus for german literary novels. DROC contains 90 fragmen…“
 
DeletedUser (Diskussion | Beiträge)
 
(7 dazwischenliegende Versionen desselben Benutzers werden nicht angezeigt)
Zeile 1: Zeile 1:
<div class="notab">
<div class="notab">
==Deutscher Romankorpus (DROC)==
==Deutsches Romankorpus (DROC)==
Dieses [https://gitlab2.informatik.uni-wuerzburg.de/kallimachos/DROC-Release '''Repositorium'''] enthält ein manuell annotiertes Korpus deutschsprachiger Erzähltexte. Es besteht aus 90 Fragmenten verschiedener Erzähltexte mit einer durchschnittlichen Anzahl von je 200 Sätzen und einer Gesamtlänge von 390.000 Tokens.
 
Das DROC enthält manuell erstellte Annotationen für:
 
*Figurenreferenzen, die direkt auf einzelne (für gewöhnlich menschliche) Identitäten der Erzählung verweisen (ca. 50.000 Annotationen)
*Koreferenzen zu diesen Referenzen (z.B. Pronomen oder "Die Alte" anstelle des Namens)
*Direkte Rede (2000 Annotationen)
*Sprecher und Adressaten für jede Instanz von direkter Rede
 
 
[https://gitlab2.informatik.uni-wuerzburg.de/kallimachos/DROC-Release '''Link zum Repositorium''']
 
 
 
 
 
 
 
 
 


This repository contains a manually annotated corpus for german literary novels.
DROC contains 90 fragments of novels with an average length of about 200 sentences and a total length of 390.000 tokens.


DROC contains manually labeled annotations for:




Character References that refer to (usually human) entities appearing in the novel (about 50.000)
Coreferences between those references
Direct Speech annotations (about 2000)
Speaker and Addressees for each direct speech
</div>
</div>

Aktuelle Version vom 17. Mai 2017, 08:46 Uhr

Deutsches Romankorpus (DROC)

Dieses Repositorium enthält ein manuell annotiertes Korpus deutschsprachiger Erzähltexte. Es besteht aus 90 Fragmenten verschiedener Erzähltexte mit einer durchschnittlichen Anzahl von je 200 Sätzen und einer Gesamtlänge von 390.000 Tokens.

Das DROC enthält manuell erstellte Annotationen für:

  • Figurenreferenzen, die direkt auf einzelne (für gewöhnlich menschliche) Identitäten der Erzählung verweisen (ca. 50.000 Annotationen)
  • Koreferenzen zu diesen Referenzen (z.B. Pronomen oder "Die Alte" anstelle des Namens)
  • Direkte Rede (2000 Annotationen)
  • Sprecher und Adressaten für jede Instanz von direkter Rede


Link zum Repositorium