Philtag 13

Aus Kallimachos
Version vom 7. März 2016, 09:41 Uhr von Jonathan (Diskussion) (Tag 2: Schwerpunkt Textmining)
Wechseln zu:Navigation, Suche
[bearbeiten]

Bilder und Texte auf dem Weg ins digitale Zeitalter

<philtag n="13"/>

Am 25. und 26. Februar 2016 findet unter der Leitung von KALLIMACHOS der 13. Workshop der Reihe <philtag/> statt. Die etablierte Würzburger Tagungsreihe zum Einsatz digitaler Methoden in den Geistes- und Kulturwissenschaften bietet den Teilnehmern die Möglichkeit, sich über neue Trends, Projekte und Technologien im Bereich der Digital Humanities zu informieren und auszutauschen.

Einen Themenschwerpunkt in diesem Jahr bilden OCR-Verfahren, die vor allem am 1. Seminartag vorgestellt und von den Teilnehmern auch in der Praxis erprobt werden sollen. Der 2. Seminartag behandelt aktuelle Projekte der Digital Humanities mit besonderem Schwerpunkt auf Textmining-Verfahren.

Der Workshop findet im Raum 1.002 im Zentralen Hörsaal- und Seminargebäude (ZHSG) am Campus Hubland Süd statt. Am besten erreichen Sie das ZHSG über die Buslininen 114 und 214 (Haltestelle Hubland Mensa) sowie die 14 (Haltestelle Am Hubland).

Wenn Sie Interesse haben, an der Veranstaltung teilzunehmen, können Sie sich über unsere offizielle E-mail-Adresse kallimachos@bibliothek.uni-wuerzburg.de anmelden.

Tag 1: Schwerpunkt OCR

ca. 10:00 Registrierung und Begrüßung
10:15-12:30 Kurzvorträge:
10:15-10:30 Hans-Günter Schmidt: KALLIMACHOS und PhilTag, Organisatorisches
10:30-10:50 Uwe Springmann (CIS München): OCR von Inkunabeln: Herausforderungen und Herangehensweisen
10:50-11:10 Dirk Wintergrün (MPIWG Berlin): Von Handarbeit zur Massenware - OCR als Grundlage für die Forschung in der Wissenschaftsgeschichte
11:10-11:30 Elisa Herrmann (OCR-D Wolfenbüttel): OCR-D: Koordinierungsprojekt zur Weiterentwicklung von OCR-Verfahren
11:30-11:50 Kaffeepause
11:50-12:10 Syed Saqib Bukhari (DFKI Kaiserslautern): OCRopus++: A High performance OCR System For Medieval Documents
12:10-12:30 Josep Lladós (CVC Barcelona): Social networks of the past: information extraction from historical demographic documents
12:30-13:30 Mittagspause
13:30-16:30 OCR-Workshop: Praktische Vorstellung der am Würzburger Digitalisierungszentrum etablierten Tools und Arbeitsschritte zur OCR in frühneuzeitlichen Drucken
13:30-13:40 Begrüßung, Vorstellung der Grundproblematik
13:40-14:45 Segmentierung, Glyphen, Typeninventare
14:45-15:00 Kaffeepause
15:00-16:00 OCR-Training mit Aletheia und Franken+
16:00-16:30 Validierung von OCR-Ergebnissen
16:30-17:00 Zusammenfassung Tag 1, Abschlussdiskussion
Abendprogramm (Beginn 19:30) Abendessen im Restaurant Bürgerspital

Tag 2: Schwerpunkt Textmining

9:00-9:30 Stefan Evert,Thomas Proisl (FAU Nürnberg): Burrows’s Delta verstehen
9:30-10:00 Andreas Büttner, Thomas Proisl (AG Identifikation von Übersetzern): Delta und Merkmalsselektion: Welche Wörter unterscheiden arabisch-lateinische Übersetzer?
10:00-10:30 Kaffeepause
10:30-11:00 Daniel Schlör, Stefanie Popp, Christof Schöch (Nachwuchsgruppe CLiGS): Direkte Rede im französischen Roman: Automatische Erkennung und gattungsabhängige Verteilungen
11:00-11:30 Markus Krug ( AG Romanfiguren): Figuren und ihre Beziehungen in Romanen
11:30-12:00 Kaffeepause
12:00-12:30 Lena Hettinger, Isabella Reger (AG Narrative_Techniken): Mit Sentimentanalyse zum Happy End? Experimente zur Klassifikation literarischer Gattungen

Tagungsplan

Abstracts und Präsentationen

Tag 1: Schwerpunkt OCR

  • Uwe Springmann: OCR von Inkunabeln: Herausforderungen und Herangehensweisen
  • Elisa Herrmann:OCR-D: Koordinierungsprojekt zur Weiterentwicklung von OCR-Verfahren
  • Josep Lladós: Social networks of the past: information extraction from historical demographic documents
  • Dirk Wintergrün (MPIWG Berlin): Von Handarbeit zur Massenware - OCR als Grundlage für die Forschung in der Wissenschaftsgeschichte
  • Syed Saqib Bukhari (DFKI Kaiserslautern): OCRopus++: A High performance OCR System For Medieval Documents
  • Marco Dittrich, Felix Kirchner (JMU Würzburg): Begleitende Präsentation zum OCR-Workshop

Tag 2: Schwerpunkt Textmining

  • Stefan Evert,Thomas Proisl (FAU Nürnberg): Burrows’s Delta verstehen
  • Andreas Büttner, Thomas Proisl (AG Identifikation von Übersetzern): Delta und Merkmalsselektion: Welche Wörter unterscheiden arabisch-lateinische Übersetzer?
  • Daniel Schlör, Stefanie Popp, Christof Schöch (Nachwuchsgruppe CLiGS): Direkte Rede im französischen Roman: Automatische Erkennung und gattungsabhängige Verteilungen
  • Lena Hettinger, Isabella Reger (AG Romangattungen): Mit Sentimentanalyse zum Happy End? Experimente zur Klassifikation literarischer Gattungen

Software und Daten für den OCR-Workshop

(Sämtliche Software erfordert Windows 7 oder höher)