Philtag 13: Unterschied zwischen den Versionen
(→Tag 1: Schwerpunkt OCR) |
(→Tag 2: Schwerpunkt Textmining) |
||
Zeile 94: | Zeile 94: | ||
|- | |- | ||
| 12:00-12:30 | | 12:00-12:30 | ||
− | | Lena Hettinger, Isabella Reger ([[ | + | | Lena Hettinger, Isabella Reger ([[Narrative_Techniken|AG Narrative_Techniken]]): ''Mit Sentimentanalyse zum Happy End? Experimente zur Klassifikation literarischer Gattungen'' |
|} | |} | ||
</div> | </div> |
Version vom 7. März 2016, 09:41 Uhr
Inhaltsverzeichnis
<philtag n="13"/>
Am 25. und 26. Februar 2016 findet unter der Leitung von KALLIMACHOS der 13. Workshop der Reihe <philtag/> statt. Die etablierte Würzburger Tagungsreihe zum Einsatz digitaler Methoden in den Geistes- und Kulturwissenschaften bietet den Teilnehmern die Möglichkeit, sich über neue Trends, Projekte und Technologien im Bereich der Digital Humanities zu informieren und auszutauschen.
Einen Themenschwerpunkt in diesem Jahr bilden OCR-Verfahren, die vor allem am 1. Seminartag vorgestellt und von den Teilnehmern auch in der Praxis erprobt werden sollen. Der 2. Seminartag behandelt aktuelle Projekte der Digital Humanities mit besonderem Schwerpunkt auf Textmining-Verfahren.
Der Workshop findet im Raum 1.002 im Zentralen Hörsaal- und Seminargebäude (ZHSG) am Campus Hubland Süd statt. Am besten erreichen Sie das ZHSG über die Buslininen 114 und 214 (Haltestelle Hubland Mensa) sowie die 14 (Haltestelle Am Hubland).
Wenn Sie Interesse haben, an der Veranstaltung teilzunehmen, können Sie sich über unsere offizielle E-mail-Adresse kallimachos@bibliothek.uni-wuerzburg.de anmelden.
Tag 1: Schwerpunkt OCR
ca. 10:00 | Registrierung und Begrüßung |
10:15-12:30 | Kurzvorträge: |
10:15-10:30 | Hans-Günter Schmidt: KALLIMACHOS und PhilTag, Organisatorisches |
10:30-10:50 | Uwe Springmann (CIS München): OCR von Inkunabeln: Herausforderungen und Herangehensweisen |
10:50-11:10 | Dirk Wintergrün (MPIWG Berlin): Von Handarbeit zur Massenware - OCR als Grundlage für die Forschung in der Wissenschaftsgeschichte |
11:10-11:30 | Elisa Herrmann (OCR-D Wolfenbüttel): OCR-D: Koordinierungsprojekt zur Weiterentwicklung von OCR-Verfahren |
11:30-11:50 | Kaffeepause |
11:50-12:10 | Syed Saqib Bukhari (DFKI Kaiserslautern): OCRopus++: A High performance OCR System For Medieval Documents |
12:10-12:30 | Josep Lladós (CVC Barcelona): Social networks of the past: information extraction from historical demographic documents |
12:30-13:30 | Mittagspause |
13:30-16:30 | OCR-Workshop: Praktische Vorstellung der am Würzburger Digitalisierungszentrum etablierten Tools und Arbeitsschritte zur OCR in frühneuzeitlichen Drucken |
13:30-13:40 | Begrüßung, Vorstellung der Grundproblematik |
13:40-14:45 | Segmentierung, Glyphen, Typeninventare |
14:45-15:00 | Kaffeepause |
15:00-16:00 | OCR-Training mit Aletheia und Franken+ |
16:00-16:30 | Validierung von OCR-Ergebnissen |
16:30-17:00 | Zusammenfassung Tag 1, Abschlussdiskussion |
Abendprogramm (Beginn 19:30) | Abendessen im Restaurant Bürgerspital |
Tag 2: Schwerpunkt Textmining
9:00-9:30 | Stefan Evert,Thomas Proisl (FAU Nürnberg): Burrows’s Delta verstehen |
9:30-10:00 | Andreas Büttner, Thomas Proisl (AG Identifikation von Übersetzern): Delta und Merkmalsselektion: Welche Wörter unterscheiden arabisch-lateinische Übersetzer? |
10:00-10:30 | Kaffeepause |
10:30-11:00 | Daniel Schlör, Stefanie Popp, Christof Schöch (Nachwuchsgruppe CLiGS): Direkte Rede im französischen Roman: Automatische Erkennung und gattungsabhängige Verteilungen |
11:00-11:30 | Markus Krug ( AG Romanfiguren): Figuren und ihre Beziehungen in Romanen |
11:30-12:00 | Kaffeepause |
12:00-12:30 | Lena Hettinger, Isabella Reger (AG Narrative_Techniken): Mit Sentimentanalyse zum Happy End? Experimente zur Klassifikation literarischer Gattungen |
Tagungsplan
Abstracts und Präsentationen
Tag 1: Schwerpunkt OCR
- Uwe Springmann: OCR von Inkunabeln: Herausforderungen und Herangehensweisen
- Elisa Herrmann:OCR-D: Koordinierungsprojekt zur Weiterentwicklung von OCR-Verfahren
- Josep Lladós: Social networks of the past: information extraction from historical demographic documents
- Dirk Wintergrün (MPIWG Berlin): Von Handarbeit zur Massenware - OCR als Grundlage für die Forschung in der Wissenschaftsgeschichte
- Syed Saqib Bukhari (DFKI Kaiserslautern): OCRopus++: A High performance OCR System For Medieval Documents
- Marco Dittrich, Felix Kirchner (JMU Würzburg): Begleitende Präsentation zum OCR-Workshop
Tag 2: Schwerpunkt Textmining
- Stefan Evert,Thomas Proisl (FAU Nürnberg): Burrows’s Delta verstehen
- Andreas Büttner, Thomas Proisl (AG Identifikation von Übersetzern): Delta und Merkmalsselektion: Welche Wörter unterscheiden arabisch-lateinische Übersetzer?
- Daniel Schlör, Stefanie Popp, Christof Schöch (Nachwuchsgruppe CLiGS): Direkte Rede im französischen Roman: Automatische Erkennung und gattungsabhängige Verteilungen
- Lena Hettinger, Isabella Reger (AG Romangattungen): Mit Sentimentanalyse zum Happy End? Experimente zur Klassifikation literarischer Gattungen
Software und Daten für den OCR-Workshop
- PRImA Aletheia Lite
- EMOP Franken+
- VietOCR
- Andron Scriptor Web (MUFI TrueType Font)
- Installationshinweise (PDF)
- Aletheia und Franken+ Beispiele (ZIP)
(Sämtliche Software erfordert Windows 7 oder höher)