Transkribus
Transkribus ist eine Plattform zur Texterkennung, Layout-Analyse und Strukturerkennung von historischen Dokumenten und eignet sich sowohl für Drucke als auch für Handschriften. Transkribus ist frei zugänglich und hat derzeit (September 2022) mehr als 90.000 registrierte Benutzer, von denen mehrere Hundert die Software täglich verwenden. Die Plattform entstand im Rahmen der EU-Projekte tranScriptorium (2013–2015) und READ (Recognition and Enrichment of Archival Documents – 2016–2019). Sie wurde von der Universität Innsbruck bzw. der Gruppe Digitalisierung und elektronische Archivierung entwickelt. Seit dem 1. Juli 2019 wird die Plattform von der Europäischen Genossenschaft READ-COOP betrieben und weiterentwickelt. Der Name „Transkribus“ ist als Wortmarke beim Österreichischen Patentamt eingetragen und geschützt. Markeninhaberin ist die Universität Innsbruck.
In der Plattform sind Tools verschiedener Forschungsgruppen aus ganz Europa integriert. Zu nennen sind hier insbesondere die Pattern Recognition and Human Language Technologie (PRHLT)-Gruppe der Technischen Universität Valencia, von der die freie OCR-Software PyLaia stammt, und die CITlab-Gruppe der Universität Rostock, die HTR+ – eine proprietäre OCR-Software – entwickelt hat.
Auch bei Verwendung von PyLaia für die Texterkennung sind die so trainierten Texterkennungsmodelle nur innerhalb von Transkribus nutzbar, können also nicht frei exportiert werden. Dies unterscheidet Transkribus von Alternativen wie beispielsweise eScriptorium. Transkribus ermöglicht allerdings den freien Export der erstellten Trainingsdaten und trainierte Modelle können mit anderen Usern innerhalb der Plattform geteilt werden.
- ↑ tranScriptorium Projektseite, abgerufen am 26. Juni 2020.
- ↑ READ Projektseite, abgerufen am 26. Juni 2020.
- ↑ Morshed Mannan, Simon Pek, Vangelis Papadimitropoulos: The Cooperative Governance of Artificial Intelligence. The Case of READ‑COOP’s Transkribus Platform. In: Jerome Nikolai Warren et al. (Hrsg.): Global Cooperative Economics and Movements. Routledge, London 2026, ISBN 978-1-00-353400-6, S. 399–424, doi:10.4324/9781003534006-25.
- ↑ TMView. In: Such-Tool TMView. Amt der Europäischen Union für geistiges Eigentum (EUIPO), 15. Januar 2021, abgerufen am 16. Dezember 2024 (deutsch).
- ↑ PyLaia Wiki. Abgerufen am 30. Juni 2022 (englisch).
- ↑ Moving from Transkribus to eScriptorium. Abgerufen am 30. Juni 2022 (englisch).