Digital Humanities Methoden Daten KI Deutsch Analyse

Einleitung

Digital Humanities: Methoden, Daten und KI im Fokus / Deutsch Analyse führt Dich in ein Forschungsfeld ein, in dem Geisteswissenschaften, Deutschunterricht, Literaturwissenschaft, Linguistik, Geschichtswissenschaft, Informatik, Data Science und Künstliche Intelligenz zusammenarbeiten. In den Digital Humanities werden Texte, Bilder, Handschriften, Filme, Karten, Archive, Tonaufnahmen und Metadaten nicht nur gelesen oder betrachtet, sondern auch digital erschlossen, analysiert, visualisiert und kritisch interpretiert. Der Kurs richtet sich an Lernende, die verstehen möchten, wie digitale Methoden in der Deutsch Analyse eingesetzt werden können, ohne die geisteswissenschaftliche Deutung durch reine Technik zu ersetzen.

{{#ev:youtube|https://www.youtube.com/watch?v=Gf7HUQUyjIs%7C500%7Ccenter}}

Du lernst, wie aus einer Quelle ein Datensatz wird, warum Datenqualität entscheidend ist, wie Methoden wie OCR, Text Mining, Korpuslinguistik, Topic Modeling, Named Entity Recognition, Netzwerkanalyse und Visualisierung funktionieren und welche Rolle KI-Systeme in der heutigen Forschung spielen. Zugleich übst Du, digitale Ergebnisse nicht blind zu übernehmen, sondern sie mit fachlichem Wissen, Quellenkritik, ethischer Reflexion und präzisen Forschungsfragen zu verbinden.

Was sind Digital Humanities?

Digital Humanities bedeutet wörtlich „digitale Geisteswissenschaften“. Gemeint ist ein interdisziplinäres Forschungsfeld an der Schnittstelle von Geisteswissenschaften, Kulturwissenschaften, Informatik und Informationswissenschaft. Dabei werden digitale Werkzeuge genutzt, um geisteswissenschaftliche Fragen zu bearbeiten: Wie verändern sich Wörter in literarischen Texten über die Zeit? Welche Figuren stehen in einem Roman besonders eng miteinander in Beziehung? Welche Orte tauchen in historischen Briefen auf? Wie lässt sich ein großes Archiv so erschließen, dass Menschen und Maschinen es durchsuchen können?

Wichtig ist: Digital Humanities sind nicht einfach „Computer statt Interpretation“. Sie erweitern klassische Methoden wie Hermeneutik, Textanalyse, Quellenkritik, Edition, Stilistik und Diskursanalyse. Digitale Verfahren können Muster sichtbar machen, die bei der Lektüre einzelner Texte schwer zu erkennen sind. Die Deutung dieser Muster bleibt aber eine fachliche Aufgabe. Du musst also immer fragen: Was zeigen die Daten? Was zeigen sie nicht? Welche Entscheidungen wurden bei Auswahl, Erfassung, Bereinigung und Auswertung getroffen?

Warum Digital Humanities in der Deutsch Analyse?

In der Deutsch Analyse geht es häufig um Sprache, Literatur, Kommunikation, Medien, Rhetorik, Erzähltechnik, Figurenkonstellation, Motiv, Thema, Stil und Wirkung. Digitale Methoden helfen Dir, solche Aspekte systematisch zu untersuchen. Du kannst zum Beispiel Wortfelder in einem Gedichtkorpus vergleichen, Satzlängen in verschiedenen Erzähltexten messen, Figurenbeziehungen in einem Drama als Netzwerk darstellen oder historische Zeitungstexte nach Begriffen, Orten und Personen durchsuchen.

Besonders spannend wird die Verbindung von Close Reading und Distant Reading. Beim Close Reading analysierst Du einzelne Textstellen genau. Beim Distant Reading untersuchst Du größere Textmengen mithilfe quantitativer Verfahren. Beides ergänzt sich: Eine Visualisierung kann eine neue Beobachtung anregen, die Du anschließend an konkreten Textstellen überprüfst. Umgekehrt kann eine genaue Textdeutung zu einer digitalen Forschungsfrage führen, die Du an einem größeren Korpus testest.

Forschungsfragen statt Tool-Faszination

Ein häufiger Fehler in den Digital Humanities besteht darin, mit einem Werkzeug zu beginnen, ohne eine klare Frage zu haben. Professionelle Forschung startet anders: Zuerst formulierst Du eine geisteswissenschaftliche Forschungsfrage. Danach entscheidest Du, welche Quellen, Daten und Methoden dazu passen. Eine gute Frage ist offen, begründet, untersuchbar und fachlich relevant.

Beispiele für sinnvolle Forschungsfragen in der Deutsch Analyse sind: Wie verändert sich die Darstellung von Natur in Gedichten verschiedener Epochen? Welche Figuren bilden im Drama die zentralen Vermittlungspositionen? Wie wird Macht in politischen Reden sprachlich markiert? Welche Themen dominieren in Rezensionen zu einem literarischen Werk? Welche Unterschiede zeigen sich zwischen menschlicher Annotation und automatischer Named Entity Recognition?

Daten im Fokus: Von der Quelle zum Korpus

Daten sind in den Digital Humanities nie „roh“ im Sinne von neutral. Sie entstehen durch Entscheidungen. Eine gedruckte Ausgabe, ein Manuskript, ein Zeitungsartikel oder ein digitales Bild wird ausgewählt, gescannt, beschrieben, transkribiert, normalisiert, annotiert und gespeichert. Jeder Schritt kann Fehler, Auslassungen oder Interpretationen enthalten.

Ein Korpus ist eine planvoll zusammengestellte Sammlung von Texten oder anderen Materialien. Für die Deutsch Analyse kann ein Korpus aus Gedichten, Dramen, Romanen, Briefen, Reden, Chatnachrichten, Rezensionen, Zeitungsartikeln oder Unterrichtstexten bestehen. Damit ein Korpus wissenschaftlich brauchbar ist, musst Du dokumentieren, welche Texte enthalten sind, warum sie ausgewählt wurden, aus welchen Ausgaben sie stammen, welche Zeiträume abgedeckt werden und welche Bearbeitungsschritte erfolgt sind.

Typische Datentypen in den Digital Humanities

Textdaten: Romane, Gedichte, Dramen, Briefe, Zeitungen, Tagebücher, Webseiten, Transkripte und Untertitel.
Bilddaten: Handschriftenseiten, Fotografien, Kunstwerke, Karten, Diagramme, Faksimiles und Scans.
Audiodaten: Interviews, Lesungen, Dialektaufnahmen, Hörspiele, Podcasts und historische Tonaufnahmen.
Videodaten: Theatermitschnitte, Erklärvideos, Filmsequenzen, Performances und audiovisuelle Quellen.
Metadaten: Angaben zu Autorin oder Autor, Titel, Datum, Ort, Lizenz, Sprache, Genre, Ausgabe, Provenienz und Erfassungsprozess.
Annotationsdaten: Markierungen zu Personen, Orten, Themen, Wortarten, Sprecherwechseln, Motiven, rhetorischen Mitteln oder Unsicherheiten.
Netzwerkdaten: Beziehungen zwischen Figuren, Briefpartnern, Orten, Institutionen, Zitaten, Quellen oder Begriffen.
Geodaten: Ortsangaben, Reiserouten, historische Karten, Schauplätze, Fundorte oder Bewegungsmuster.

Datenqualität, Metadaten und FAIR-Prinzipien

Gute Datenqualität ist eine Voraussetzung für belastbare Ergebnisse. Fehlerhafte OCR, unvollständige Metadaten, uneinheitliche Schreibweisen, fehlende Quellenangaben oder undokumentierte Bereinigungsschritte können Analysen stark verzerren. Deshalb gehört Forschungsdatenmanagement zu den Grundkompetenzen der Digital Humanities.

Die FAIR-Prinzipien beschreiben, wie Forschungsdaten gestaltet sein sollen: auffindbar, zugänglich, interoperabel und wiederverwendbar. Für Dich bedeutet das: Daten brauchen klare Dateinamen, verlässliche Beschreibungen, offene oder nachvollziehbare Formate, eindeutige Lizenzen und eine Dokumentation der Arbeitsschritte. Gerade in der Schule und im Studium kannst Du schon mit einfachen Mitteln FAIR arbeiten, indem Du Quellen, Auswahlkriterien, Bearbeitungen und Grenzen Deiner Analyse sauber festhältst.

Digitale Edition und TEI

Eine Digitale Edition macht Texte wissenschaftlich erschlossen zugänglich. Sie kann mehrere Textfassungen, Varianten, Kommentare, Faksimiles, Register, Suchfunktionen und Verknüpfungen enthalten. Dabei wird häufig TEI genutzt, die Text Encoding Initiative. Mit TEI lassen sich Texte in XML so auszeichnen, dass Menschen und Maschinen Struktur und Bedeutung erkennen können: Überschriften, Absätze, Verse, Streichungen, Ergänzungen, Personen, Orte, Datierungen oder editorische Unsicherheiten.

Für die Deutsch Analyse ist das besonders wertvoll, weil literarische Texte nicht nur als Zeichenketten, sondern als strukturierte Objekte betrachtet werden. Ein Gedicht besteht aus Versen und Strophen, ein Drama aus Akten, Szenen und Sprecherrollen, ein Brief aus Absender, Empfänger, Datum, Ort und Textkörper. Wenn diese Strukturen maschinenlesbar markiert sind, können sie gezielt durchsucht, verglichen und visualisiert werden.

Methoden der Text- und Sprachanalyse

Text Mining bezeichnet Verfahren, mit denen aus Texten automatisch Informationen gewonnen werden. Dazu gehören einfache Häufigkeitszählungen ebenso wie komplexe Modelle der Computerlinguistik. In der Deutsch Analyse können solche Methoden helfen, Wortfelder, Themen, Stile, Erzählperspektiven, Figurenbeziehungen und Diskurse zu untersuchen.

Tokenisierung: Ein Text wird in kleinere Einheiten wie Wörter, Satzzeichen oder Sätze zerlegt.
Lemmatisierung: Wortformen werden auf eine Grundform zurückgeführt, zum Beispiel „ging“, „gegangen“ und „geht“ auf „gehen“.
Part-of-Speech-Tagging: Wörter werden Wortarten wie Nomen, Verb, Adjektiv oder Pronomen zugeordnet.
Kollokation: Wörter werden untersucht, die auffällig häufig gemeinsam auftreten.
Keyword-Analyse: Typische Wörter eines Textes oder Korpus werden im Vergleich zu einem Referenzkorpus bestimmt.
Sentimentanalyse: Texte werden daraufhin untersucht, ob sie eher positive, negative oder neutrale Wertungen enthalten.
Topic Modeling: Große Textsammlungen werden statistisch nach wiederkehrenden Themenmustern geordnet.
Named Entity Recognition: Personen, Orte, Organisationen, Werke oder Datumsangaben werden automatisch erkannt.
Stilometrie: Stilistische Merkmale wie Wortlängen, Funktionswörter oder Satzstrukturen werden quantitativ verglichen.
Netzwerkanalyse: Beziehungen zwischen Figuren, Begriffen, Orten oder Quellen werden als Knoten und Kanten modelliert.

Beispiel: Figurenanalyse als Netzwerk

Bei einer klassischen Figurenanalyse beschreibst Du Rollen, Eigenschaften, Konflikte und Entwicklungen. Digital kannst Du zusätzlich untersuchen, welche Figuren gemeinsam in Szenen auftreten, wer mit wem spricht, welche Figur besonders viele Verbindungen hat oder welche Figur verschiedene Gruppen verbindet. In der Netzwerkanalyse werden Figuren zu Knoten, Beziehungen zu Kanten. Das Ergebnis ist kein Ersatz für Interpretation, sondern ein Modell. Es zeigt bestimmte Beziehungen und blendet andere aus.

Ein Netzwerk kann zum Beispiel sichtbar machen, dass eine Nebenfigur strukturell wichtig ist, weil sie mehrere Gruppen verbindet. Danach musst Du im Text prüfen, ob diese Beobachtung literarisch sinnvoll ist: Vermittelt die Figur Informationen? Löst sie Konflikte aus? Steht sie zwischen sozialen Milieus? Hat sie eine dramaturgische Funktion?

Beispiel: Topic Modeling in literarischen Korpora

Topic Modeling ist ein statistisches Verfahren, das häufig gemeinsam vorkommende Wörter zu Themenmustern gruppiert. In einem Korpus romantischer Gedichte könnten zum Beispiel Wörter wie „Nacht“, „Mond“, „Wald“, „Seele“ und „Traum“ gemeinsam auftreten. Das Modell „weiß“ jedoch nicht, was Romantik bedeutet. Es erkennt nur Muster in Daten. Deshalb müssen Themen immer fachlich interpretiert werden.

Für eine verantwortungsvolle Nutzung musst Du Parameter, Korpusauswahl und Vorverarbeitung dokumentieren. Entfernst Du häufige Wörter? Vereinheitlichst Du alte Schreibweisen? Analysierst Du ganze Texte oder Abschnitte? Jede Entscheidung verändert das Ergebnis. Gute Digital Humanities machen solche Entscheidungen transparent.

KI im Fokus

Künstliche Intelligenz spielt in den Digital Humanities eine wachsende Rolle. Maschinelles Lernen kann Handschriften erkennen, Texte klassifizieren, Entitäten extrahieren, Bilder vergleichen, Sprachmuster entdecken oder Metadaten ergänzen. Large Language Models können Texte zusammenfassen, Hypothesen formulieren, Annotationen vorschlagen oder Programmierhilfe leisten.

Trotzdem gilt: KI erzeugt keine automatische Wahrheit. Modelle können halluzinieren, Vorurteile reproduzieren, historische Sprache falsch deuten, Minderheitensprachen schlechter verarbeiten oder Quellenkontexte ignorieren. Deshalb brauchst Du immer eine Kombination aus technischem Verständnis, fachlicher Prüfung und ethischer Verantwortung. Eine KI-Antwort ist ein Ausgangspunkt für Prüfung, nicht der Endpunkt wissenschaftlicher Analyse.

Menschliche und automatische Annotation

Annotation bedeutet, Daten mit zusätzlichen Informationen zu versehen. In einem Gedicht kannst Du Metaphern markieren, in einem Drama Sprecherrollen, in einem Brief Personen und Orte, in einem Zeitungsartikel politische Begriffe. Annotationen können manuell, halbautomatisch oder automatisch entstehen.

Menschliche Annotation ist oft genauer bei komplexer Bedeutung, Ironie, Mehrdeutigkeit und Kontext. Automatische Annotation ist schneller bei großen Datenmengen, macht aber Fehler. Besonders sinnvoll ist ein Vergleich: Du lässt ein Tool Vorschläge machen, prüfst sie fachlich und dokumentierst Fehlertypen. So lernst Du nicht nur etwas über den Text, sondern auch über Grenzen digitaler Methoden.

Visualisierung als Erkenntniswerkzeug

Visualisierung kann Daten verständlich machen: Wortwolken, Balkendiagramme, Zeitachsen, Karten, Netzwerke, Heatmaps oder Streudiagramme zeigen Muster auf einen Blick. Aber Visualisierungen können auch täuschen. Achsenskalierung, Farbauswahl, Datenlücken, Gruppierungen und Beschriftungen beeinflussen die Wahrnehmung.

In der Deutsch Analyse sollte jede Visualisierung eine klare Funktion haben. Sie soll eine Frage beantworten, einen Vergleich ermöglichen oder eine Hypothese sichtbar machen. Eine schöne Grafik ohne fachliche Deutung ist nicht ausreichend. Umgekehrt kann eine einfache Tabelle wissenschaftlich stärker sein als eine spektakuläre, aber unklare Darstellung.

Ethik, Bias und Verantwortung

Digital Humanities arbeiten oft mit kulturellem Erbe, persönlichen Dokumenten, historischen Minderheiten, kolonialen Archiven, sozialen Medien oder sensiblen Daten. Deshalb sind Ethik, Datenschutz, Urheberrecht, Lizenz, Bias und Transparenz zentrale Themen. Du musst fragen: Dürfen die Daten genutzt werden? Werden Menschen sichtbar gemacht, die geschützt werden müssen? Werden historische Machtverhältnisse unkritisch reproduziert? Sind Lücken im Archiv erkennbar? Welche Gruppen fehlen?

Auch KI verstärkt diese Fragen. Wenn ein Modell mit bestimmten Daten trainiert wurde, übernimmt es deren Muster. Das kann hilfreich sein, aber auch problematisch. Bei historischen Quellen kann zum Beispiel alte Rechtschreibung die Erkennung verschlechtern. Bei literarischen Texten kann Mehrdeutigkeit fälschlich vereindeutigt werden. Deshalb gehört zur KI-Kompetenz die Fähigkeit, Ergebnisse zu überprüfen, Fehler zu benennen und Grenzen offenzulegen.

Werkzeuge und Arbeitsablauf

Ein typischer DH-Arbeitsablauf beginnt mit einer Forschungsfrage und endet nicht mit einem Tool-Ergebnis, sondern mit einer reflektierten Interpretation. Dazwischen liegen mehrere Schritte: Quellen auswählen, Rechte klären, Daten erfassen, Metadaten erstellen, Daten bereinigen, Methode wählen, Analyse durchführen, Ergebnisse visualisieren, Ergebnisse interpretieren, Grenzen benennen und Materialien dokumentieren.

Mögliche Werkzeuge sind OCR-Programme, Tabellenkalkulation, Python, Jupyter Notebook, Voyant Tools, Gephi, Recogito, Transkribus, CATMA, Wikidata, Wikibase, TEI-Editoren, Git und Repositorien. Welche Werkzeuge geeignet sind, hängt von Frage, Daten, Kenntnisstand, Lizenz, Datenschutz und Zeit ab.

Mini-Fallstudie: Ein Gedichtkorpus digital untersuchen

Stell Dir vor, Du untersuchst Naturdarstellungen in deutschsprachigen Gedichten. Klassisch würdest Du einzelne Gedichte lesen und Motive wie Wald, Nacht, Fluss, Blume oder Jahreszeiten interpretieren. Digital könntest Du zusätzlich ein kleines Korpus aus Gedichten verschiedener Epochen erstellen. Danach würdest Du Texte bereinigen, Metadaten erfassen, Wortfelder definieren, Häufigkeiten vergleichen und auffällige Stellen wieder genau lesen.

Ein mögliches Ergebnis wäre: In einem Teilkorpus treten Naturbegriffe besonders häufig gemeinsam mit Gefühlswörtern auf, in einem anderen stärker mit Technik- oder Stadtbegriffen. Daraus folgt noch keine fertige Interpretation. Du müsstest prüfen, welche Gedichte den Befund tragen, welche Ausnahmen es gibt und ob die Auswahl des Korpus fair ist. Genau hier verbindet sich digitale Analyse mit literaturwissenschaftlicher Deutung.

Kompetenzen, die Du entwickelst

Nach diesem Kurs kannst Du erklären, was Digital Humanities sind, wie aus Quellen Daten werden, warum Metadaten wichtig sind, wie digitale Methoden die Deutsch Analyse erweitern und weshalb KI kritisch geprüft werden muss. Du kannst eine kleine Forschungsfrage formulieren, ein einfaches Korpus planen, Methoden passend auswählen, Ergebnisse interpretieren und Grenzen Deiner Analyse benennen.

Du lernst außerdem, digitale Ergebnisse sprachlich präzise darzustellen. Dazu gehört, nicht zu behaupten: „Die KI hat bewiesen, dass …“, sondern genauer zu formulieren: „Das Modell zeigt in diesem Korpus unter den gewählten Parametern ein Muster, das anschließend an Textstellen überprüft wurde.“ Diese Genauigkeit ist ein Kern wissenschaftlichen Arbeitens.

Interaktive Aufgaben

Quiz: Teste Dein Wissen

Was bezeichnet der Begriff Digital Humanities am treffendsten? (Ein interdisziplinäres Feld zwischen Geisteswissenschaften und digitalen Methoden) (!Ein reines Programmierfach ohne Bezug zu Kultur und Sprache) (!Eine Methode, bei der Texte nicht mehr gelesen werden) (!Ein ausschließlich technisches Verfahren zur Bildbearbeitung)

Welche Aussage beschreibt das Verhältnis von Close Reading und Distant Reading richtig? (Beide Zugänge können sich ergänzen) (!Close Reading wird durch Distant Reading vollständig ersetzt) (!Distant Reading ist nur für Naturwissenschaften geeignet) (!Close Reading verbietet digitale Werkzeuge)

Was ist ein Korpus in der digitalen Textanalyse? (Eine planvoll zusammengestellte Sammlung von Texten oder Materialien) (!Ein einzelnes zufällig ausgewähltes Wort) (!Eine Programmiersprache für Diagramme) (!Ein automatischer Beweis für literarische Bedeutung)

Welche Aufgabe erfüllt OCR? (OCR wandelt Bildscans von Schrift in durchsuchbaren Text um) (!OCR erstellt automatisch literarische Interpretationen) (!OCR löscht Metadaten aus Forschungsdaten) (!OCR ersetzt jede Quellenkritik)

Warum sind Metadaten wichtig? (Sie beschreiben Herkunft, Eigenschaften und Kontext von Daten) (!Sie machen jede Interpretation überflüssig) (!Sie verhindern grundsätzlich alle Fehler) (!Sie sind nur bei Musikdateien relevant)

Was meint Named Entity Recognition? (Die automatische Erkennung von Personen, Orten oder Organisationen in Texten) (!Die manuelle Bewertung der Schönheit eines Gedichts) (!Die zufällige Auswahl von Zitaten) (!Die Erstellung einer Druckausgabe ohne Kommentare)

Welche Aussage zu KI in den Digital Humanities ist richtig? (KI-Ergebnisse müssen fachlich geprüft und kontextualisiert werden) (!KI erzeugt immer fehlerfreie Forschungsergebnisse) (!KI darf nur ohne Quellen verwendet werden) (!KI ersetzt grundsätzlich alle geisteswissenschaftlichen Methoden)

Was bedeutet FAIR bei Forschungsdaten? (Auffindbar, zugänglich, interoperabel und wiederverwendbar) (!Fertig, autoritär, isoliert und risikolos) (!Formal, absolut, intern und roh) (!Fehlerfrei, anonym, intuitiv und repariert)

Wozu dient eine Visualisierung in der Deutsch Analyse? (Sie macht Muster sichtbar, die anschließend interpretiert werden müssen) (!Sie beweist automatisch die einzig richtige Deutung) (!Sie ersetzt die Textgrundlage) (!Sie ist nur Dekoration für Präsentationen)

Was ist bei der Arbeit mit historischen Quellen besonders wichtig? (Quellenkritik, Dokumentation und Bewusstsein für Datenlücken) (!Ausschließlich die modernste Software) (!Der Verzicht auf jede Interpretation) (!Die Entfernung aller Metadaten)

Memory

OCR	Schriftbild zu Text
TEI	Strukturierte Textauszeichnung
Korpus	Geplante Textsammlung
Metadaten	Daten über Daten
Topic Modeling	Statistische Themenmuster
NER	Erkennung benannter Entitäten
Bias	Verzerrung in Daten oder Modellen
Visualisierung	Sichtbarmachung von Mustern

Drag and Drop

Ordne die richtigen Begriffe zu.	Thema
OCR	Scan in durchsuchbaren Text umwandeln
Tokenisierung	Text in Wörter und Satzzeichen zerlegen
Lemmatisierung	Wortformen auf Grundformen zurückführen
Named Entity Recognition	Personen, Orte und Organisationen erkennen
Netzwerkanalyse	Beziehungen zwischen Figuren modellieren
Visualisierung	Analyseergebnisse als Grafik darstellen

Kreuzworträtsel

Korpus	Wie nennt man eine planvoll zusammengestellte Sammlung von Texten?
Edition	Wie nennt man eine wissenschaftlich erschlossene Textausgabe?
Metadaten	Wie heißen Daten, die andere Daten beschreiben?
Python	Welche Programmiersprache wird häufig für Datenanalyse genutzt?
Bias	Wie nennt man eine systematische Verzerrung in Daten oder Modellen?
Netzwerk	Welches Modell stellt Beziehungen zwischen Knoten und Kanten dar?

LearningApps

Lückentext

Die

verbinden geisteswissenschaftliche Fragestellungen mit digitalen Methoden. In der Deutsch Analyse kann ein

genutzt werden, um größere Textmengen systematisch zu untersuchen. Damit Texte maschinenlesbar werden, hilft bei gescannten Quellen oft

. Zusätzliche Angaben zu Herkunft, Datum oder Lizenz heißen

. Die

ermöglicht eine strukturierte Auszeichnung literarischer und historischer Texte. Beim

wird eine einzelne Textstelle genau gedeutet. Beim

werden größere Textmengen aus größerer Distanz analysiert. Die automatische Erkennung von Personen, Orten und Organisationen heißt

. Statistische Themenmuster können mit

untersucht werden. Beziehungen zwischen Figuren lassen sich als

darstellen. Forschungsdaten sollen nach den FAIR-Prinzipien möglichst

sein. Ergebnisse von

müssen immer kritisch geprüft und fachlich interpretiert werden.

Offene Aufgaben

Leicht

Begriffskarte Digital Humanities: Erstelle eine Begriffskarte mit zehn zentralen Begriffen aus diesem aiMOOC und erkläre jeden Begriff in einem eigenen Beispielsatz.
Mini-Korpus sammeln: Wähle drei kurze Gedichte oder drei kurze Sachtexte aus und notiere Quelle, Autorin oder Autor, Jahr, Thema und Lizenzlage.
Tool-Beobachtung: Nutze ein einfaches Textanalyse-Werkzeug und beschreibe, welche Wörter besonders häufig auftreten und welche Deutung dadurch möglich oder problematisch ist.
KI kritisch prüfen: Bitte ein KI-System um eine kurze Inhaltsangabe zu einem literarischen Text und markiere anschließend mindestens fünf Stellen, die Du am Original überprüfen musst.

Standard

Close Reading und Distant Reading verbinden: Formuliere zu einem Gedicht zuerst eine genaue Beobachtung an einer Textstelle und entwickle daraus eine digitale Untersuchungsfrage für ein kleines Korpus.
Metadaten-Tabelle erstellen: Lege eine Tabelle für fünf Texte an und erfasse Titel, Autorin oder Autor, Erscheinungsjahr, Gattung, Quelle, Lizenz und Bearbeitungsschritte.
Figurennetzwerk entwerfen: Erstelle zu einem Drama oder Roman ein Figurennetzwerk und erkläre, welche Beziehungen Du als Kanten modellierst.
Bias-Fall untersuchen: Sammle Beispiele dafür, wie ein Korpus verzerrt sein kann, wenn bestimmte Autorinnen, Epochen, Regionen, Dialekte oder Textsorten fehlen.

Schwer

Digitale Editionsprobe: Zeichne einen kurzen literarischen Textabschnitt mit einfachen TEI-ähnlichen Markierungen für Überschrift, Absatz, Sprecherrolle oder Versstruktur aus und reflektiere Deine Entscheidungen.
Topic Modeling simulieren: Gruppiere Wörter aus zehn Texten manuell zu Themenfeldern und erkläre, warum solche Gruppen keine automatische Interpretation liefern.
KI-Annotation vergleichen: Annotiere Personen, Orte und Organisationen in einem kurzen Text zuerst selbst, lasse danach ein KI-System Vorschläge machen und vergleiche Treffer, Fehler und Grenzfälle.
Forschungsprojekt planen: Entwickle ein vollständiges Mini-Projekt mit Forschungsfrage, Korpus, Metadatenplan, Methode, erwarteter Visualisierung, ethischen Risiken und Kriterien für die Auswertung.

type=create break=no preload=CHAT GPT TEXT HIER EINFÜGEN default= width=30 placeholder= Dein MOOC Titel buttonlabel=MOOC erstellen </inputbox>

Lernkontrolle

Forschungsdesign begründen: Entwickle eine digitale Forschungsfrage zu einem literarischen oder sprachlichen Thema und begründe, warum die gewählte Methode zur Frage passt.
Datenkritik anwenden: Erkläre an einem Beispiel, wie Auswahl, OCR-Fehler, fehlende Metadaten oder Lizenzprobleme das Ergebnis einer Analyse beeinflussen können.
Visualisierung interpretieren: Beschreibe, wie Du eine Wortfrequenzgrafik, eine Karte oder ein Figurennetzwerk deuten würdest, ohne vorschnell Kausalitäten zu behaupten.
KI-Ergebnis prüfen: Formuliere Kriterien, mit denen Du eine KI-generierte Analyse eines Gedichts oder einer Rede fachlich kontrollieren kannst.
Transfer auf Unterricht: Plane eine Unterrichtssequenz, in der digitale Textanalyse und klassische Interpretation sinnvoll miteinander verbunden werden.
Ethik reflektieren: Beurteile, welche Verantwortung Forschende tragen, wenn sie historische, persönliche oder kulturell sensible Daten digital veröffentlichen.

Lernnachweis

Für Deinen Lernnachweis solltest Du zeigen, dass Du nicht nur Fachbegriffe auswendig kennst, sondern einen digitalen Analyseprozess begründet planen, durchführen und reflektieren kannst.

Themenverständnis: Du erklärst die Grundidee der Digital Humanities und ordnest sie zwischen Geisteswissenschaften, Informatik und Data Science ein.
Forschungsfrage: Du formulierst eine klare Frage zur Deutsch Analyse, die mit digitalen und klassischen Methoden bearbeitet werden kann.
Datenbasis: Du beschreibst Dein Korpus, Deine Quellen, Metadaten, Auswahlkriterien, Bearbeitungsschritte und Grenzen.
Methodenwahl: Du begründest, warum Du eine Methode wie OCR, Korpuslinguistik, Topic Modeling, Named Entity Recognition, Netzwerkanalyse oder Visualisierung nutzt.
Interpretation: Du verbindest digitale Ergebnisse mit konkreten Textstellen, Kontextwissen und fachlicher Deutung.
Reflexion: Du benennst Fehlerquellen, Bias, ethische Fragen, Datenschutz, Urheberrecht und Grenzen von KI.
Dokumentation: Du legst nachvollziehbar offen, welche Tools, Parameter, Datenversionen und Entscheidungen verwendet wurden.

OERs zum Thema

Links

Digital Humanities

aiMOOC-Projekte

Schulfach+

Prüfungsliteratur 2026
Bundesland	Bücher	Kurzbeschreibung
Baden-Württemberg	Abitur Der zerbrochne Krug - Heinrich von Kleist Heimsuchung - Jenny Erpenbeck Mittlere Reife Der Markisenmann - Jan Weiler oder Als die Welt uns gehörte - Liz Kessler Ein Schatten wie ein Leopard - Myron Levoy oder Pampa Blues - Rolf Lappert	Abitur Dorfrichter-Komödie über Wahrheit/Schuld; Roman über einen Ort und deutsche Geschichte. Mittlere Reife Wahllektüren (Roadtrip-Vater-Sohn / Jugendroman im NS-Kontext / Coming-of-age / Provinzroman).
Bayern	Abitur Der zerbrochne Krug - Heinrich von Kleist Heimsuchung - Jenny Erpenbeck	Abitur Lustspiel über Machtmissbrauch und Recht; Roman als Zeitschnitt deutscher Geschichte an einem Haus/Grundstück.
Berlin/Brandenburg	Abitur Der zerbrochne Krug - Heinrich von Kleist Woyzeck - Georg Büchner Der Biberpelz - Gerhart Hauptmann Heimsuchung - Jenny Erpenbeck	Abitur Gerichtskomödie; soziales Drama um Ausbeutung/Armut; Komödie/Satire um Diebstahl und Obrigkeit; Roman über Erinnerungsräume und Umbrüche.
Bremen	Abitur Nach Mitternacht - Irmgard Keun Mario und der Zauberer - Thomas Mann Emilia Galotti - Gotthold Ephraim Lessing oder Miss Sara Sampson - Gotthold Ephraim Lessing	Abitur Roman in der NS-Zeit (Alltag, Anpassung, Angst); Novelle über Verführung/Massenpsychologie; bürgerliche Trauerspiele (Moral, Macht, Stand).
Hamburg	Abitur Der zerbrochne Krug - Heinrich von Kleist Das kunstseidene Mädchen - Irmgard Keun	Abitur Justiz-/Machtkritik als Komödie; Großstadtroman der Weimarer Zeit (Rollenbilder, Aufstiegsträume, soziale Realität).
Hessen	Abitur Der zerbrochne Krug - Heinrich von Kleist Woyzeck - Georg Büchner Heimsuchung - Jenny Erpenbeck Der Prozess - Franz Kafka	Abitur Gerichtskomödie; Fragmentdrama über Gewalt/Entmenschlichung; Erinnerungsroman über deutsche Brüche; moderner Roman über Schuld, Macht und Bürokratie.
Niedersachsen	Abitur Der zerbrochene Krug - Heinrich von Kleist Das kunstseidene Mädchen - Irmgard Keun Die Marquise von O. - Heinrich von Kleist Über das Marionettentheater - Heinrich von Kleist	Abitur Schwerpunkt auf Drama/Roman sowie Kleist-Prosatext und Essay (Ehre, Gewalt, Unschuld; Ästhetik/„Anmut“).
Nordrhein-Westfalen	Abitur Der zerbrochne Krug - Heinrich von Kleist Heimsuchung - Jenny Erpenbeck	Abitur Komödie über Wahrheit und Autorität; Roman als literarische „Geschichtsschichtung“ an einem Ort.
Saarland	Abitur Heimsuchung - Jenny Erpenbeck Furor - Lutz Hübner und Sarah Nemitz Bahnwärter Thiel - Gerhart Hauptmann	Abitur Erinnerungsroman an einem Ort; zeitgenössisches Drama über Eskalation/Populismus; naturalistische Novelle (Pflicht/Überforderung/Abgrund).
Sachsen (berufliches Gymnasium)	Abitur Der zerbrochne Krug - Heinrich von Kleist Woyzeck - Georg Büchner Irrungen, Wirrungen - Theodor Fontane Der gute Mensch von Sezuan - Bertolt Brecht Heimsuchung - Jenny Erpenbeck Der Trafikant - Robert Seethaler	Abitur Mischung aus Klassiker-Drama, sozialem Drama, realistischem Roman, epischem Theater und Gegenwarts-/Erinnerungsroman; zusätzlich Coming-of-age im historischen Kontext.
Sachsen-Anhalt	Abitur (keine fest benannte landesweite Pflichtlektüre veröffentlicht; Themenfelder)	Abitur Schwerpunktsetzung über Themenfelder (u. a. Literatur um 1900; Sprache in politisch-gesellschaftlichen Kontexten), ohne feste Einzeltitel.
Schleswig-Holstein	Abitur Der zerbrochne Krug - Heinrich von Kleist Heimsuchung - Jenny Erpenbeck	Abitur Recht/Gerechtigkeit und historische Tiefenschichten eines Ortes – umgesetzt über Drama und Gegenwartsroman.
Thüringen	Abitur (keine fest benannte landesweite Pflichtlektüre veröffentlicht; Orientierung am gemeinsamen Aufgabenpool)	Abitur In der Praxis häufig Orientierung am gemeinsamen Aufgabenpool; landesweite Einzeltitel je nach Vorgabe/Handreichung nicht einheitlich ausgewiesen.
Mecklenburg-Vorpommern	Abitur (Quelle aktuell technisch nicht abrufbar; Beteiligung am gemeinsamen Aufgabenpool bekannt)	Abitur Land beteiligt sich am länderübergreifenden Aufgabenpool; konkrete, veröffentlichte Einzeltitel konnten hier nicht ausgelesen werden.
Rheinland-Pfalz	Abitur (keine landesweit einheitliche Pflichtlektüre; schulische Auswahl)	Abitur Keine landesweite Einheitsliste; Auswahl kann schul-/kursbezogen erfolgen.