Digital Humanities Methoden Daten KI Deutsch Analyse


Digital Humanities Methoden Daten KI Deutsch Analyse
Einleitung
Digital Humanities: Methoden, Daten und KI im Fokus / Deutsch Analyse führt Dich in ein Forschungsfeld ein, in dem Geisteswissenschaften, Deutschunterricht, Literaturwissenschaft, Linguistik, Geschichtswissenschaft, Informatik, Data Science und Künstliche Intelligenz zusammenarbeiten. In den Digital Humanities werden Texte, Bilder, Handschriften, Filme, Karten, Archive, Tonaufnahmen und Metadaten nicht nur gelesen oder betrachtet, sondern auch digital erschlossen, analysiert, visualisiert und kritisch interpretiert. Der Kurs richtet sich an Lernende, die verstehen möchten, wie digitale Methoden in der Deutsch Analyse eingesetzt werden können, ohne die geisteswissenschaftliche Deutung durch reine Technik zu ersetzen.
{{#ev:youtube|https://www.youtube.com/watch?v=Gf7HUQUyjIs%7C500%7Ccenter}}

Du lernst, wie aus einer Quelle ein Datensatz wird, warum Datenqualität entscheidend ist, wie Methoden wie OCR, Text Mining, Korpuslinguistik, Topic Modeling, Named Entity Recognition, Netzwerkanalyse und Visualisierung funktionieren und welche Rolle KI-Systeme in der heutigen Forschung spielen. Zugleich übst Du, digitale Ergebnisse nicht blind zu übernehmen, sondern sie mit fachlichem Wissen, Quellenkritik, ethischer Reflexion und präzisen Forschungsfragen zu verbinden.
Was sind Digital Humanities?
Digital Humanities bedeutet wörtlich „digitale Geisteswissenschaften“. Gemeint ist ein interdisziplinäres Forschungsfeld an der Schnittstelle von Geisteswissenschaften, Kulturwissenschaften, Informatik und Informationswissenschaft. Dabei werden digitale Werkzeuge genutzt, um geisteswissenschaftliche Fragen zu bearbeiten: Wie verändern sich Wörter in literarischen Texten über die Zeit? Welche Figuren stehen in einem Roman besonders eng miteinander in Beziehung? Welche Orte tauchen in historischen Briefen auf? Wie lässt sich ein großes Archiv so erschließen, dass Menschen und Maschinen es durchsuchen können?
Wichtig ist: Digital Humanities sind nicht einfach „Computer statt Interpretation“. Sie erweitern klassische Methoden wie Hermeneutik, Textanalyse, Quellenkritik, Edition, Stilistik und Diskursanalyse. Digitale Verfahren können Muster sichtbar machen, die bei der Lektüre einzelner Texte schwer zu erkennen sind. Die Deutung dieser Muster bleibt aber eine fachliche Aufgabe. Du musst also immer fragen: Was zeigen die Daten? Was zeigen sie nicht? Welche Entscheidungen wurden bei Auswahl, Erfassung, Bereinigung und Auswertung getroffen?
Warum Digital Humanities in der Deutsch Analyse?
In der Deutsch Analyse geht es häufig um Sprache, Literatur, Kommunikation, Medien, Rhetorik, Erzähltechnik, Figurenkonstellation, Motiv, Thema, Stil und Wirkung. Digitale Methoden helfen Dir, solche Aspekte systematisch zu untersuchen. Du kannst zum Beispiel Wortfelder in einem Gedichtkorpus vergleichen, Satzlängen in verschiedenen Erzähltexten messen, Figurenbeziehungen in einem Drama als Netzwerk darstellen oder historische Zeitungstexte nach Begriffen, Orten und Personen durchsuchen.
Besonders spannend wird die Verbindung von Close Reading und Distant Reading. Beim Close Reading analysierst Du einzelne Textstellen genau. Beim Distant Reading untersuchst Du größere Textmengen mithilfe quantitativer Verfahren. Beides ergänzt sich: Eine Visualisierung kann eine neue Beobachtung anregen, die Du anschließend an konkreten Textstellen überprüfst. Umgekehrt kann eine genaue Textdeutung zu einer digitalen Forschungsfrage führen, die Du an einem größeren Korpus testest.
Forschungsfragen statt Tool-Faszination
Ein häufiger Fehler in den Digital Humanities besteht darin, mit einem Werkzeug zu beginnen, ohne eine klare Frage zu haben. Professionelle Forschung startet anders: Zuerst formulierst Du eine geisteswissenschaftliche Forschungsfrage. Danach entscheidest Du, welche Quellen, Daten und Methoden dazu passen. Eine gute Frage ist offen, begründet, untersuchbar und fachlich relevant.
Beispiele für sinnvolle Forschungsfragen in der Deutsch Analyse sind: Wie verändert sich die Darstellung von Natur in Gedichten verschiedener Epochen? Welche Figuren bilden im Drama die zentralen Vermittlungspositionen? Wie wird Macht in politischen Reden sprachlich markiert? Welche Themen dominieren in Rezensionen zu einem literarischen Werk? Welche Unterschiede zeigen sich zwischen menschlicher Annotation und automatischer Named Entity Recognition?
Daten im Fokus: Von der Quelle zum Korpus
Daten sind in den Digital Humanities nie „roh“ im Sinne von neutral. Sie entstehen durch Entscheidungen. Eine gedruckte Ausgabe, ein Manuskript, ein Zeitungsartikel oder ein digitales Bild wird ausgewählt, gescannt, beschrieben, transkribiert, normalisiert, annotiert und gespeichert. Jeder Schritt kann Fehler, Auslassungen oder Interpretationen enthalten.
Ein Korpus ist eine planvoll zusammengestellte Sammlung von Texten oder anderen Materialien. Für die Deutsch Analyse kann ein Korpus aus Gedichten, Dramen, Romanen, Briefen, Reden, Chatnachrichten, Rezensionen, Zeitungsartikeln oder Unterrichtstexten bestehen. Damit ein Korpus wissenschaftlich brauchbar ist, musst Du dokumentieren, welche Texte enthalten sind, warum sie ausgewählt wurden, aus welchen Ausgaben sie stammen, welche Zeiträume abgedeckt werden und welche Bearbeitungsschritte erfolgt sind.

Typische Datentypen in den Digital Humanities
- Textdaten: Romane, Gedichte, Dramen, Briefe, Zeitungen, Tagebücher, Webseiten, Transkripte und Untertitel.
- Bilddaten: Handschriftenseiten, Fotografien, Kunstwerke, Karten, Diagramme, Faksimiles und Scans.
- Audiodaten: Interviews, Lesungen, Dialektaufnahmen, Hörspiele, Podcasts und historische Tonaufnahmen.
- Videodaten: Theatermitschnitte, Erklärvideos, Filmsequenzen, Performances und audiovisuelle Quellen.
- Metadaten: Angaben zu Autorin oder Autor, Titel, Datum, Ort, Lizenz, Sprache, Genre, Ausgabe, Provenienz und Erfassungsprozess.
- Annotationsdaten: Markierungen zu Personen, Orten, Themen, Wortarten, Sprecherwechseln, Motiven, rhetorischen Mitteln oder Unsicherheiten.
- Netzwerkdaten: Beziehungen zwischen Figuren, Briefpartnern, Orten, Institutionen, Zitaten, Quellen oder Begriffen.
- Geodaten: Ortsangaben, Reiserouten, historische Karten, Schauplätze, Fundorte oder Bewegungsmuster.
Datenqualität, Metadaten und FAIR-Prinzipien
Gute Datenqualität ist eine Voraussetzung für belastbare Ergebnisse. Fehlerhafte OCR, unvollständige Metadaten, uneinheitliche Schreibweisen, fehlende Quellenangaben oder undokumentierte Bereinigungsschritte können Analysen stark verzerren. Deshalb gehört Forschungsdatenmanagement zu den Grundkompetenzen der Digital Humanities.
Die FAIR-Prinzipien beschreiben, wie Forschungsdaten gestaltet sein sollen: auffindbar, zugänglich, interoperabel und wiederverwendbar. Für Dich bedeutet das: Daten brauchen klare Dateinamen, verlässliche Beschreibungen, offene oder nachvollziehbare Formate, eindeutige Lizenzen und eine Dokumentation der Arbeitsschritte. Gerade in der Schule und im Studium kannst Du schon mit einfachen Mitteln FAIR arbeiten, indem Du Quellen, Auswahlkriterien, Bearbeitungen und Grenzen Deiner Analyse sauber festhältst.
Digitale Edition und TEI
Eine Digitale Edition macht Texte wissenschaftlich erschlossen zugänglich. Sie kann mehrere Textfassungen, Varianten, Kommentare, Faksimiles, Register, Suchfunktionen und Verknüpfungen enthalten. Dabei wird häufig TEI genutzt, die Text Encoding Initiative. Mit TEI lassen sich Texte in XML so auszeichnen, dass Menschen und Maschinen Struktur und Bedeutung erkennen können: Überschriften, Absätze, Verse, Streichungen, Ergänzungen, Personen, Orte, Datierungen oder editorische Unsicherheiten.

Für die Deutsch Analyse ist das besonders wertvoll, weil literarische Texte nicht nur als Zeichenketten, sondern als strukturierte Objekte betrachtet werden. Ein Gedicht besteht aus Versen und Strophen, ein Drama aus Akten, Szenen und Sprecherrollen, ein Brief aus Absender, Empfänger, Datum, Ort und Textkörper. Wenn diese Strukturen maschinenlesbar markiert sind, können sie gezielt durchsucht, verglichen und visualisiert werden.
Methoden der Text- und Sprachanalyse
Text Mining bezeichnet Verfahren, mit denen aus Texten automatisch Informationen gewonnen werden. Dazu gehören einfache Häufigkeitszählungen ebenso wie komplexe Modelle der Computerlinguistik. In der Deutsch Analyse können solche Methoden helfen, Wortfelder, Themen, Stile, Erzählperspektiven, Figurenbeziehungen und Diskurse zu untersuchen.
- Tokenisierung: Ein Text wird in kleinere Einheiten wie Wörter, Satzzeichen oder Sätze zerlegt.
- Lemmatisierung: Wortformen werden auf eine Grundform zurückgeführt, zum Beispiel „ging“, „gegangen“ und „geht“ auf „gehen“.
- Part-of-Speech-Tagging: Wörter werden Wortarten wie Nomen, Verb, Adjektiv oder Pronomen zugeordnet.
- Kollokation: Wörter werden untersucht, die auffällig häufig gemeinsam auftreten.
- Keyword-Analyse: Typische Wörter eines Textes oder Korpus werden im Vergleich zu einem Referenzkorpus bestimmt.
- Sentimentanalyse: Texte werden daraufhin untersucht, ob sie eher positive, negative oder neutrale Wertungen enthalten.
- Topic Modeling: Große Textsammlungen werden statistisch nach wiederkehrenden Themenmustern geordnet.
- Named Entity Recognition: Personen, Orte, Organisationen, Werke oder Datumsangaben werden automatisch erkannt.
- Stilometrie: Stilistische Merkmale wie Wortlängen, Funktionswörter oder Satzstrukturen werden quantitativ verglichen.
- Netzwerkanalyse: Beziehungen zwischen Figuren, Begriffen, Orten oder Quellen werden als Knoten und Kanten modelliert.
Beispiel: Figurenanalyse als Netzwerk
Bei einer klassischen Figurenanalyse beschreibst Du Rollen, Eigenschaften, Konflikte und Entwicklungen. Digital kannst Du zusätzlich untersuchen, welche Figuren gemeinsam in Szenen auftreten, wer mit wem spricht, welche Figur besonders viele Verbindungen hat oder welche Figur verschiedene Gruppen verbindet. In der Netzwerkanalyse werden Figuren zu Knoten, Beziehungen zu Kanten. Das Ergebnis ist kein Ersatz für Interpretation, sondern ein Modell. Es zeigt bestimmte Beziehungen und blendet andere aus.
Ein Netzwerk kann zum Beispiel sichtbar machen, dass eine Nebenfigur strukturell wichtig ist, weil sie mehrere Gruppen verbindet. Danach musst Du im Text prüfen, ob diese Beobachtung literarisch sinnvoll ist: Vermittelt die Figur Informationen? Löst sie Konflikte aus? Steht sie zwischen sozialen Milieus? Hat sie eine dramaturgische Funktion?
Beispiel: Topic Modeling in literarischen Korpora
Topic Modeling ist ein statistisches Verfahren, das häufig gemeinsam vorkommende Wörter zu Themenmustern gruppiert. In einem Korpus romantischer Gedichte könnten zum Beispiel Wörter wie „Nacht“, „Mond“, „Wald“, „Seele“ und „Traum“ gemeinsam auftreten. Das Modell „weiß“ jedoch nicht, was Romantik bedeutet. Es erkennt nur Muster in Daten. Deshalb müssen Themen immer fachlich interpretiert werden.
Für eine verantwortungsvolle Nutzung musst Du Parameter, Korpusauswahl und Vorverarbeitung dokumentieren. Entfernst Du häufige Wörter? Vereinheitlichst Du alte Schreibweisen? Analysierst Du ganze Texte oder Abschnitte? Jede Entscheidung verändert das Ergebnis. Gute Digital Humanities machen solche Entscheidungen transparent.
KI im Fokus
Künstliche Intelligenz spielt in den Digital Humanities eine wachsende Rolle. Maschinelles Lernen kann Handschriften erkennen, Texte klassifizieren, Entitäten extrahieren, Bilder vergleichen, Sprachmuster entdecken oder Metadaten ergänzen. Large Language Models können Texte zusammenfassen, Hypothesen formulieren, Annotationen vorschlagen oder Programmierhilfe leisten.
Trotzdem gilt: KI erzeugt keine automatische Wahrheit. Modelle können halluzinieren, Vorurteile reproduzieren, historische Sprache falsch deuten, Minderheitensprachen schlechter verarbeiten oder Quellenkontexte ignorieren. Deshalb brauchst Du immer eine Kombination aus technischem Verständnis, fachlicher Prüfung und ethischer Verantwortung. Eine KI-Antwort ist ein Ausgangspunkt für Prüfung, nicht der Endpunkt wissenschaftlicher Analyse.
Menschliche und automatische Annotation
Annotation bedeutet, Daten mit zusätzlichen Informationen zu versehen. In einem Gedicht kannst Du Metaphern markieren, in einem Drama Sprecherrollen, in einem Brief Personen und Orte, in einem Zeitungsartikel politische Begriffe. Annotationen können manuell, halbautomatisch oder automatisch entstehen.
Menschliche Annotation ist oft genauer bei komplexer Bedeutung, Ironie, Mehrdeutigkeit und Kontext. Automatische Annotation ist schneller bei großen Datenmengen, macht aber Fehler. Besonders sinnvoll ist ein Vergleich: Du lässt ein Tool Vorschläge machen, prüfst sie fachlich und dokumentierst Fehlertypen. So lernst Du nicht nur etwas über den Text, sondern auch über Grenzen digitaler Methoden.
Visualisierung als Erkenntniswerkzeug
Visualisierung kann Daten verständlich machen: Wortwolken, Balkendiagramme, Zeitachsen, Karten, Netzwerke, Heatmaps oder Streudiagramme zeigen Muster auf einen Blick. Aber Visualisierungen können auch täuschen. Achsenskalierung, Farbauswahl, Datenlücken, Gruppierungen und Beschriftungen beeinflussen die Wahrnehmung.
In der Deutsch Analyse sollte jede Visualisierung eine klare Funktion haben. Sie soll eine Frage beantworten, einen Vergleich ermöglichen oder eine Hypothese sichtbar machen. Eine schöne Grafik ohne fachliche Deutung ist nicht ausreichend. Umgekehrt kann eine einfache Tabelle wissenschaftlich stärker sein als eine spektakuläre, aber unklare Darstellung.

Ethik, Bias und Verantwortung
Digital Humanities arbeiten oft mit kulturellem Erbe, persönlichen Dokumenten, historischen Minderheiten, kolonialen Archiven, sozialen Medien oder sensiblen Daten. Deshalb sind Ethik, Datenschutz, Urheberrecht, Lizenz, Bias und Transparenz zentrale Themen. Du musst fragen: Dürfen die Daten genutzt werden? Werden Menschen sichtbar gemacht, die geschützt werden müssen? Werden historische Machtverhältnisse unkritisch reproduziert? Sind Lücken im Archiv erkennbar? Welche Gruppen fehlen?
Auch KI verstärkt diese Fragen. Wenn ein Modell mit bestimmten Daten trainiert wurde, übernimmt es deren Muster. Das kann hilfreich sein, aber auch problematisch. Bei historischen Quellen kann zum Beispiel alte Rechtschreibung die Erkennung verschlechtern. Bei literarischen Texten kann Mehrdeutigkeit fälschlich vereindeutigt werden. Deshalb gehört zur KI-Kompetenz die Fähigkeit, Ergebnisse zu überprüfen, Fehler zu benennen und Grenzen offenzulegen.
Werkzeuge und Arbeitsablauf
Ein typischer DH-Arbeitsablauf beginnt mit einer Forschungsfrage und endet nicht mit einem Tool-Ergebnis, sondern mit einer reflektierten Interpretation. Dazwischen liegen mehrere Schritte: Quellen auswählen, Rechte klären, Daten erfassen, Metadaten erstellen, Daten bereinigen, Methode wählen, Analyse durchführen, Ergebnisse visualisieren, Ergebnisse interpretieren, Grenzen benennen und Materialien dokumentieren.
Mögliche Werkzeuge sind OCR-Programme, Tabellenkalkulation, Python, Jupyter Notebook, Voyant Tools, Gephi, Recogito, Transkribus, CATMA, Wikidata, Wikibase, TEI-Editoren, Git und Repositorien. Welche Werkzeuge geeignet sind, hängt von Frage, Daten, Kenntnisstand, Lizenz, Datenschutz und Zeit ab.
Mini-Fallstudie: Ein Gedichtkorpus digital untersuchen
Stell Dir vor, Du untersuchst Naturdarstellungen in deutschsprachigen Gedichten. Klassisch würdest Du einzelne Gedichte lesen und Motive wie Wald, Nacht, Fluss, Blume oder Jahreszeiten interpretieren. Digital könntest Du zusätzlich ein kleines Korpus aus Gedichten verschiedener Epochen erstellen. Danach würdest Du Texte bereinigen, Metadaten erfassen, Wortfelder definieren, Häufigkeiten vergleichen und auffällige Stellen wieder genau lesen.
Ein mögliches Ergebnis wäre: In einem Teilkorpus treten Naturbegriffe besonders häufig gemeinsam mit Gefühlswörtern auf, in einem anderen stärker mit Technik- oder Stadtbegriffen. Daraus folgt noch keine fertige Interpretation. Du müsstest prüfen, welche Gedichte den Befund tragen, welche Ausnahmen es gibt und ob die Auswahl des Korpus fair ist. Genau hier verbindet sich digitale Analyse mit literaturwissenschaftlicher Deutung.
Kompetenzen, die Du entwickelst
Nach diesem Kurs kannst Du erklären, was Digital Humanities sind, wie aus Quellen Daten werden, warum Metadaten wichtig sind, wie digitale Methoden die Deutsch Analyse erweitern und weshalb KI kritisch geprüft werden muss. Du kannst eine kleine Forschungsfrage formulieren, ein einfaches Korpus planen, Methoden passend auswählen, Ergebnisse interpretieren und Grenzen Deiner Analyse benennen.
Du lernst außerdem, digitale Ergebnisse sprachlich präzise darzustellen. Dazu gehört, nicht zu behaupten: „Die KI hat bewiesen, dass …“, sondern genauer zu formulieren: „Das Modell zeigt in diesem Korpus unter den gewählten Parametern ein Muster, das anschließend an Textstellen überprüft wurde.“ Diese Genauigkeit ist ein Kern wissenschaftlichen Arbeitens.
Interaktive Aufgaben
Quiz: Teste Dein Wissen
Was bezeichnet der Begriff Digital Humanities am treffendsten? (Ein interdisziplinäres Feld zwischen Geisteswissenschaften und digitalen Methoden) (!Ein reines Programmierfach ohne Bezug zu Kultur und Sprache) (!Eine Methode, bei der Texte nicht mehr gelesen werden) (!Ein ausschließlich technisches Verfahren zur Bildbearbeitung)
Welche Aussage beschreibt das Verhältnis von Close Reading und Distant Reading richtig? (Beide Zugänge können sich ergänzen) (!Close Reading wird durch Distant Reading vollständig ersetzt) (!Distant Reading ist nur für Naturwissenschaften geeignet) (!Close Reading verbietet digitale Werkzeuge)
Was ist ein Korpus in der digitalen Textanalyse? (Eine planvoll zusammengestellte Sammlung von Texten oder Materialien) (!Ein einzelnes zufällig ausgewähltes Wort) (!Eine Programmiersprache für Diagramme) (!Ein automatischer Beweis für literarische Bedeutung)
Welche Aufgabe erfüllt OCR? (OCR wandelt Bildscans von Schrift in durchsuchbaren Text um) (!OCR erstellt automatisch literarische Interpretationen) (!OCR löscht Metadaten aus Forschungsdaten) (!OCR ersetzt jede Quellenkritik)
Warum sind Metadaten wichtig? (Sie beschreiben Herkunft, Eigenschaften und Kontext von Daten) (!Sie machen jede Interpretation überflüssig) (!Sie verhindern grundsätzlich alle Fehler) (!Sie sind nur bei Musikdateien relevant)
Was meint Named Entity Recognition? (Die automatische Erkennung von Personen, Orten oder Organisationen in Texten) (!Die manuelle Bewertung der Schönheit eines Gedichts) (!Die zufällige Auswahl von Zitaten) (!Die Erstellung einer Druckausgabe ohne Kommentare)
Welche Aussage zu KI in den Digital Humanities ist richtig? (KI-Ergebnisse müssen fachlich geprüft und kontextualisiert werden) (!KI erzeugt immer fehlerfreie Forschungsergebnisse) (!KI darf nur ohne Quellen verwendet werden) (!KI ersetzt grundsätzlich alle geisteswissenschaftlichen Methoden)
Was bedeutet FAIR bei Forschungsdaten? (Auffindbar, zugänglich, interoperabel und wiederverwendbar) (!Fertig, autoritär, isoliert und risikolos) (!Formal, absolut, intern und roh) (!Fehlerfrei, anonym, intuitiv und repariert)
Wozu dient eine Visualisierung in der Deutsch Analyse? (Sie macht Muster sichtbar, die anschließend interpretiert werden müssen) (!Sie beweist automatisch die einzig richtige Deutung) (!Sie ersetzt die Textgrundlage) (!Sie ist nur Dekoration für Präsentationen)
Was ist bei der Arbeit mit historischen Quellen besonders wichtig? (Quellenkritik, Dokumentation und Bewusstsein für Datenlücken) (!Ausschließlich die modernste Software) (!Der Verzicht auf jede Interpretation) (!Die Entfernung aller Metadaten)
Memory
| OCR | Schriftbild zu Text |
| TEI | Strukturierte Textauszeichnung |
| Korpus | Geplante Textsammlung |
| Metadaten | Daten über Daten |
| Topic Modeling | Statistische Themenmuster |
| NER | Erkennung benannter Entitäten |
| Bias | Verzerrung in Daten oder Modellen |
| Visualisierung | Sichtbarmachung von Mustern |
Drag and Drop
| Ordne die richtigen Begriffe zu. | Thema |
|---|---|
| OCR | Scan in durchsuchbaren Text umwandeln |
| Tokenisierung | Text in Wörter und Satzzeichen zerlegen |
| Lemmatisierung | Wortformen auf Grundformen zurückführen |
| Named Entity Recognition | Personen, Orte und Organisationen erkennen |
| Netzwerkanalyse | Beziehungen zwischen Figuren modellieren |
| Visualisierung | Analyseergebnisse als Grafik darstellen |
Kreuzworträtsel
| Korpus | Wie nennt man eine planvoll zusammengestellte Sammlung von Texten? |
| Edition | Wie nennt man eine wissenschaftlich erschlossene Textausgabe? |
| Metadaten | Wie heißen Daten, die andere Daten beschreiben? |
| Python | Welche Programmiersprache wird häufig für Datenanalyse genutzt? |
| Bias | Wie nennt man eine systematische Verzerrung in Daten oder Modellen? |
| Netzwerk | Welches Modell stellt Beziehungen zwischen Knoten und Kanten dar? |
LearningApps
Lückentext
Offene Aufgaben
Leicht
- Begriffskarte Digital Humanities: Erstelle eine Begriffskarte mit zehn zentralen Begriffen aus diesem aiMOOC und erkläre jeden Begriff in einem eigenen Beispielsatz.
- Mini-Korpus sammeln: Wähle drei kurze Gedichte oder drei kurze Sachtexte aus und notiere Quelle, Autorin oder Autor, Jahr, Thema und Lizenzlage.
- Tool-Beobachtung: Nutze ein einfaches Textanalyse-Werkzeug und beschreibe, welche Wörter besonders häufig auftreten und welche Deutung dadurch möglich oder problematisch ist.
- KI kritisch prüfen: Bitte ein KI-System um eine kurze Inhaltsangabe zu einem literarischen Text und markiere anschließend mindestens fünf Stellen, die Du am Original überprüfen musst.
Standard
- Close Reading und Distant Reading verbinden: Formuliere zu einem Gedicht zuerst eine genaue Beobachtung an einer Textstelle und entwickle daraus eine digitale Untersuchungsfrage für ein kleines Korpus.
- Metadaten-Tabelle erstellen: Lege eine Tabelle für fünf Texte an und erfasse Titel, Autorin oder Autor, Erscheinungsjahr, Gattung, Quelle, Lizenz und Bearbeitungsschritte.
- Figurennetzwerk entwerfen: Erstelle zu einem Drama oder Roman ein Figurennetzwerk und erkläre, welche Beziehungen Du als Kanten modellierst.
- Bias-Fall untersuchen: Sammle Beispiele dafür, wie ein Korpus verzerrt sein kann, wenn bestimmte Autorinnen, Epochen, Regionen, Dialekte oder Textsorten fehlen.
Schwer
- Digitale Editionsprobe: Zeichne einen kurzen literarischen Textabschnitt mit einfachen TEI-ähnlichen Markierungen für Überschrift, Absatz, Sprecherrolle oder Versstruktur aus und reflektiere Deine Entscheidungen.
- Topic Modeling simulieren: Gruppiere Wörter aus zehn Texten manuell zu Themenfeldern und erkläre, warum solche Gruppen keine automatische Interpretation liefern.
- KI-Annotation vergleichen: Annotiere Personen, Orte und Organisationen in einem kurzen Text zuerst selbst, lasse danach ein KI-System Vorschläge machen und vergleiche Treffer, Fehler und Grenzfälle.
- Forschungsprojekt planen: Entwickle ein vollständiges Mini-Projekt mit Forschungsfrage, Korpus, Metadatenplan, Methode, erwarteter Visualisierung, ethischen Risiken und Kriterien für die Auswertung.

| <inputbox>
type=create break=no preload=CHAT GPT TEXT HIER EINFÜGEN default= width=30 placeholder= Dein MOOC Titel buttonlabel=MOOC erstellen </inputbox> |

Lernkontrolle
- Forschungsdesign begründen: Entwickle eine digitale Forschungsfrage zu einem literarischen oder sprachlichen Thema und begründe, warum die gewählte Methode zur Frage passt.
- Datenkritik anwenden: Erkläre an einem Beispiel, wie Auswahl, OCR-Fehler, fehlende Metadaten oder Lizenzprobleme das Ergebnis einer Analyse beeinflussen können.
- Visualisierung interpretieren: Beschreibe, wie Du eine Wortfrequenzgrafik, eine Karte oder ein Figurennetzwerk deuten würdest, ohne vorschnell Kausalitäten zu behaupten.
- KI-Ergebnis prüfen: Formuliere Kriterien, mit denen Du eine KI-generierte Analyse eines Gedichts oder einer Rede fachlich kontrollieren kannst.
- Transfer auf Unterricht: Plane eine Unterrichtssequenz, in der digitale Textanalyse und klassische Interpretation sinnvoll miteinander verbunden werden.
- Ethik reflektieren: Beurteile, welche Verantwortung Forschende tragen, wenn sie historische, persönliche oder kulturell sensible Daten digital veröffentlichen.
Lernnachweis
Für Deinen Lernnachweis solltest Du zeigen, dass Du nicht nur Fachbegriffe auswendig kennst, sondern einen digitalen Analyseprozess begründet planen, durchführen und reflektieren kannst.
- Themenverständnis: Du erklärst die Grundidee der Digital Humanities und ordnest sie zwischen Geisteswissenschaften, Informatik und Data Science ein.
- Forschungsfrage: Du formulierst eine klare Frage zur Deutsch Analyse, die mit digitalen und klassischen Methoden bearbeitet werden kann.
- Datenbasis: Du beschreibst Dein Korpus, Deine Quellen, Metadaten, Auswahlkriterien, Bearbeitungsschritte und Grenzen.
- Methodenwahl: Du begründest, warum Du eine Methode wie OCR, Korpuslinguistik, Topic Modeling, Named Entity Recognition, Netzwerkanalyse oder Visualisierung nutzt.
- Interpretation: Du verbindest digitale Ergebnisse mit konkreten Textstellen, Kontextwissen und fachlicher Deutung.
- Reflexion: Du benennst Fehlerquellen, Bias, ethische Fragen, Datenschutz, Urheberrecht und Grenzen von KI.
- Dokumentation: Du legst nachvollziehbar offen, welche Tools, Parameter, Datenversionen und Entscheidungen verwendet wurden.
OERs zum Thema
- Wikipedia: Digital Humanities
- Wikimedia Commons: Digital humanities
- Text Encoding Initiative
- FORCE11: FAIR Data Principles
- DARIAH-EU
- Lehre in den Digital Humanities
Links
aiMOOC-Projekte
Schulfach+


aiMOOCs



aiMOOC Projekte


THE MONKEY DANCE





{{#ev:youtube | https://youtu.be/rFhZlg38Zf8?si=9KdMNZYRkRD81YTo%7C 500 | center}}
|
{{#ev:youtube | https://youtu.be/Ob7etf9QuBo?si=t_NBA71bWg3Rq3LI%7C 500 | center}}
| <inputbox>
type=create break=no preload=MOOCit Vorlage default= width=30 placeholder= Dein MOOC Titel buttonlabel=MOOC erstellen </inputbox> |