Technische Grundlagen
Für die Erarbeitung einer KI-Grundkompetenz ist der Überblick über die technischen Grundlagen von zentraler Bedeutung.
Große Sprachmodelle (Large Language Models, LLMs) sind KI-Systeme, die trainiert werden, Wahrscheinlichkeiten für Wortfolgen vorherzusagen. Dabei verarbeiten sie umfangreiche Textmengen, erkennen Muster in Sprache und generieren eigenständig neue synthetische Daten (Texte, Bilder, Videos u. a.), die in ihren Eigenschaften den Originaldaten ähneln, auf die das jeweilige KI-Modell trainiert wurde. Ein grundsätzlicher Unterschied besteht zwischen sogenannten ‚offenen‘ Open-Source-Modellen, die frei zugänglich und damit auch einsehbar und veränderbar sind, und geschlossenen proprietäre Modellen, die einem bestimmten Unternehmen gehören und unter spezifischen Bedingungen zu verwenden und kontrolliert sind.
Für die Literaturwissenschaft sind LLMs besonders spannend: Einerseits sind sie Werkzeuge für quantitative Textanalysen – etwa beim Auffinden von Motiven, Schlagworten, intertextuellen Bezügen oder stilistischen Eigenheiten in großen Korpora. Andererseits lassen sich mit ihnen neue (auch literarische) Texte generieren, darunter die so genannte ‘generative’ Literatur. KI-generierte Texte können damit zum Forschungsgegenstand der Literaturwissenschaft werden und werfen neue Fragen auf: Was bedeutet „Autorschaft“, wenn ein Modell Texte generiert? Welche Rolle spielt Kreativität, wenn sie auch von Maschinen simuliert werden kann? Wie gehen wir mit Begriffen wie “Originalität” und “Urheberschaft” um?
- Schnelle Hilfestellungen: liefert unkompliziert Definitionen, Beispiele oder Zusammenfassungen.
- Strukturvorschläge: unterstützt beim Erstellen von Gliederungen, Argumentationsschemata oder didaktischen Materialien.
- Vergleichendes Arbeiten: kann thematische, stilistische oder theoretische Bezüge zwischen hochgeladenen Texten vorschlagen.
- Übungswerkzeug: hilfreich für Sprachtraining, Schreibübungen oder erste Ideensammlungen.
- Sprachliche Variation: Texte in unterschiedlichen Registern, Längen und Stilen generieren.
- Zuverlässige Quellenarbeit: bibliografische Angaben, Zitate oder Seitenzahlen sind oft fehlerhaft oder erfunden.
- Interpretatorische Tiefe / Ambiguität: Mehrdeutigkeit, Ironie und historische Kontexte werden häufig vereinfacht oder bleiben unberücksichtigt,
- Wissenschaftliche Gewichtung: Ein Sprachmodell entscheidet nicht, welche Theorien oder Ansätze gerade angebracht, relevant und dem Thema angemessen sind,
- Sorgfältige Literaturrecherche: gerade im Bereich Literaturwissenschaft fehlt der Zugriff auf neueste (allen voran nicht Open Access veröffentlichter) Forschung
- Nachhaltigkeit proprietärer Modelle: Das Training erfordert immense Rechenressourcen, was zu einem hohen Energieverbrauch führt. Gleichzeitig liegen die technischen Details oft bei wenigen globalen Konzernen, was nachhaltige Alternativen erschwert.
- Monopolisierung und Abhängigkeit: Da wenige Tech-Unternehmen die Entwicklung dominieren, entsteht eine strukturelle Abhängigkeit von ihren Ressourcen, Schnittstellen und Geschäftsmodellen.
- Intransparenz der Trainingskorpora: Meist ist unklar, aus welchen Textsammlungen die Modelle gelernt haben. Für die Literaturwissenschaft bedeutet dies, dass nicht nachvollzogen werden kann, welche kulturellen, sprachlichen oder historischen Kontexte in den Modellen repräsentiert sind – und welche fehlen.
- Urheberrechtliche Fragen: Viele Trainingsdaten stammen aus urheberrechtlich geschützten Quellen. Das wirft Fragen nach dem Schutz geistigen Eigentums, nach der Anerkennung von Autor:innen und nach möglichen Formen fairer Vergütung auf.
- Datenbias: Sprachmodelle können Vorurteile und stereotype Darstellungen aus ihren Trainingsdaten übernehmen. Dadurch können Diskriminierungen verstärkt, Kanonisierungsprozesse verfestigt und bestimmte Perspektiven ausgeblendet werden.
- Prekäre Arbeitsbedingungen: Damit LLMs funktionieren, werden Daten von Menschen annotiert und problematische Inhalte gefiltert. Diese Arbeit leisten oft Clickworker:innen unter prekären Bedingungen, mit geringer Bezahlung und hoher psychischer Belastung.
