ChatGPT: Eine Einführung§
ChatGPT, GPT-3, GPT-4, OpenAI, Bing AI: Diese Begriffe geistern nun seit ein paar Monaten durch die Medien. In diesem Zusammenhang wird oft von einer Revolution im Zusammenhang mit künstlicher Intelligenz gesprochen - der Hype ist also in vollem Gange.
Dieser Beitrag soll einen kurzen Einblick in die sich ergebende Thematik geben und ein paar wichtige Aspekte ansprechen. Außerdem soll er Hemmungen abbauen und somit helfen, die aktuellen Entwicklungen besser einschätzen und nutzen zu können. Der Beitrag erhebt dabei keinen Anspruch auf Vollständigkeit. Bei weiterem Informationsbedarf oder -wunsch: Bitte melden! Derartige Themen bieten sich auch für einen kleinen Workshop an.
Was ist ChatGPT?§
ChatGPT ist ein Chatbot, eine Art textbasiertes Dialogsystem. Im Kern ist es ein komplexes Sprachmodell (GPT - Generative Pretrained Transformer), welches auf maschinellem Lernen beruht. Generiert wurde es in erster Linie aus einer umfangreichen Sammlung im Internet verfügbarer Textdaten als Trainingsgrundlage.
Das System kann auf Textanfragen reagieren und natürlichsprachliche Antworten generieren. Es kann Fragen beantworten, sich über verschiedene Themen unterhalten und kreative Schreibstücke erzeugen. Auch wenn der derzeit erzeugte Hype vielleicht etwas zu viel des Guten ist, so können sich GPT-basierte Systeme (und zeitnah vergleichbare Angebote) doch als sehr nützlich erweisen und beispielsweise den Forschendenalltag an einzelnen Punkten erleichtern.
Welche Anwendungsmöglichkeiten hat ChatGPT?§
Generell ist ChatGPT ein System, um einen Sprachdialog zu führen. Es verwendet also sein Sprachmodell, um Antworten auf konkrete Nutzeranfragen zu formulieren. Dabei beantwortet es Fragen von Nutzenden oder führt auch auch Anweisungen aus. ChatGPT beherrscht dabei nicht nur die englische Sprache, sondern kann in einer Vielzahl von Sprachen genutzt werden. Da das Modell auf Texten aus dem Internet trainiert wurde, beherrscht es Sprachen insbesondere dann gut, wenn diese in großem Umfang im Netz Verwendung finden, was beispielsweise auf Deutsch zutrifft.
ChatGPT beherrscht "natürlich" das Beantworten von Wissensfragen. Spannend wird es aber erst, wenn es komplexe Sachverhalte darstellen oder interpretieren bzw. auch darüber hinaus kreativ tätig werden soll. Dabei kann sich das System auf seine interne Wissensbasis beziehen, also auf die beim Trainieren des Modells verarbeiteten Texte. Allerdings kann man ChatGPT auch weitere Dokumente/Texte einbeziehen lassen, z.B. durch Linkangabe zu einem oder mehreren PDFs oder HTML-Dokumenten.
ChatGPT ist dann in der Lage:
- Texte zu analysieren, zu interpretieren, zu kommentieren oder zu annotieren
- Texte zu übersetzen, zu paraphrasieren oder zusammenzufassen
- Texte zu generieren, die einem bestimmten Stil, Genre, Typ oder Thema entsprechen (wie E-Mails, Blog-Beiträge, Social Media-Beiträge, wissenschaftliche Abhandlungen, Gedichte)
- Texte zu bewerten, zu vergleichen oder zu kritisieren
Die Möglichkeiten sind also umfangreich und bieten durchaus Potential im Arbeitsalltag nützlich sein zu können, insofern die Qualität der Ergebnisse angemessen ist und auf die dargelegten Fakten Verlass ist (dazu gleich mehr).
ChatGPT/Bing AI selbst meint (auf unsere Frage hin!), bei wissenschaftlichen Tätigkeiten unter anderem auf folgende Weisen behilflich sein zu können:
- Entwicklung der Forschungsfrage: ChatGPT kann dabei helfen, eine klare und relevante Forschungsfrage zu formulieren, indem er Vorschläge macht oder Fragen stellt, die das Thema eingrenzen und präzisieren.
- Erstellung der Gliederung: ChatGPT kann einen ersten Entwurf für die Gliederung einer wissenschaftlichen Arbeit erstellen, indem er die wichtigsten Abschnitte und Unterabschnitte vorschlägt, die zu der gewählten Forschungsfrage passen.
- Generierung von Literaturideen: ChatGPT kann bei der Suche nach geeigneter Literatur helfen, indem er Quellen vorschlägt, die zu dem Thema relevant sind. Er kann auch Zusammenfassungen oder Zitate aus den Quellen liefern, die als Anhaltspunkte für die weitere Recherche dienen können.
- Analyse von historischen Daten: ChatGPT kann bei der Analyse von historischen Daten helfen, indem er Muster oder Trends erkennt, Hypothesen aufstellt oder testet, oder Vergleiche oder Zusammenhänge zwischen verschiedenen Datenquellen herstellt.
- Erstellung von historischen Narrativen: ChatGPT kann dabei helfen, historische Ereignisse oder Persönlichkeiten in einem ansprechenden und verständlichen Stil zu beschreiben, indem er Fakten mit Interpretationen verbindet und verschiedene Perspektiven berücksichtigt.
Diese Angaben des Systems über sich möchten wir so im Raum stehen lassen und es der Experimentierfreude der Anwendenden überlassen, hier die Grenzen des Systems auszutesten. Ein paar exemplarische Beispiele für die Nutzung der Systeme werden am Ende des Beitrags dennoch gegeben.
Wie offen ist ChatGPT?§
Entwickelt von OpenAI war ChatGPT zunächst ein vergleichsweise offenes System. Dies hatte Vorteile bezüglich der Transparenz des Systems an sich und seiner Ergebnisse. Besonders im Falle wissenschaftlicher Anwendung kann dies von großem Vorteil sein.
Leider hat sich diese Offenheit mittlerweile ins Gegenteil verkehrt - unter anderem durch Investitionen in Milliardenhöhe durch Microsoft und Elon Musk. OpenAI arbeitet nun in erster Linie gewinnorientiert und hält beispielsweise die neueste Fassung des Modells (GPT-4) sowie einige Informationen über dessen Generierung unter Verschluss. Und auch die Anwendung der Systeme ist nicht mehr in jedem Fall kostenlos. So verschwindet ChatGPT - je nach Anbieter und Produkt - teilweise hinter Bezahlschranken. Dank Microsofts Bestreben, Google im Suchmaschinen- und Browserwettstreit Marktanteile abzuringen, eröffnen sich jedoch aktuell weiterhin ausreichende kostenfreie Möglichkeiten.
Wie steht es um die Qualität und Korrektheit der Ergebnisse?§
Angesichts der Ergebnisse, die derartige Chatbots noch vor wenigen Monaten lieferten, sind die aktuellen Systeme absolut beeindruckend. Dennoch schwankt die Qualität der Ergebnisse stark, je nach gestellter Aufgabenart oder der Komplexität der Aufgabe.
Nicht nur die generelle Qualität, auch die (inhaltliche) Korrektheit der Ergebnisse ist in der Regel zumindest überraschend gut. Jedoch kann es selbst bei einfachen Wissensfragen Ausreißer nach unten geben. Blind sollte man sich auf die automatisch erzeugten Ergebnisse nie verlassen. Teilweise ermöglichen die Anbieter auch eine Konfiguration ihrer Systeme, um beispielsweise die Kreativität oder aber die Korrektheit der Ergebnisse zu präferieren, so auch Bing AI (siehe "Wo kann ich ChatGPT nutzen?"). Eine hohe Korrektheit wird beispielsweise durch Beschränkung auf vergleichsweise vertrauenswürdige Quellen erreicht.
Insgesamt gilt: Am besten ist es, sich für die eigenen möglichen Anwendungsfälle selbst ein Bild der Lage zu machen. Derzeit ist durch große Finanzspritzen in OpenAI oder die Aktivitäten von Wettbewerbern wie Google noch viel Bewegung im Feld, so dass es in jedem Fall lohnt, die Lage weiter zu beobachten - auch wenn die Systeme derzeit vielleicht noch nicht alles, was für Sie von Interesse sein kann, zufriedenstellend erledigen.
Wie steht es um meine Privatsphäre und wie sehen die Nutzungsbedingungen aus?§
Sowohl OpenAI als auch Microsoft nehmen sich das Recht heraus, Nutzungsdaten zur Verbesserung des Dienstes und zu dessen Personalisierung zu nutzen. Dazu werden die Anfragen und Antworten auch mit eventuell vorhandenen weiteren persönlichen Daten zusammengeführt. Microsoft schließt eine Weitergabe an Dritte aus. OpenAI tut dies nicht.
Monetarisierungsabsichten stehen hier kundenfreundlicheren Nutzungsbedingungen leider im Wege. Sollte dies ein Problem darstellen, können unter Umständen auch selbst gehostete Dienste eine Lösung sein.
Wo kann ich ChatGPT (oder ähnliche Systeme) aktuell nutzen?§
Webbasierte Dienste§
ChatGPT bei OpenAI§
- Link
- Account wird benötigt, kann kostenlos erstellt werden
- Begrenzte freie/kostenlose Nutzung
- Kostenpflichtige "unbegrenzte" Nutzung
Bing AI§
- Bing App: Android, IOS
- Edge Browser: Linux, Windows, Mac
- kostenlos
- Neuestes GPT-Modell (mit Anpassungen)
- Aktuell vermutlich die einfachste Art ein aktuelles System zu testen
- Vorteil: Liefert zu den Antworten (wenn möglich) auch Quellenangaben mit
- Vorteil: Konfigurierbar bezüglich kreativer oder eher faktennaher Arbeitsweise
Einschätzung:
- Häufig passende, manchmal beeindruckende Resultate für beide Systeme
- Überzeugende Ergebnisse in vielen Anwendungsfeldern wie Zusammenfassungen, Beantworten von Fragen, Kreativität, ...
- Gute Resultate für alle "großen" Sprachen inklusive Deutsch
Google Bard§
- Link
- Googles Antwort auf die GPT-Systeme
- derzeit noch im geschlossenen Beta-Test und nicht frei zugänglich
Eigenes Hosting§
Alternativ gibt es für Fortgeschrittene und Bastler auch Systeme zum selber Hosten. Derzeit sind die Ergebnisse aber noch ernüchternd:
Dalai, Llama, Alpaka§
- Link
- Alpaca-Modell basiert auf Metas (Facebook-Firma) Llama-Modell
- Modifiziert mit Frage-Antwort-Paaren aus GPT-3
- Dalai erleichtert das Setup des Systems
- Verschiedene Modellgrößen (derzeit für 4GB oder 8GB Speicher) vorhanden
- Docker-compose-Images vorhanden
Einschätzung
- Derzeit (04/23) durchwachsene Ergebnisse (4GB-Modell)
- Noch ausreichend gut in Anwendungsfeldern wie Zusammenfassungen und Fragen beantworten, aber nicht sehr konstant
- Schlechtere Ergebnisse bei kreativeren Aufgaben
- Zufriedenstellende Ergebnisse nur für die englische Sprache
Nutzungsbeispiele§
Es folgen ein paar exemplarische Beispiele, in denen GPT beweisen durfte, was es drauf hat. Alle Beispiele wurden unter Verwendung von Bing AI, basierend auf GPT-4, im Microsoft Edge-Browser erstellt und können als Anregung dienen, einmal selbst zu experimentieren.
Literaturvorschläge zum Thema DH: Die Ergebnisse werden mit Quellenangaben unterlegt. Die Auswahl von Standardwerken gelingt dem System gut.
Wissensfrage zum Thema Geometrie: Auch die Anwendung von Wissen auf spezifische Fragestellungen gelingt meist gut.
Übersicht zur Geschichte der DH: Gelerntes in verschiedenen Textformen wiedergeben und beispielsweise als Übersicht zusammenstellen, führt oft zu durchaus zufriedenstellenden Ergebnissen. Die Resultate können sich zwischen mehreren identischen Anfragen teils stärker unterscheiden, mitunter werden andere Aspekte als zentral eingestuft.
Gedicht über DH: Eine Einschätzung der Qualität liegt uns fern.
Gliederung zu vorgegebenen Texten: Texte zu gliedern ist eine der Aufgaben, die das System nach Eigenangabe beherrscht. Häufig, aber nicht immer, sind die Ergebnisse sinnvoll und nachvollziehbar.
Zusammenfassen eines vorgegebenen Dokuments: Derartige Aufgaben gelingen dem System in der Regel gut. Es ist auch möglich, mehr als ein Dokument als Eingabe für solche und andere Aufgaben anzugeben.
Verfassen einer E-Mail: Vorlagen für zu versendende E-Mails werden meist stilsicher formuliert und sogar um typische Inhalte ergänzt, die nicht im Beschreibungstext vorkommen (wie in unserem Beispiel).