Einführung KI
So funktioniert ChatGPT & Co (6:04)
Fachbegriffe und Abkürzungen

- Artificial Intelligence (AI; dt. KI [künstliche Intelligenz])
AI steht für Artificial Intelligence, also künstliche Intelligenz. Das sind Programme, die Dinge tun, die normalerweise menschliches Denken erfordern – z. B. Probleme lösen oder Bilder erkennen.
- Machine Learning (ML)
Ein Teil von AI ist ML (Machine Learning), also maschinelles Lernen: Computer lernen dabei aus Beispielen, ohne dass man ihnen alles einzeln beibringen muss
- Deep Learning (DL)
DL heißt Deep Learning – das ist eine besondere Form des maschinellen Lernens mit sogenannten neuronalen Netzwerken, die sehr gut z. B. bei Spracherkennung oder Bildern funktionieren.
- Natural Language Processing (NLP)
NLP bedeutet Natural Language Processing – hier geht es darum, dass Computer menschliche Sprache verstehen und verarbeiten können, wie z. B. bei Übersetzungen oder Chatbots
- Large Language Models (LLM)
LLM steht für Large Language Model – das sind sehr große Sprachmodelle, wie z. B. ChatGPT, die viele Texte gelesen haben und deshalb gut auf Fragen antworten oder Texte schreiben können.
Browserbasierte Large Learning Models (LLMs)
Sprachmodell | Firma |
---|---|
ChatGPT | OpenAI (USA, 2015) |
Claude | Anthropic (USA, 2021) |
Gemini (früher Bard) | Google DeepMind |
Grok | xAI (Elon Mask, 2023) |
LLaMA | Meta (USA, 2004) |
Bing | Microsoft (USA, 1975) |
DeepSeek | deepseek (China, 2023) |
... |
Keywörter
- Prompt Engineering
Prompt Engineering ist die Kunst und Technik, wie man eine Eingabe (also einen „Prompt“) so formuliert, dass eine Künstliche Intelligenz – wie ChatGPT oder ein Bildgenerator – möglichst gute und präzise Ergebnisse liefert.
- Prompt
Ein Prompt ist eine Eingabe oder Anweisung, die man einer KI wie ChatGPT gibt. Das kann ein Satz, eine Frage oder eine Beschreibung sein. Die KI benutzt diesen Prompt, um zu antworten oder etwas zu erstellen.
- Token
Ein Token ist ein kleines Stück eines Textes – zum Beispiel ein Wort oder sogar nur ein Teil davon. KI-Modelle wie GPT verarbeiten Texte in Tokens, nicht als ganze Sätze.
- GPT
GPT steht für „Generative Pre-trained Transformer“. Das ist eine Art von KI-Modell, das Sprache versteht und Texte erzeugen kann. Es wurde mit vielen Texten trainiert, um darauf zu lernen, wie Menschen schreiben und sprechen. ChatGPT basiert auf dieser Technik.
- DeepResearch
Deep Research bedeutet, dass man sich sehr genau und tief mit einem Thema beschäftigt. Man sucht viele verschiedene Informationen, vergleicht sie, prüft, ob sie stimmen, und versucht, das Thema wirklich zu verstehen – nicht nur oberflächlich.
GPT (Generated Pretrained Transformer)
Aspekt | Beschreibung |
---|---|
Begriff | Generative Pretrained Transformer – ein KI-Modell, das auf dem Transformer-Architekturprinzip basiert und darauf trainiert ist, Sprache zu erzeugen. |
Herkunft | Entwickelt von OpenAI, erste Veröffentlichung war GPT-1 im Jahr 2018. |
Modellgenerationen | - GPT-1 (2018) - GPT-2 (2019) - GPT-3 (2020) - GPT-3.5 (2022) - GPT-4 (2023) |
Grundprinzip | - Generativ (es erzeugt Inhalte) - Pretrained (es wurde vortrainiert auf großen Datenmengen) - Transformer (neuronale Netzarchitektur) |
Trainingsdaten | Große Mengen an Text aus dem Internet (z. B. Bücher, Artikel, Webseiten, Foren, Code), aber keine persönlichen Daten einzelner Personen (über 45 Terabyte Text, 45 mit 12 Nullen) |
Trainingsmethode | 1. Unsupervised Pretraining: Vorhersage des nächsten Tokens im Text 2. Supervised Fine-Tuning 3. Reinforcement Learning (RLHF) |
ChatGPT 4.0
GPT-4.0 (auch als GPT-4 bezeichnet) ist ein großes multimodales Sprachmodell von OpenAI, das im März 2023 veröffentlicht wurde. Es ist ein computerbasiertes Programm, das in der Lage ist, auf natürliche Art und Weise mit Menschen zu kommunizieren und ihnen Antworten auf Fragen oder Aufgaben zu geben. Es nutzt künstliche Intelligenz und maschinelles Lernen, um seine Fähigkeiten zu verbessern und immer präzisere Antworten zu liefern.
Datenbasis
GPT-4 wurde mit einer großen Menge an öffentlich zugänglichen Daten und von OpenAI lizenzierten Daten trainiert, darunter:
-
Bücher, Webseiten, wissenschaftliche Artikel
-
Code-Repositories (z. B. GitHub)
-
Forenbeiträge, Nachrichtenartikel, Anleitungen
-
Keine spezifischen Daten nach September 2021 (in der Ursprungsvariante) – neuere Varianten wie GPT-4o sind bis Mitte 2023 oder später aktualisiert.
Tools
- Bilderstellung
- Internetsuche
- Programmierung von Code
- Texterfassung
- DeepResearch
Stärken und Vorteile
- Eingabesprache Englisch: Wurde umfangreich in Englisch trainiert, andere Sprachen verfügen über weniger Training.
-
Hohe Sprachkompetenz: Sehr präzise Grammatik, Stilistik, Argumentation
-
Besseres logisches Denken: Deutlich besser als GPT-3.5 bei Mathe, Logik, Programmierung
-
Multilinguale Fähigkeiten: Exzellente Leistung in vielen Sprachen (z. B. Deutsch, Französisch, Spanisch)
-
Verständnis komplexer Aufgabenstellungen: GPT-4 kann längere Texte analysieren und strukturierte Aufgaben verarbeiten
-
Multimodalität: In der GPT-4-Vision-Variante auch Bildverstehen (Diagramme, Fotos etc.)
Schwächen und Nachteile
- Halluzinationen: Gibt manchmal plausible, aber falsche Informationen
- Mathematische Genauigkeit: Rechenfehler möglich, besonders bei komplexeren Aufgaben
- Erklärbarkeit: Die Entscheidungsprozesse sind nicht transparent (Blackbox)
- Aktualität: Kein Echtzeit-Wissen, Trainingsdaten sind statisch
- Vorteile: Kann gesellschaftliche Vorurteile aus Trainingsdaten widerspiegeln
- Langfristiger Kontext: Hat zwar ein längeres Gedächtnis (Token), aber kein dauerhaftes Gedächtnis
- Quellen und Bezüge: Werden nur auf Nachfrage geliefert und sind manchmal falsch.
- Datenschutz:
Warum macht ChatGPT Fehler?
- die riesige Datenmenge für das Training von ChatGPT ist begrenzt (nicht allwissend)
- Das Training basiert grundlegend auf englischen Wörtern (andere Sprachen wurden erst später hinzugefügt)
- das Modell formt die Antworten nach der Wahrscheinlichkeit (Platzierung im Satz, Kontext)
- der Bot will immer eine Antwort geben, auch wenn er kein Wissen dazu hat (Halluzinationen)
- die erlernte Datenbasis ist nicht aktuell (Aktualität)
💡 Tipps zum Faktencheck
- Fordere ChatGPT auf, einen Faktencheck zu machen.
- Widerspreche ChatGPT und lass ein Überdenken zu.
- Zeige dir von ChatGPT Quellen oder Studien an.
- Lass ChatGPT Fragen zu einem Thema stellen und gib Antwort darauf.
- ...
Quellen:
Erstelle deine eigene Website mit Webador