LLM – Wie Maschinen lernen, menschliche Sprache zu verstehen

LLM Grundkonzepte

Viele Leute verstehen falsch, was Künstliche Intelligenz genau ist, wie sie funktioniert und was „die KI kann“. Aus dem Alltag vieler Menschen ist Chat GPT kaum noch wegzudenken. Aber wie funktioniert ChatGPT von OpenAI eigentlich? Einfach erklärt handelt es sich bei ChatGPT um ein Sprachmodell. Um ein LLM, Large Language Models, oder auf deutsch Sprachmodelle zu verstehen, fangen wir am besten kleinteilig an: Ein Algorithmus besteht aus spezifischen Regeln oder Anweisungen, die ausgeführt werden, um ein Problem zu lösen und ein Ergebnis zu erzielen. Ein Rezept zum Kochen ist ebenfalls ein Algorithmus, wobei die einzelnen Schritte eine Anweisung darstellen. Im Falle von Language Modes beziehen sich die Algorithmen auf Regeln der Sprache.

Neural Networks

Neuronale Netze (engl. Neural Networks) werden auf große Mengen an Textdaten trainiert, sodass Verantwortliche statistische Muster erkennen können. Man verwendet hierfür häufig vortrainierte Transformermodelle. GPT, “Generative Pretrained Transformer”, und BERT, “Bidirectional Encoder Representations from Transformers”, sind Beispiele für solche angelernten KI Sprachmodelle. Im Transfer Learning kann man diese an die spezifischen Anwendungsfälle anpassen.

Wie funktioniert ChatGpt?

Im Kontext des Textverständnisses können LLMs durch den Self Attention Mechanismus Worte im Kontext des umgebenden Satzes „verstanden“ werden. „Bank“ im Kontext „Park“ kann man z.B. anders verstanden als im Kontext „Geld“. Für die Sprachproduktion kann man mit so einem Modell die Wahrscheinlichkeit für das nächste Wort berechnen. Es wird jeweils das Wort ausgegeben, für das die höchste Folgewahrscheinlichkeit bestimmt wurde. Somit ist ChatGPT in der Lage, zu „lernen“ und menschliche Sprache zu imitieren, man kann aber nicht von einem ganzheitlichen Verständnis sprechen. Chatbots und virtuelle Assistenten sowie Übersetzungstools verwenden bereits Sprachmodelle.

Anwendung LLM

Die Anwendungsmöglichkeiten sind vielfältig: Kundenservice, Forschung und Content-Erstellung könnten beispielsweise von derartigen Language Models profitieren oder tun es bereits. Trotz der innovativen Möglichkeiten ist Verantwortungsbewusstsein wichtig sowie die ethischen Grenzen der Künstlichen Intelligenz zu berücksichtigen: Durch Falschinformationen ist es möglich, dass Vorurteile zu Unrecht entstehen und verbreitet werden. Künstliche Intelligenz erfordert zudem die Berücksichtigung datenschutzrechtlicher Aspekte, da die Frage besteht, ob durch das Training von Sprachmodellen Urherberrechte verletzt werden könnten.

Kommentar verfassen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Nach oben scrollen