Generativer vortrainierter Transformer

In der modernen künstlichen Intelligenz (KI) seit den 2020er Jahren ist ein sogenannter „generativer vortrainierter Transformer“ (englisch Generative pre-trained Transformer (GPT)) ein großes Sprachmodell (englisch Large Language Model (LLM)).

GPT-Modelle basieren auf künstlichen neuronalen Netzwerken (KNN) unter Anwendung generativer Modelle und von Transformer-Architektur, die auf großen Datensätzen unmarkierter Texte vorab trainiert werden und in der Lage sind, neue Inhalte zu generieren; sie werden oft allgemein als „GPTs“ bezeichnet. Das erste GPT-Modell (GPT-1) wurde 2018 vom US-amerikanischen Unternehmen OpenAI vorgestellt.

↑

[:0-1] ↑