Vai al contenuto

Transformer

Architecture de réseau neuronal qui a révolutionné l'AI, à la base de GPT, BERT, Claude et Gemini.

Le Transformer est une architecture introduite par Google en 2017 (article 'Attention is All You Need'). Il utilise un mécanisme de self-attention pour traiter des séquences en parallèle, dépassant les limites des RNN et LSTM. C'est la base de tous les LLM modernes et de nombreux modèles de vision.

Exemples pratiques

  • GPT (OpenAI)
  • BERT (Google)
  • Claude (Anthropic)
  • Vision Transformer (ViT)

Termes connexes