Transformer
Transformer é uma arquitetura de rede neural baseada em mecanismos de atenção, projetada para processar sequências de dados em paralelo. É a base de modelos como BERT e GPT.
Exemplo: O ChatGPT é baseado em um modelo Transformer treinado em larga escala.