Modello linguistico di grandi dimensioni: differenze tra le versioni

Da Wiki AI.
Nessun oggetto della modifica
Nessun oggetto della modifica
Riga 1: Riga 1:
Nome: [[Nome::Large Language Model (LLM)]]
Sigla: [[Sigla::LLM]]
__SHOWFACTBOX__
Classe di Modelli di Linguaggio emersi soprattutto in seguito alla pubblicazione dell'architettura [[transformer]] nel 2017, hanno operato una rivoluzione nel campo dell'NLP. In particolare:
Classe di Modelli di Linguaggio emersi soprattutto in seguito alla pubblicazione dell'architettura [[transformer]] nel 2017, hanno operato una rivoluzione nel campo dell'NLP. In particolare:



Versione delle 09:39, 10 apr 2024

Nome: Large Language Model (LLM)

Sigla: LLM


Classe di Modelli di Linguaggio emersi soprattutto in seguito alla pubblicazione dell'architettura transformer nel 2017, hanno operato una rivoluzione nel campo dell'NLP. In particolare:

  • NLP era soprattutto NLU (understanding), e poca generazione
  • La multi-modalità era poco presente
  • La maggior parte dei modelli era basata su regole invece che su deep learning

Sono un evoluzione di RNN -> LSTM -> GRU, delle loro varianti bidirezionali e "stacked", delle architetture encoder-decoder basate su LSTM, e infine dell'uso dell'attention con LSTM.

Links

Overview of Large Language Models (YouTube - Manish Gupta)