Modello linguistico di grandi dimensioni: differenze tra le versioni

Versione attuale delle 11:09, 10 set 2024

Modello linguistico di grandi dimensioni
Nome Inglese	Large Language Model
Sigla	LLM

Classe di Modelli di Linguaggio emersi in seguito alla pubblicazione dell'architettura transformer nel 2017

Links

https://arxiv.org/html/2307.06435v9#:~:text=2.10%20Pre%2DTraining%20Objectives,-Report%20issue%20for&text=Full%20Language%20Modeling%3A%20An%20autoregressive,is%20shown%20in%20Figure%205.

Overview of Large Language Models (YouTube - Manish Gupta)

@@ Riga 1: / Riga 1: @@
-Nome: [[Nome::Large Language Model]]
+{{Template concetto
+|NomeInglese=Large Language Model
+|Sigla=LLM
+}}
+Classe di Modelli di Linguaggio emersi in seguito alla pubblicazione dell'architettura [[transformer]] nel 2017
-Sigla: [[Sigla::LLM]]
+[[File:Overview Dei LLM.png|miniatura|773x773px|Da "A Comprehensive Overview of Large Language Models" (2024)]]
-__SHOWFACTBOX__
+=== Links ===
+[https://arxiv.org/html/2307.06435v9#:~:text=2.10%20Pre%2DTraining%20Objectives,-Report%20issue%20for&text=Full%20Language%20Modeling%3A%20An%20autoregressive,is%20shown%20in%20Figure%205. https://arxiv.org/html/2307.06435v9#:~:text=2.10%20Pre%2DTraining%20Objectives,-Report%20issue%20for&text=Full%20Language%20Modeling%3A%20An%20autoregressive,is%20shown%20in%20Figure%205.]
-Classe di Modelli di Linguaggio emersi soprattutto in seguito alla pubblicazione dell'architettura [[transformer]] nel 2017, hanno operato una rivoluzione nel campo dell'NLP. In particolare:
-* NLP era soprattutto NLU (understanding), e poca generazione
-* La multi-modalità era poco presente
-* La maggior parte dei modelli era basata su regole invece che su deep learning
-Sono un evoluzione di RNN -> LSTM -> GRU, delle loro varianti bidirezionali e "stacked", delle architetture encoder-decoder basate su LSTM, e infine dell'uso dell'attention con LSTM.
-=== Links ===
 [https://www.youtube.com/watch?v=dFwF0cwFd-E Overview of Large Language Models (YouTube - Manish Gupta)]
+{{#seo:
-[[Category:Modello]]
+            |title=Large Language Model (LLM)
+            |title_mode=append
+            |keywords=modelli di linguaggio, LLM, NLP, Natural Language Processing, Transformer, deep learning, RNN, LSTM, GRU, encoder-decoder, attention
+            |description=I Large Language Model (LLM) sono una classe di modelli di linguaggio basati su deep learning che hanno rivoluzionato il campo dell'NLP. A differenza dei modelli precedenti, gli LLM eccellono sia nella comprensione che nella generazione del linguaggio, supportano la multi-modalità e si basano su architetture come i Transformer.
+            }}