Modello linguistico di grandi dimensioni: differenze tra le versioni

Da Wiki AI.
Nessun oggetto della modifica
Nessun oggetto della modifica
 
(5 versioni intermedie di 2 utenti non mostrate)
Riga 1: Riga 1:
Nome: [[Nome::Large Language Model]]
{{Template concetto
|NomeInglese=Large Language Model
|Sigla=LLM
}}
Classe di Modelli di Linguaggio emersi in seguito alla pubblicazione dell'architettura [[transformer]] nel 2017


Sigla: [[Sigla::LLM]]
[[File:Overview Dei LLM.png|miniatura|773x773px|Da "A Comprehensive Overview of Large Language Models" (2024)]]


__SHOWFACTBOX__
=== Links ===
 
[https://arxiv.org/html/2307.06435v9#:~:text=2.10%20Pre%2DTraining%20Objectives,-Report%20issue%20for&text=Full%20Language%20Modeling%3A%20An%20autoregressive,is%20shown%20in%20Figure%205. https://arxiv.org/html/2307.06435v9#:~:text=2.10%20Pre%2DTraining%20Objectives,-Report%20issue%20for&text=Full%20Language%20Modeling%3A%20An%20autoregressive,is%20shown%20in%20Figure%205.]
Classe di Modelli di Linguaggio emersi soprattutto in seguito alla pubblicazione dell'architettura [[transformer]] nel 2017, hanno operato una rivoluzione nel campo dell'NLP. In particolare:
 
* NLP era soprattutto NLU (understanding), e poca generazione
* La multi-modalità era poco presente
* La maggior parte dei modelli era basata su regole invece che su deep learning
 
Sono un evoluzione di RNN -> LSTM -> GRU, delle loro varianti bidirezionali e "stacked", delle architetture encoder-decoder basate su LSTM, e infine dell'uso dell'attention con LSTM.


=== Links ===
[https://www.youtube.com/watch?v=dFwF0cwFd-E Overview of Large Language Models (YouTube - Manish Gupta)]
[https://www.youtube.com/watch?v=dFwF0cwFd-E Overview of Large Language Models (YouTube - Manish Gupta)]


 
{{#seo:
[[Category:Modello]]
            |title=Large Language Model (LLM)
            |title_mode=append
            |keywords=modelli di linguaggio, LLM, NLP, Natural Language Processing, Transformer, deep learning, RNN, LSTM, GRU, encoder-decoder, attention
            |description=I Large Language Model (LLM) sono una classe di modelli di linguaggio basati su deep learning che hanno rivoluzionato il campo dell'NLP. A differenza dei modelli precedenti, gli LLM eccellono sia nella comprensione che nella generazione del linguaggio, supportano la multi-modalità e si basano su architetture come i Transformer.
           
            }}

Versione attuale delle 11:09, 10 set 2024

Modello linguistico di grandi dimensioni
Nome Inglese Large Language Model
Sigla LLM

Classe di Modelli di Linguaggio emersi in seguito alla pubblicazione dell'architettura transformer nel 2017

Da "A Comprehensive Overview of Large Language Models" (2024)

Links

https://arxiv.org/html/2307.06435v9#:~:text=2.10%20Pre%2DTraining%20Objectives,-Report%20issue%20for&text=Full%20Language%20Modeling%3A%20An%20autoregressive,is%20shown%20in%20Figure%205.

Overview of Large Language Models (YouTube - Manish Gupta)