2024-04-10T13:40:56Z

Michela:

2024-04-10T10:13:22Z

Michela:

Michela: /* Links */

Rilasciato nel 2019, dataset per benchmanrking dei modelli di [[Relation Extraction (RE)]].
Annota [[Entità]] e [[Relazioni]] a livello di documento - per estrarle è necessario che l'algoritmo consideri più di una frase alla volta.

Le entità nelle relazioni A->B vengono normalmente rappresentate come:
* head (entità A)
* tail (entità B)

=== Esempio ===

[[File:DocRED.png]]

=== Links ===
* [https://aclanthology.org/P19-1074/ DocRED: A Large-Scale Document-Level Relation Extraction Dataset]
* [https://paperswithcode.com/sota/relation-extraction-on-docred Leaderboard su Paperswithcode]
* [https://github.com/thunlp/DocRED Repo Github]

[[Category:Benchmark]]

Dropout (Reti Neurali)

2024-03-15T10:06:52Z

Michela:

Il dropout è una tecnica di [[regolarizzazione]] utilizzata per prevenire l'[[overfitting]] nelle reti neurali. L'overfitting si verifica quando una rete neurale impara troppo bene i dati di addestramento, a scapito delle sue prestazioni su nuovi dati non visti.

Durante l'addestramento di una rete neurale con dropout, ad ogni iterazione (cioè, ad ogni passo dell'algoritmo di addestramento), un sottoinsieme casuale di neuroni (insieme ai loro collegamenti) viene "ignorato" o escluso dal processo di addestramento.

# '''Durante il [[forward pass]]''': Per ogni esempio di addestramento, alcuni neuroni non contribuiscono alla propagazione dell'input attraverso la rete. La loro attivazione è impostata a zero, come se temporaneamente "spenti". La frazione dei neuroni da disattivare è determinata dal '''tasso di dropout''', un [[iperparametro]]. Tipicamente, questo tasso si aggira tra il 20% e il 50%.
# '''Durante il [[backward pass]]''': Poiché i neuroni sono stati "spenti" durante il forward pass, anche la loro partecipazione nell'aggiornamento dei pesi (attraverso la [[retropropagazione dell'errore]]) è esclusa. In altre parole, i pesi dei neuroni disattivati rimangono inalterati in quell'iterazione dell'addestramento.

Il risultato di questo processo è che la rete impara a diventare meno dipendente da specifici neuroni o percorsi di neuroni, poiché questi possono essere disattivati in qualsiasi momento durante l'addestramento. Ciò aiuta a distribuire più uniformemente l'"importanza" tra i neuroni della rete, forzando la rete a trovare più percorsi per trasmettere l'informazione dall'input all'output. Di conseguenza, la rete diventa più robusta e migliora la sua '''capacità di generalizzare''' su dati non visti, riducendo il rischio di overfitting.

Al termine dell'addestramento, durante l'utilizzo della rete neurale per fare previsioni (cioè, in fase di test), tutti i neuroni sono attivi, e nessuno viene escluso.

[[Category:Concetto]]
[[Category:Reti Neurali]]

Generative Pretrained Transformer (GPT)

2024-03-15T10:04:25Z

Michela: /* Links */

* Rilasciato da: OpenAI
* Data: 14 marzo 2023
* Accesso: solo attraverso OpenAI
* Dati di allenamento: 1,76 trilioni di parametri
* Velocità: 100 miliardi di token al secondo

ChatGPT-4 è la quarta iterazione del modello di linguaggio generativo sviluppato da OpenAI, costruito sulla base della serie di modelli [[GPT (Generative Pre-trained Transformer)]]. Introdotto dopo il successo di [[GPT-3.5 Turbo]], ChatGPT-4 presenta una serie di miglioramenti significativi sia in termini di capacità di comprensione e generazione del testo che di applicazioni pratiche.
ChatGPT-4 possiede una conoscenza aggiornata, ovvero, è addestrato su un corpus di dati che include '''informazioni fino all'inizio del 2023'''. Inoltre, Il modello mostra avanzamenti significativi nella comprensione del contesto, permettendo conversazioni '''più fluide e risposte più accurate''' a domande complesse con miglioramenti nella coerenza, logica e fluidità, grazie anche alla sua capacità di interpretare e rispondere a '''sfumature del linguaggio'''. Inoltre, si tratta di un modello di linguaggio '''multimodale''', ossia che riesce ad elaborare sia informazioni testuali che informazioni provenienti da immagini. In ultima istanza, sono stati aggiornati anche i meccanismi deputati ad affrontare '''questioni etiche''', riducendo la probabilità di generare '''risposte inappropriate o dannose'''.

== Links ==
[https://arxiv.org/pdf/2303.08774v4.pdf GPT-4 Technical Report]]

[[Category:modello]]
[[Category:Modelli di Linguaggio]]