Contributi di Alesaccoia
Utente con 1 426 modifiche. Utenza creata il 20 feb 2024.
28 feb 2024
- 15:5515:55, 28 feb 2024 diff cron +35 Pagina principale →Modelli
- 15:3515:35, 28 feb 2024 diff cron +1 673 N Function Calling Creata pagina con "Il "function calling" nei modelli di linguaggio, come GPT-4 o versioni avanzate, si riferisce alla capacità del modello di interagire con funzioni esterne o integrate, eseguendo azioni specifiche basate su input testuali. Questa funzionalità permette al modello di eseguire compiti che vanno oltre la semplice generazione di testo, come effettuare calcoli, generare immagini, eseguire ricerche su internet, o interagire con altri strumenti software, il tutto attraverso l'i..."
- 15:2815:28, 28 feb 2024 diff cron +23 Pagina principale →Apprendimento
- 15:2315:23, 28 feb 2024 diff cron +80 Pagina principale Nessun oggetto della modifica
- 13:3813:38, 28 feb 2024 diff cron +49 HellaSwag Nessun oggetto della modifica
- 13:3813:38, 28 feb 2024 diff cron +1 635 N Adversarial Endings Creata pagina con "Il concetto di "adversarial endings" si riferisce a scenari in cui i modelli di linguaggio sono sfidati con input che possono indurli a generare completamenti fuorvianti o incoerenti. Questi input sono progettati per mettere alla prova la capacità del modello di comprendere il contesto e generare output accurati e coerenti. Ad esempio, consideriamo il benchmark Hellaswag, che richiede ai modelli di completare un dato contesto con una continuazione che dimostri comprens..."
- 13:3413:34, 28 feb 2024 diff cron +48 Pagina principale →Concetti
- 13:2913:29, 28 feb 2024 diff cron +118 HellaSwag Nessun oggetto della modifica
27 feb 2024
- 23:3823:38, 27 feb 2024 diff cron 0 Pagina principale →Concetti
- 23:3823:38, 27 feb 2024 diff cron +15 Pagina principale →Modelli
- 23:3723:37, 27 feb 2024 diff cron +1 156 Metodi di Decoding Nessun oggetto della modifica
- 23:0623:06, 27 feb 2024 diff cron +103 N Metodi di Decoding Creata pagina con " == Links == [https://huggingface.co/blog/how-to-generate https://huggingface.co/blog/how-to-generate]"
- 23:0623:06, 27 feb 2024 diff cron +25 Pagina principale Nessun oggetto della modifica
- 23:0523:05, 27 feb 2024 diff cron +14 Pagina principale Nessun oggetto della modifica
- 23:0423:04, 27 feb 2024 diff cron +78 N Generative Pretrained Transformer (GPT) Creata pagina con " == Links == [https://arxiv.org/pdf/2303.08774v4.pdf GPT-4 Technical Report]]"
- 23:0423:04, 27 feb 2024 diff cron +12 Pagina principale →Modelli
- 23:0123:01, 27 feb 2024 diff cron +360 N Long Short-Term Memory (LSTM) Creata pagina con "Le LSTM sono un tipo speciale di rete neurale ricorrente (RNN) progettate per catturare dipendenze a lungo termine nelle sequenze di dati. Sono particolarmente efficaci nella modellazione di sequenze temporali, come la musica, il linguaggio naturale, o serie temporali finanziarie, grazie alla loro capacità di mantenere lo stato (memoria) per lunghi periodi."
- 22:4722:47, 27 feb 2024 diff cron +4 Automatic Stylistic Composition of Bach Chorales With Deep LSTM (2017) Nessun oggetto della modifica
- 22:4122:41, 27 feb 2024 diff cron −1 Pagina principale Nessun oggetto della modifica
- 22:3822:38, 27 feb 2024 diff cron +31 Pagina principale Nessun oggetto della modifica
- 22:1222:12, 27 feb 2024 diff cron +469 N Automatic Stylistic Composition of Bach Chorales With Deep LSTM (2017) Creata pagina con "== Caratteristiche == Generatore di MIDI: * basato su LSTM * polifonico * frame fissi a 1/16 * interessante la rappresentazione simbolica a 4 voci == Corpus di Training == * Corali di Bach in MusicXML * Trasposizione alla chiave C/Am * Quantizzazione a 1/16 == Implementazione Github == Funziona? == Links == * [https://bachbot.feynmanliang.com https://bachbot.feynmanliang.com] * [https://github.com/feynmanliang/bachbot https://github.com/feynmanliang/bachbot]"
- 21:2421:24, 27 feb 2024 diff cron −154 DeepJ: Style-Specific Music Generation (2018) Pagina sostituita con ' == Link ==' Etichetta: Sostituito
- 21:2421:24, 27 feb 2024 diff cron +166 N DeepJ: Style-Specific Music Generation (2018) Creata pagina con " == Link == * [https://bachbot.feynmanliang.com https://bachbot.feynmanliang.com] * [https://github.com/feynmanliang/bachbot https://github.com/feynmanliang/bachbot]"
- 21:0921:09, 27 feb 2024 diff cron +221 Pagina principale Nessun oggetto della modifica
- 18:0818:08, 27 feb 2024 diff cron +34 Pagina principale →Dataset
- 15:2315:23, 27 feb 2024 diff cron +14 Pagina principale Nessun oggetto della modifica
- 15:2215:22, 27 feb 2024 diff cron +1 481 N HellaSwag Creata pagina con "== Intro == In cosa consiste? Cosa dimostra? == Esempi == [header] How to overcome communication apprehension [title] Pinpoint your fears. [step] Before you can learn to overcome your communication apprehension, you must figure out exactly what it is that is scary or nerve-wrecking. Construct an anxiety hierarchy to help you better understand your fears. Possibilità ['Consider several factors before making a list of potential fears related to communicating inaccurat..."
- 15:1615:16, 27 feb 2024 diff cron +16 Pagina principale Nessun oggetto della modifica
- 15:1415:14, 27 feb 2024 diff cron +12 MMLU Nessun oggetto della modifica
- 15:1315:13, 27 feb 2024 diff cron +1 016 N MMLU Creata pagina con "[https://arxiv.org/pdf/2009.03300.pdf Massive Multitask Language Understanding] Dataset per il testing dell'accuratezza delle informazioni presenti all'interno del modello di linguaggio. E un test a risposta multipla. Esempi di domande: One of the reasons that the government discourages and regulates monopolies is that (A) producer surplus is lost and consumer surplus is gained. (B) monopoly prices ensure productive efficiency but cost society allocative efficiency. (..."
- 15:0915:09, 27 feb 2024 diff cron −1 Pagina principale →Dataset
25 feb 2024
- 06:3706:37, 25 feb 2024 diff cron +979 N Quantizzazione Creata pagina con "Dal 2023, si è avvertita una richiesta crescente di poter eseguire localmente inferenza e fine-tuning dei modelli di linguaggio open source, con risorse computazionali minori. La quantizzazione riduce il numero di bit utilizzati per rappresentare i pesi di un modello, riducendo così la sua dimensione e la sua occupazione di Video RAM, e un aumento della sua velocità di inferenza. Il risultato è anche un aumento della perplexity del modello, ovvero della..."
- 06:2106:21, 25 feb 2024 diff cron +4 Pagina principale →Modelli
- 06:2106:21, 25 feb 2024 diff cron +57 Pagina principale →Concetti
23 feb 2024
- 09:3009:30, 23 feb 2024 diff cron +8 030 N IKEVA-HAI (IULM AI Lab) Creata pagina con "= Iterative Knowledge Enhancement in Virtual Assistants through Human-AI Interaction (IKEVA-HAI) = == Descrizione del Progetto == Il progetto '''Iterative Knowledge Enhancement in Virtual Assistants through Human-AI Interaction''' (IKEVA-HAI) mira a sviluppare assistenti virtuali altamente specializzati attraverso un processo iterativo di interazione tra operatori umani e intelligenza artificiale. Partendo da una base di conoscenza inizialmente vuota o limitata, l'AI è..."
- 09:2509:25, 23 feb 2024 diff cron +30 Pagina principale Nessun oggetto della modifica
- 08:5708:57, 23 feb 2024 diff cron +5 Pagina principale Nessun oggetto della modifica
- 08:5708:57, 23 feb 2024 diff cron +42 N Aiuto:Guida ai Namespaces Alesaccoia ha spostato la pagina Aiuto:Guida ai Namespaces a Aiuto:Categorie di Wiki AI Lab attuale Etichetta: Nuovo reindirizzamento
- 08:5708:57, 23 feb 2024 diff cron 0 m Aiuto:Categorie di Wiki AI Lab Alesaccoia ha spostato la pagina Aiuto:Guida ai Namespaces a Aiuto:Categorie di Wiki AI Lab
- 08:5608:56, 23 feb 2024 diff cron 0 Aiuto:Categorie di Wiki AI Lab Nessun oggetto della modifica
- 08:5508:55, 23 feb 2024 diff cron +24 Few-shot learning Nessun oggetto della modifica
- 08:5408:54, 23 feb 2024 diff cron −13 Pagina principale Nessun oggetto della modifica Etichetta: Ripristino manuale
- 08:5408:54, 23 feb 2024 diff cron +13 Pagina principale Nessun oggetto della modifica Etichetta: Annullato
- 08:5308:53, 23 feb 2024 diff cron −86 Language Models are Few-Shot Learners Nessun oggetto della modifica
- 08:5308:53, 23 feb 2024 diff cron 0 m Language Models are Few-Shot Learners Alesaccoia ha spostato la pagina Paper:Language Models are Few-Shot Learners (2020) a Language Models are Few-Shot Learners (2020) tramite redirect
- 08:5208:52, 23 feb 2024 diff cron +4 Pagina principale Nessun oggetto della modifica
- 08:5208:52, 23 feb 2024 diff cron −75 Pagina principale Nessun oggetto della modifica
- 08:5008:50, 23 feb 2024 diff cron −12 Pagina principale Nessun oggetto della modifica
- 08:5008:50, 23 feb 2024 diff cron +13 Pagina principale Nessun oggetto della modifica
- 08:0208:02, 23 feb 2024 diff cron +129 Pagina principale Nessun oggetto della modifica