Linee Guida della Wiki AI Lab: differenze tra le versioni
Nessun oggetto della modifica |
Nessun oggetto della modifica |
||
Riga 1: | Riga 1: | ||
= Generale = | |||
Gli utenti devono essere loggati per poter aggiungere contenuti | |||
= Scrittura di contenuti = | = Scrittura di contenuti = | ||
Versione delle 12:04, 3 mar 2024
Generale
Gli utenti devono essere loggati per poter aggiungere contenuti
Scrittura di contenuti
Contenuti Vietati
- I contenuti non devono essere generati con ChatGPT o altri modelli di linguaggio:
- parole come "sfida significativa", "sfide o limitazioni", frasi troppo lunghe, pagine costruite in stile troppo divulgativo, troppe sezioni e intestazioni, sono evidenti segni dell'utilizzo di ChatGPT. Le sezioni scritte con ChatGPT devono essere rimosse e l'autore notificato.
- Il copia/incolla da altre fonti, a parte di citazioni particolarmente importanti e dense di significato
- Quindi, i contenuti non devono essere neanche essere una mera traduzione del corrispondente articolo su Wikipedia
Stile di scrittura
- I contenuti devono essere scritti a mano
- I contenuti devono dimostrare un approccio "pratico" alla ricerca, evidenziando in maniera schematica e diretta -SOLO- i concetti più importanti ai fini della ricerca, presupponendo nel lettore una conoscenza dei concetti di base.
- Data un'entità, i concetti interessanti sono quelli che la differenziano dalle altre entità simili, quindi, per esempio per i modelli, sono i benchmark, la tipologia di utilizzo, l'architetture su cui si basano.
- I concetti che vengono menzionati, se non sono auto-evidenti come "rete neurale", "modello", "azienda", sono oggetto di studio e meritano un articolo nella wiki, devono quindi essere scritti con le doppie parentesi quadre creando quindi una pagina interna.
- Molto meglio scrivere meno evidenziando il "succo" o il contributo differenziale di una determinata entità, che scrivere un intero paragrafo di informazioni generiche e rapidamente desumibili da N altre pagine internet
Link
- Come detto, i concetti non auto-evidenti, se legati all'Intelligenza Artificiale, dovrebbero essere già compresi nel momento della scrittura dell'articolo, o devono essere comunque indicati come concetti meritevoli di essere capiti e studiati successivamente. Come linea guida, un utente che legge la Wiki dovrebbe, seguendo i link presenti in ogni articolo, riuscire a comprendere tutto ciò di cui si parla
- Link Interni: nel momento in cui si scrive un articolo, i concetti interessanti devono essere creati come link. E' possibile, nella casella di ricerca, vedere se il concetto è stato giá scritto, e in quel caso il link si visualizzerà come già attivo. Se al momento della scrittura dell'articolo principale, si ottengono già delle informazioni sul concetto, è bene riempire la pagina del concetto utilizzato con delle informazioni, seppur inizialmente minimali, o integrarla con le informazioni aggiuntive che si sono ottenute rispetto al contenuto corrente della pagina
- Link Esterni: per ogni concetto, modello, benchmark, è necessario indicare, in una seziona "Links" a fondo pagina:
- la homepage ufficiale del progetto
- il/i paper di riferimento - se ci sono più versioni includere i paper a tutte le versioni
- E' possibile per alcune entità menzionate linkare direttamente solo alla homepage del progetto, per esempio se si menziona un determinato dataset e non si ha necessità/tempo/voglia di creare una pagina interna ad hoc con degli esempi dal dataset perchè basta una frase. Esempio: "Lakh MIDI Dataset: Dataset di file MIDI per la ricerca musicale" nella homepage
Esempi
Come scrivere un articolo su un Modello di Linguaggio Specifico
- Non si scrive Nessuna introduzione ai modelli di linguaggio, sono un concetto noto
- E' open source o proprietario?
- Data di creazione e eventuali date delle versioni successive
- Chi l'ha creato
- Numero di parametri
- E' pensato per un determinato "task", per esempio per il coding?
- E' stato creato da fine tuning di un altro modello?
- Note sull'Architettura. Usa un modello di Attention Particolare? Encoder/Decoder Only, se Transformer?
- E' multilingua?
- Link:
- Homepage del progetto, in formato "aperta quadra" + link + "Homepage del Progetto" + "chiusa quadra"
- Paper Originale, in formato "aperta quadra" + link al paper + "Paper Llama (2/2/2023)" + "chiusa quadra"
- Paper V2, in formato "aperta quadra" + link al paper + "Paper Llama 2 (2/8/2023)" + "chiusa quadra"
- Link a eventuali Benchmark
Come scrivere un articolo su un concetto di AI
- Descrizione sintetica del concetto, con eventuali link interni (anche se vuoti) a concetti che vengono presupposti per comprenderlo.
- Esempi, per esempio per le scaling laws, per chiarire il concetto a chi legge. Il concetto dev'essere chiaro leggendo
- Link:
- Paper Originale, in formato "aperta quadra" + link al paper + "Paper Hoffmann 2023" + "chiusa quadra"
- Eventuali altri paper relativi al concetto
- Link a tutorial o corsi che si ha visto e che si è ritenuti interessanti per capire il concetto
Come scrivere un articolo su un benchmark
- Cosa misura
- Con che metrica viene misurato
- Uno/Due esempi dal benchmark
- Link:
- Paper Originale, in formato "aperta quadra" + link al paper + "Paper Hoffmann 2023" + "chiusa quadra"
- Eventuali altri paper relativi al benchmark, per esempio puntanti a paperswithcode o huggingface per vedere la classifica