AI2 Reasoning Challenge (Arc C)
Intro
Il benchmark ARC si concentra in particolare sulla capacità dei modelli di AI di rispondere a domande di scienza di livello scolastico, coprendo una vasta gamma di argomenti e richiedendo una comprensione approfondita e il ragionamento oltre la mera capacità di cercare informazioni o utilizzare conoscenze superficiali.
Esempi
- Esempio 1
Domanda:
"George vuole riscaldare le sue mani rapidamente strofinandole. Quale superficie della pelle produrrà più calore?"
Opzioni di risposta
A) palmi asciutti B) palmi bagnati C) palmi coperti di olio D) palmi coperti di lozione
Risposta:
"A)"
- Esempio 2
Domanda:
"Quale delle seguenti è una caratteristica che un cane NON eredita dai suoi genitori?"
Opzioni di risposta
A) la lunghezza del suo pelo B) la forma del suo naso C) la grandezza del suo appetito D) il colore del suo pelo
Risposta:
"C)"