Schema di Winograd: differenze tra le versioni
(Creata pagina con "Test per valutare le capacità di ragionamento della macchina, nato come superamento di quello di Turing, che prende il nome dal professore dela Stanford University, Terry Allen Winograd. Gli Schemi di Winograd, che sono molto complessi da creare, sono delle frasi in cui al posto di una determinata parola fornita la scelta tra due diverse parole: la scelta di una o dell'altra stavolge completamente il significato della frase. Nel benchmark Winograd...") |
Nessun oggetto della modifica |
||
Riga 1: | Riga 1: | ||
Test per valutare le capacità di ragionamento della macchina, nato come superamento di quello di [[Test di Turing|Turing]] | Test per valutare le capacità di ragionamento della macchina, nato come superamento di quello di [[Test di Turing|Turing]]. Il test prende il nome dal professore dela Stanford University, [[Terry Allen Winograd]]. | ||
Gli Schemi di Winograd, che sono molto complessi da creare, sono delle frasi in cui al posto di una determinata parola fornita la scelta tra due diverse parole: la scelta di una o dell'altra stavolge completamente il significato della frase. Nel benchmark [[Winograd Schema Challenge]], il software deve indicare quale sia la pi`¨plausibile. | Gli Schemi di Winograd, che sono molto complessi da creare, sono delle frasi in cui al posto di una determinata parola fornita la scelta tra due diverse parole: la scelta di una o dell'altra stavolge completamente il significato della frase. Nel benchmark [[Winograd Schema Challenge]], il software deve indicare quale sia la pi`¨plausibile. | ||
Ad esempio, il primo schema, inventato da Winograd, fu:<blockquote>The city councilmen refused the demonstrators a permit because they ['''feared/advocated'''] violence.</blockquote>[[Hector Levesque]], che rese questo tipo di trivia un benchmark, sostiene che, mentre per una persona scegliere tra le due opzioni è semplice (la risposta corretta è '''advocated'''), per una macchina è difficile cogliere la sfumatura, in quanto per rispondere, essa deve conoscere la tipica relazione esistente, in una manifestazione, fra forze dell'ordine e dimostratori. | Ad esempio, il primo schema, inventato da Winograd, fu:<blockquote>The city councilmen refused the demonstrators a permit because they ['''feared/advocated'''] violence.</blockquote>[[Hector Levesque]], che rese questo tipo di trivia un benchmark, sostiene che, mentre per una persona scegliere tra le due opzioni è semplice (la risposta corretta è '''advocated'''), per una macchina è difficile cogliere la sfumatura, in quanto per rispondere, essa deve conoscere la tipica relazione esistente, in una manifestazione, fra forze dell'ordine e dimostratori. | ||
Nel 2020, la maggior parte dei modelli di NLU più famosi otteneva un punteggio superiore al 90%, quindi il '''test viene considerato risolto'''. | |||
== Collegamenti == | == Collegamenti == |
Versione delle 09:18, 4 gen 2025
Test per valutare le capacità di ragionamento della macchina, nato come superamento di quello di Turing. Il test prende il nome dal professore dela Stanford University, Terry Allen Winograd.
Gli Schemi di Winograd, che sono molto complessi da creare, sono delle frasi in cui al posto di una determinata parola fornita la scelta tra due diverse parole: la scelta di una o dell'altra stavolge completamente il significato della frase. Nel benchmark Winograd Schema Challenge, il software deve indicare quale sia la pi`¨plausibile.
Ad esempio, il primo schema, inventato da Winograd, fu:
The city councilmen refused the demonstrators a permit because they [feared/advocated] violence.
Hector Levesque, che rese questo tipo di trivia un benchmark, sostiene che, mentre per una persona scegliere tra le due opzioni è semplice (la risposta corretta è advocated), per una macchina è difficile cogliere la sfumatura, in quanto per rispondere, essa deve conoscere la tipica relazione esistente, in una manifestazione, fra forze dell'ordine e dimostratori.
Nel 2020, la maggior parte dei modelli di NLU più famosi otteneva un punteggio superiore al 90%, quindi il test viene considerato risolto.
Collegamenti
Una collezione dei primi Schemi di Winograd
Can Winograd Schemas Replace Turing Test for Defining Human-Level AI?