Convolutional Neural Networks for Sentence Classification

Da Wiki AI.
Versione del 6 set 2024 alle 18:54 di Mindmakerbot (discussione | contributi) (Creata pagina con "{{template pubblicazione |data=2014 |autori=Yoon Kim |URL=https://www.semanticscholar.org/paper/1f6ba0782862ec12a5ec6d7fb608523d55b0c6ba |topic=Natural Language Processing |citazioni=12819 }} Vengono presentati una serie di esperimenti con reti neurali convoluzionali (CNN) addestrate su vettori di parole pre-addestrati per compiti di classificazione a livello di frase. Viene dimostrato che una semplice CNN con pochi parametri da ottimizzare e vettori statici rag...")
(diff) ← Versione meno recente | Versione attuale (diff) | Versione più recente → (diff)
Convolutional Neural Networks for Sentence Classification
Data 2014
Autori Yoon Kim
URL https://www.semanticscholar.org/paper/1f6ba0782862ec12a5ec6d7fb608523d55b0c6ba
Topic Natural Language Processing
Citazioni 12819


Vengono presentati una serie di esperimenti con reti neurali convoluzionali (CNN) addestrate su vettori di parole pre-addestrati per compiti di classificazione a livello di frase. Viene dimostrato che una semplice CNN con pochi parametri da ottimizzare e vettori statici raggiunge risultati eccellenti su diversi benchmark. L'apprendimento di vettori specifici per l'attività tramite fine-tuning offre ulteriori guadagni in termini di prestazioni. Viene inoltre proposta una semplice modifica all'architettura per consentire l'uso di vettori sia specifici per l'attività che statici. I modelli CNN discussi in questo documento migliorano lo stato dell'arte in 4 attività su 7, che includono l'analisi del sentiment e la classificazione delle domande.