HMDB: a large human motion database: differenze tra le versioni
(Creata pagina con " * Dimensione: 2 Gb * Numero di clip: 7000 * Classi: 51 === Links === [https://serre-lab.clps.brown.edu/resource/hmdb-a-large-human-motion-database/#overview https://serre-lab.clps.brown.edu/resource/hmdb-a-large-human-motion-database/#overview]") |
Nessun oggetto della modifica |
||
(9 versioni intermedie di 4 utenti non mostrate) | |||
Riga 1: | Riga 1: | ||
{{Template benchmark | |||
|Nome=A large human motion database | |||
|Sigla=HMDB | |||
|Anno di creazione=2011 | |||
|URLHomePage=https://serre-lab.clps.brown.edu/resource/hmdb-a-large-human-motion-database/#overview HomePage HMDB | |||
|Pubblicazione= | |||
}} | |||
== Introduzione == | |||
L'HMDB, raccolto da diverse fonti principalmente cinematografiche e, in minore misura, da archivi pubblici come l'archivio Prelinger, YouTube e video di Google, comprende 6849 clip suddivise in 51 categorie di azioni, ognuna con almeno 101 clip. Le categorie di azioni si dividono in cinque tipi: | |||
- Azioni facciali generali: sorridere, ridere, masticare, parlare. | |||
- Azioni facciali con manipolazione di oggetti: fumare, mangiare, bere. | |||
- Movimenti corporei generali: fare la ruota, applaudire, arrampicarsi, salire le scale, tuffarsi, cadere a terra, fare la capriola all'indietro, stare in verticale sulle mani, saltare, fare trazioni, flessioni, correre, sedersi, alzarsi, fare la capriola, girarsi, camminare, salutare. | |||
- Movimenti corporei con interazione di oggetti: spazzolarsi i capelli, acchiappare, estrarre una spada, palleggiare, giocare a golf, colpire qualcosa, calciare una palla, raccogliere, versare, spingere qualcosa, andare in bicicletta, cavalcare, tirare a canestro, tirare con l'arco, sparare con una pistola, oscillare con una mazza da baseball, esercitarsi con la spada, lanciare. | |||
- Movimenti corporei per interazione umana: scherma, abbracciare, calciare qualcuno, baciare, pugilare, stringere mani, combattere con la spada. | |||
== Dataset, meta etichette, statistiche e stabilizzazione == | |||
Otre all'etichetta della categoria di azione, ogni clip è annotata con un'etichetta di azione e una meta-etichetta che descrive la proprietà della clip. Poiché le sequenze video HMDB51 sono estratte da film commerciali e da YouTube, rappresentano una vasta varietà di condizioni di luce, situazioni e contesti in cui l'azione può apparire, catturati con diversi tipi di telecamere e tecniche di registrazione. Il punto di vista è un altro criterio di suddivisione supportato dall'HMDB. Per una copertura completa, sono distinguibili le prospettive frontale, laterale (destra e sinistra) e posteriore dei movimenti. Inoltre, esistono due categorie distinte, ovvero "nessun movimento" e "movimento della telecamera". La qualità dei video è valutata su tre livelli, e solo i campioni video classificati come "buoni" soddisfano il requisito di identificare le singole dita durante il movimento. I campioni che non soddisfano questo requisito sono valutati come "medi" o "cattivi" se parti del corpo o arti scompaiono durante l'esecuzione dell'azione. Il dataset include anche una sfida maggiore associata all'uso di clip video estratte da video reali: la presenza potenziale di significativi movimenti di telecamera/sfondo, che si presume interferiscano con il calcolo del movimento locale e debbano essere corretti. Per rimuovere il movimento della telecamera, sono state utilizzate tecniche standard di stitching delle immagini per allineare i fotogrammi di una clip. | |||
Nei seguenti file vengono illustrate le 51 azioni | |||
[[File:HMDB_snapshot1.png|200px]] | |||
[[File:HMDB_snapshot2.png|200px]] | |||
=== Links === | === Links === | ||
[https://serre-lab.clps.brown.edu/resource/hmdb-a-large-human-motion-database/#overview https://serre-lab.clps.brown.edu/resource/hmdb-a-large-human-motion-database/#overview] | [https://serre-lab.clps.brown.edu/resource/hmdb-a-large-human-motion-database/#overview https://serre-lab.clps.brown.edu/resource/hmdb-a-large-human-motion-database/#overview] | ||
{{#seo: | |||
|title=HMDB: A large human motion database | |||
|title_mode=append | |||
|keywords=database, movimento, azioni, video, HMDB, apprendimento automatico, visione artificiale, riconoscimento azioni, classificazione, computer vision | |||
|description=L'HMDB è un database di azioni umane con oltre 6.800 clip video classificate in 51 categorie di azioni. Questo database, creato nel 2011, è uno strumento prezioso per la ricerca sull'apprendimento automatico e la visione artificiale, in particolare per lo sviluppo di algoritmi di riconoscimento delle azioni. | |||
|image=HMDB_snapshot1.png | |||
}} |
Versione attuale delle 13:47, 17 ago 2024
HMDB: a large human motion database | |
---|---|
Nome | A large human motion database |
Sigla | HMDB |
Anno di creazione | 2011 |
URLHomePage | https://serre-lab.clps.brown.edu/resource/hmdb-a-large-human-motion-database/#overview HomePage HMDB |
Pubblicazione |
Introduzione
L'HMDB, raccolto da diverse fonti principalmente cinematografiche e, in minore misura, da archivi pubblici come l'archivio Prelinger, YouTube e video di Google, comprende 6849 clip suddivise in 51 categorie di azioni, ognuna con almeno 101 clip. Le categorie di azioni si dividono in cinque tipi:
- Azioni facciali generali: sorridere, ridere, masticare, parlare. - Azioni facciali con manipolazione di oggetti: fumare, mangiare, bere. - Movimenti corporei generali: fare la ruota, applaudire, arrampicarsi, salire le scale, tuffarsi, cadere a terra, fare la capriola all'indietro, stare in verticale sulle mani, saltare, fare trazioni, flessioni, correre, sedersi, alzarsi, fare la capriola, girarsi, camminare, salutare. - Movimenti corporei con interazione di oggetti: spazzolarsi i capelli, acchiappare, estrarre una spada, palleggiare, giocare a golf, colpire qualcosa, calciare una palla, raccogliere, versare, spingere qualcosa, andare in bicicletta, cavalcare, tirare a canestro, tirare con l'arco, sparare con una pistola, oscillare con una mazza da baseball, esercitarsi con la spada, lanciare. - Movimenti corporei per interazione umana: scherma, abbracciare, calciare qualcuno, baciare, pugilare, stringere mani, combattere con la spada.
Dataset, meta etichette, statistiche e stabilizzazione
Otre all'etichetta della categoria di azione, ogni clip è annotata con un'etichetta di azione e una meta-etichetta che descrive la proprietà della clip. Poiché le sequenze video HMDB51 sono estratte da film commerciali e da YouTube, rappresentano una vasta varietà di condizioni di luce, situazioni e contesti in cui l'azione può apparire, catturati con diversi tipi di telecamere e tecniche di registrazione. Il punto di vista è un altro criterio di suddivisione supportato dall'HMDB. Per una copertura completa, sono distinguibili le prospettive frontale, laterale (destra e sinistra) e posteriore dei movimenti. Inoltre, esistono due categorie distinte, ovvero "nessun movimento" e "movimento della telecamera". La qualità dei video è valutata su tre livelli, e solo i campioni video classificati come "buoni" soddisfano il requisito di identificare le singole dita durante il movimento. I campioni che non soddisfano questo requisito sono valutati come "medi" o "cattivi" se parti del corpo o arti scompaiono durante l'esecuzione dell'azione. Il dataset include anche una sfida maggiore associata all'uso di clip video estratte da video reali: la presenza potenziale di significativi movimenti di telecamera/sfondo, che si presume interferiscano con il calcolo del movimento locale e debbano essere corretti. Per rimuovere il movimento della telecamera, sono state utilizzate tecniche standard di stitching delle immagini per allineare i fotogrammi di una clip.
Nei seguenti file vengono illustrate le 51 azioni
Links
https://serre-lab.clps.brown.edu/resource/hmdb-a-large-human-motion-database/#overview