MiDaS: differenze tra le versioni

Da Wiki AI.
Nessun oggetto della modifica
Nessun oggetto della modifica
Riga 7: Riga 7:
Pubblicazioni: [[Pubblicazioni::Towards Robust Monocular Depth Estimation: Mixing Datasets for Zero-shot Cross-dataset Transfer]]; [[Pubblicazioni::Vision Transformers for Dense Prediction]]; [[Pubblicazioni::MiDaS v3.1 – A Model Zoo for Robust Monocular Relative Depth Estimation]]
Pubblicazioni: [[Pubblicazioni::Towards Robust Monocular Depth Estimation: Mixing Datasets for Zero-shot Cross-dataset Transfer]]; [[Pubblicazioni::Vision Transformers for Dense Prediction]]; [[Pubblicazioni::MiDaS v3.1 – A Model Zoo for Robust Monocular Relative Depth Estimation]]


Topic: [[Topic::Stima la profondità di un'immagine utilizzando un approccio basato su reti neurali convoluzionali e tecniche di visione multi-scala]]


[[File:Depth-To-Image.png|miniatura|Depth-To-Image]]
[[File:Depth-To-Image.png|miniatura|Depth-To-Image]]

Versione delle 10:01, 10 apr 2024

Nome Inglese: MUlti-scale Deep Stereo

Sigla: MiDaS

Anno di creazione: 2019

Pubblicazioni: Towards Robust Monocular Depth Estimation: Mixing Datasets for Zero-shot Cross-dataset Transfer; Vision Transformers for Dense Prediction; MiDaS v3.1 – A Model Zoo for Robust Monocular Relative Depth Estimation


Depth-To-Image

Acrhitettura di computer vision per la stima della profondità di un immagine, utilizzato per esempio in Stable Diffusion in particolare in Depth-to-image

Links

https://github.com/isl-org/MiDaS

https://arxiv.org/abs/1907.01341v3

https://arxiv.org/abs/2103.13413

https://arxiv.org/pdf/2307.14460.pdf