lpiccinelli/unidepth-v2-vitl14
🧠 ИИ Модельlpiccinelli
Современная модель монокулярной метрической оценки глубины на базе ViT-L.
UniDepth v2 (ViT-L/14) — мощная модель оценки глубины, использующая основу Vision Transformer для предсказания метрических карт глубины. Она обрабатывает одно RGB-изображение и выводит плотную карту глубины в метрическом масштабе. Модель обучена на разнообразных наборах данных, включая внутренние (NYUv2) и уличные (KITTI) сцены, и достигает передовой производительности. Использует фреймворк PyTorch и safetensors для эффективного хранения. Модель предназначена для приложений реального времени и интегрируется с экосистемой Hugging Face через model_hub_mixin.
💡Основное
- ├─Базовый ViT-L/14
- ├─Метрическая оценка глубины
- └─5M+ загрузок на HuggingFace
🎯Для
- ├─Исследователи компьютерного зрения
- ├─Инженеры автономного вождения
- └─Разработчики AR/VR