lpiccinelli/unidepth-v2-vitl14

🧠 ИИ Модельlpiccinelli

Современная модель монокулярной метрической оценки глубины на базе ViT-L.

UniDepth v2 (ViT-L/14) — мощная модель оценки глубины, использующая основу Vision Transformer для предсказания метрических карт глубины. Она обрабатывает одно RGB-изображение и выводит плотную карту глубины в метрическом масштабе. Модель обучена на разнообразных наборах данных, включая внутренние (NYUv2) и уличные (KITTI) сцены, и достигает передовой производительности. Использует фреймворк PyTorch и safetensors для эффективного хранения. Модель предназначена для приложений реального времени и интегрируется с экосистемой Hugging Face через model_hub_mixin.

💡Основное

├─Базовый ViT-L/14
├─Метрическая оценка глубины
└─5M+ загрузок на HuggingFace

🎯Для

├─Исследователи компьютерного зрения
├─Инженеры автономного вождения
└─Разработчики AR/VR

🔗Ссылки

└─Модель HuggingFace