jacobkrantz/VLN-CE

🏗️ Frameworkjacobkrantz

Ein Framework für Vision-and-Language Navigation in kontinuierlichen 3D-Umgebungen unter Verwendung des Habitat-Simulators.

VLN-CE (Vision-and-Language Navigation in Continuous Environments) ist ein spezialisiertes Forschungsframework zur Förderung des Bereichs Embodied AI. Im Gegensatz zu herkömmlichen VLN-Aufgaben, die auf diskreten, graphenbasierten Bewegungen beruhen, nutzt VLN-CE den Habitat-Simulator, um eine kontinuierliche, physikbasierte Umgebung bereitzustellen. Dies ermöglicht Forschern das Training von Agenten, die realistische Navigationsherausforderungen wie Hindernisvermeidung, präzise Bewegungen und Sensorrauschen bewältigen. Das Framework bietet umfassende Unterstützung für den R2R-Datensatz (Room-to-Room), der für die kontinuierliche Ausführung angepasst wurde. Es enthält modulare Komponenten für die Agentenarchitektur, die Interaktion mit der Umgebung und Bewertungsmetriken, was es zu einem Standardwerkzeug für das Benchmarking modernster Navigationsmodelle macht. Durch die Nutzung des Habitat-Ökosystems erleichtert VLN-CE die Entwicklung von Agenten, die menschliche Sprachanweisungen – wie „gehe in die Küche und biege am Tisch links ab“ – interpretieren und in komplexen, unbekannten 3D-Szenen ausführen können.

💡Highlights

├─Kontinuierliche 3D-Navigation via Habitat
├─R2R-Datensatz für kontinuierliche VLN
└─Modulare Architektur für KI-Agenten

🎯Für

├─Robotik-Forscher
└─Embodied AI-Ingenieure

🔗Links

└─GitHub Repository