Collecting robot training data is dirty, unglamorous work. Some AI labs are already paying XDOF to do it.
📰 文章Tim Fernholz
XDOF 构建关键数据管道与远程操作基础设施,助力训练下一代物理 AI 机器人。
XDOF(发音为“ecks-doff”)通过构建物理 AI 训练的综合生态系统,致力于解决机器人领域的“数据瓶颈”。与依赖互联网海量文本的 LLM 不同,机器人技术需要难以获取的高保真物理交互数据。XDOF 的业务涵盖三个层面:高精度远程操作数据、通用机器人数据,以及通过可穿戴传感器采集的人类中心化(以自我为中心)数据。
在技术层面,该公司专注于整个反馈循环,包括用于数据采集的硬件设计、数据清洗以及复杂的标注系统。通过确保硬件与软件的紧密集成,XDOF 避免了低保真视频训练中常见的“垃圾进,垃圾出”问题。他们与加州大学伯克利分校在“ABC”数据集上的合作——包含 13 万条轨迹和数百小时的模拟数据——标志着为研究界提供开放获取的高质量数据迈出了重要一步。通过将劳动密集型的数据采集过程专业化,XDOF 旨在成为新兴物理 AI 行业的底层基础设施。