
yandex-research/rtdl-revisiting-models
📦 Open Source Projectyandex-research
Комплексный фреймворк для бенчмаркинга моделей глубокого обучения на табличных данных.
Репозиторий rtdl-revisiting-models является критически важным ресурсом для сообщества машинного обучения, решающим проблему разрыва в производительности между моделями глубокого обучения и градиентным бустингом (GBDT) на табличных данных. Проект предоставляет чистую, модульную реализацию нескольких архитектур, включая многослойные перцептроны (MLP), ResNet и Feature Tokenizer Transformer (FT-Transformer). Помимо определений моделей, фреймворк включает инфраструктуру для предобработки данных, настройки гиперпараметров и протоколы оценки. Единая кодовая база позволяет проводить честное сравнение различных нейросетевых подходов. Исследование подчеркивает важность архитектурных решений, таких как механизмы внимания и эмбеддинги признаков, для достижения конкурентных результатов. Этот репозиторий необходим всем, кто хочет внедрять или тестировать решения глубокого обучения для структурированных данных, выходя за рамки стандартного использования XGBoost или LightGBM.
💡Основное
- ├─Включает архитектуру FT-Transformer
- ├─Стандартизированные табличные бенчмарки
- └─Пайплайны обучения на PyTorch
🎯Для
- ├─Data Scientists
- └─Исследователи машинного обучения