
yandex-research/rtdl-revisiting-models
📦 开源项目yandex-research
用于评估表格数据深度学习模型的综合基准测试框架。
rtdl-revisiting-models 存储库是机器学习社区的重要资源,专门解决了深度学习模型与梯度提升决策树(GBDT)在表格数据处理性能上的差距。该项目提供了多种深度学习架构的简洁模块化实现,包括多层感知机(MLP)、ResNet 以及特征标记转换器(FT-Transformer)。
除了模型定义,该框架还包含了数据预处理、超参数调优和评估协议所需的必要基础设施。通过提供统一的代码库,它使从业者能够对不同的神经网络方法进行公平的对比。这项研究强调了特定架构选择(如注意力机制和特征嵌入)在表格基准测试中取得竞争性结果的重要性。对于希望在结构化数据上实施或基准测试深度学习方案,并超越对 XGBoost 或 LightGBM 标准依赖的研究者来说,该存储库至关重要。
💡核心亮点
- ├─包含 FT-Transformer 架构实现
- ├─提供标准化的表格数据基准测试
- └─基于 PyTorch 的完整训练流程
🎯适用人群
- ├─数据科学家
- └─机器学习研究员