yandex-research/rtdl-revisiting-models

📦 开源项目yandex-research

用于评估表格数据深度学习模型的综合基准测试框架。

rtdl-revisiting-models 存储库是机器学习社区的重要资源，专门解决了深度学习模型与梯度提升决策树（GBDT）在表格数据处理性能上的差距。该项目提供了多种深度学习架构的简洁模块化实现，包括多层感知机（MLP）、ResNet 以及特征标记转换器（FT-Transformer）。除了模型定义，该框架还包含了数据预处理、超参数调优和评估协议所需的必要基础设施。通过提供统一的代码库，它使从业者能够对不同的神经网络方法进行公平的对比。这项研究强调了特定架构选择（如注意力机制和特征嵌入）在表格基准测试中取得竞争性结果的重要性。对于希望在结构化数据上实施或基准测试深度学习方案，并超越对 XGBoost 或 LightGBM 标准依赖的研究者来说，该存储库至关重要。

💡核心亮点

├─包含 FT-Transformer 架构实现
├─提供标准化的表格数据基准测试
└─基于 PyTorch 的完整训练流程

🎯适用人群

├─数据科学家
└─机器学习研究员

🔗链接

└─GitHub 仓库