
drivendataorg/cookiecutter-data-science
🏗️ 框架drivendataorg
为数据科学项目提供逻辑化、标准化的项目结构模板。
Cookiecutter Data Science 是一个开源项目模板,为数据科学工作建立通用的项目结构。由 DrivenData 开发和维护,该 cookiecutter 模板生成可直接使用的目录布局,包含 data(原始、中间、处理)、notebooks、src、reports 和 models 等文件夹。它包括虚拟环境、版本控制和 Docker 的配置文件,以及文档模板。该结构设计灵活,允许团队在保持一致性的同时适应特定工作流程。它鼓励最佳实践,如将数据处理与建模分离、使用版本控制和记录决策。该项目在 GitHub 上获得近 10,000 星,表明其在数据科学社区的广泛采用。