
getml/getml-community
📦 오픈 소스 프로젝트getml
관계형 및 다변량 시계열 데이터를 위한 자동화된 피처 엔지니어링 및 머신러닝 플랫폼.
getml-community는 머신러닝 과정에서 가장 시간이 많이 소요되는 피처 엔지니어링 문제를 해결합니다. 대부분의 AutoML 도구가 모델 선택이나 하이퍼파라미터 튜닝에 집중하는 반면, getml은 원시 관계형 데이터를 예측 가능한 피처로 변환하는 데 탁월합니다. 여러 테이블에 걸쳐 패턴을 자동으로 발견하는 고급 피처 학습 알고리즘을 사용하여, 정보가 다양한 관계형 스키마에 분산된 엔터프라이즈급 데이터 환경에 최적화되어 있습니다.
이 엔진은 C++로 작성되어 대규모 데이터셋 처리 시 높은 계산 효율성을 보장합니다. 또한 다변량 시계열 예측을 지원하여 표준 회귀 모델이 놓치기 쉬운 복잡한 종속성을 모델링할 수 있습니다. 관계형 조인 및 시간 기반 집계로부터 피처 생성을 자동화함으로써 데이터 준비에 필요한 수동 작업을 크게 줄이고 모델 정확도를 향상시킵니다. 기존 파이썬 기반 데이터 과학 워크플로우와 원활하게 통합되어 자동화된 머신러닝 파이프라인을 위한 강력한 백엔드를 제공합니다.