
HazyResearch/data-centric-ai
📦 오픈 소스 프로젝트HazyResearch
데이터 중심 AI 패러다임을 위한 연구, 논문 및 리소스를 모아놓은 큐레이션 저장소입니다.
데이터 중심 AI 패러다임은 모델 아키텍처 엔지니어링에서 데이터 품질의 체계적 개선으로 초점을 전환합니다. 이 저장소는 해당 분야의 핵심 허브로서, 주요 논문, 기술 리소스 및 모범 사례를 구조화된 목록으로 제공합니다. 데이터 라벨링, 데이터 클리닝, 합성 데이터 생성, 데이터 디버깅과 같은 중요한 영역을 다룹니다. '데이터 우선' 철학을 강조함으로써 개발자들이 더욱 견고하고 신뢰할 수 있으며 성능이 뛰어난 AI 시스템을 구축하는 방법을 이해하도록 돕습니다. 특히 노이즈가 많은 데이터셋 처리, 데이터 프로그래밍 구현, 약지도 학습(weak supervision)을 활용한 모델 학습 확장 등을 탐구하는 이들에게 매우 유용하며, 진화하는 데이터 중심 머신러닝 분야의 살아있는 참고 문헌 역할을 합니다.
💡하이라이트
- ├─데이터 중심 연구 큐레이션
- ├─모델보다 데이터 품질에 집중
- └─약지도 학습 및 데이터 정제 포함
🎯대상
- ├─머신러닝 엔지니어
- ├─데이터 과학자
- └─AI 연구원