sirmammingtonham/alphastone

📦 오픈 소스 프로젝트sirmammingtonham

AlphaZero 방식의 자가 대국과 몬테카를로 트리 탐색을 활용한 하스스톤 강화학습 에이전트.

AlphaStone은 복잡한 불완전 정보 카드 게임인 하스스톤에 AlphaZero의 방법론을 적용하는 연구를 수행합니다. 체스나 바둑과 같은 완전 정보 게임과 달리, 하스스톤은 숨겨진 정보를 다루어야 하며, 이 프로젝트는 정보 집합 몬테카를로 트리 탐색(ISMCTS)을 통해 이를 해결합니다. PyTorch로 구축된 심층 신경망 아키텍처는 게임 상태 평가와 정책 분포를 근사하는 데 사용됩니다. 시스템은 방대한 자가 대국을 통해 학습하며, 인간의 휴리스틱 없이도 최적의 전략을 스스로 발견합니다. 이 저장소는 심층 학습과 게임 이론의 교차점에 관심 있는 이들을 위한 기술적 토대를 제공하며, 높은 변동성과 확률적 환경에서의 상태 표현, 수 선택, 보상 모델링에 대한 모듈식 접근 방식을 제시합니다.

💡하이라이트

├─AlphaZero 스타일의 자가 대국 루프
├─불완전 정보 처리를 위한 ISMCTS
└─PyTorch 기반의 신경망 아키텍처

🎯대상

├─AI 연구자
├─강화학습 엔지니어
└─게임 AI 개발자

🔗링크

└─GitHub 저장소