인공지능 · 2025복잡한 환경에서 동작하는 에이전트를 위한 지속적 몬테카를로 트리 탐색: 시타델을 통한 사례 연구
부분 관측 가능한 멀티플레이어 게임에서의 의사결정은 숨겨진 정보와 높은 분기 요소로 인해 상당한 어려움을 야기한다. 본 연구는 전략 보드게임 시타델(Citadels)을 사례 연구로 활용하여, 이러한 환경에서 효율적으로 운영되도록 설계된 지속적 몬테카를로 트리 탐색(MCTS) 프레임워크를 소개한다. 핵심 기여는 트리 구축 단계와 적용 단계의 분리에 있다: 의사결정 트리는 환경 시뮬레이션을 통해 오프라인으로 생성되며, 관련 통계는 표 형식으로 저장되어 추가 시뮬레이션 없이 실행 중 빠른 쿼리가 가능하다. 실험적 평가를 통해, 훈련 중 다양한 상대방에 노출되면 광범위한 게임 시나리오에서 강력한 성능을 발휘할 수 있는 견고하고 일반화 가능한 전략을 가진 모델이 생성됨이 입증되었다. 특히, 상대방이 확률적으로 샘플링되는 환경에서 훈련된 모델은 단일 상대방 유형에 대해 훈련된 모델을 지속적으로 능가했으며, 훈련 실행 간에 안정적인 성능을 보였다. 이러한 결과는 MCTS와 지속적 지식 저장소를 결합하여 복잡한 도메인에서 빠르고 신뢰할 수 있으며 적응력 있는 에이전트를 생성하는 효과를 뒷받침한다.