人工知能
複雑な環境で動作するエージェントのための永続的モンテカルロ木探索:シタデルを用いた事例研究
Andrei Carlesso Camilotto, Djonatan Riquelme Clein Bonelli, Eduardo Vinicius Perissinotto Fiorentin, João Luís Almeida Santos, Felipe Grando
2025Universidade Federal da Fronteira Sul (UFFS)Universidade Federal da Fronteira Sul — Campus Chapecó, 2025
抽象
部分観測可能なマルチプレイヤーゲームにおける意思決定は、隠れた情報と大きな分岐因子により重大な課題をもたらす。本研究では、このような環境で効率的に動作するよう設計された永続的モンテカルロ木探索(MCTS)フレームワークを提案し、戦略的ボードゲーム「シタデル(Citadels)」を事例として使用する。主な貢献は、木構築フェーズと適用フェーズの分離にある:決策木は環境シミュレーションを通じてオフラインで生成され、関連統計は表形式で保存されるため、追加シミュレーションなしに実行中の高速クエリが可能となる。実験的評価により、訓練中に多様な対戦相手に接することで、幅広いゲームシナリオで高いパフォーマンスを発揮できるロバストで汎化可能な戦略を持つモデルが生成されることが示された。特に、対戦相手が確率的にサンプリングされる環境で訓練されたモデルは、単一の対戦相手タイプに対して訓練されたモデルを一貫して上回り、訓練実行間で安定したパフォーマンスを示した。これらの知見は、MCTSと永続的知識ストレージを組み合わせることで、複雑な領域において高速、信頼性が高く、適応可能なエージェントを生成する効果を裏付けている。
キーワード:モンテカルロ木探索人工知能アルゴリズムボードゲームシタデル
