Исследования и написание

Академия

Написание и исследование в области программной инженерии, ИИ, вычислений и цифровой культуры.

Доклады на конференциях

Искусственный интеллект · November 2025

Моделирование противников для обучения моделей на основе метода Монте-Карло для деревьев решений в настольной игре Citadels

Данная работа исследует, как моделирование противников влияет на обучение гибридного MCTS-RL фреймворка, применённого к многопользовательской настольной игре Citadels со скрытой информацией, несколькими игроками и временными ограничениями. Предложение разделяет планирование и исполнение посредством персистентной структуры решений, построенной офлайн из симуляций, сокращая онлайн-вычислительные затраты MCTS. В симуляционной среде с агентами-экспертами и случайным агентом различные сессии обучения (включая разнообразную среду) сравниваются по частоте побед. Результаты показывают, что разнообразие стратегий в обучении, как правило, позволяет создать более надёжного и универсального агента, чем обучение против индивидуально сильных противников.

Диссертации и монографии

Искусственный интеллект · 2025

Персистентный метод Монте-Карло для деревьев решений для агентов в сложных средах: исследование на примере Citadels

Принятие решений в многопользовательских играх с частичной наблюдаемостью сопряжено со значительными трудностями из-за скрытой информации и высоких коэффициентов ветвления. В данном исследовании представлен фреймворк на основе персистентного метода Монте-Карло для деревьев решений (MCTS), разработанный для эффективной работы в подобных средах, с использованием стратегической настольной игры Citadels в качестве примера. Ключевым вкладом является разделение фазы построения дерева и фазы применения: деревья решений генерируются в автономном режиме с помощью симуляций среды, а соответствующая статистика хранится в табличной форме, что обеспечивает быстрые запросы во время выполнения без необходимости дополнительных симуляций. Экспериментальная оценка показывает, что воздействие разнообразных противников в процессе обучения позволяет создавать модели с устойчивыми и обобщаемыми стратегиями, способными демонстрировать высокую производительность в широком спектре игровых сценариев. В частности, модели, обученные в среде, где противники выбирались случайным образом, неизменно превосходили те, что обучались против одного типа противника, и демонстрировали стабильную производительность в разных обучающих прогонах. Полученные результаты подчёркивают эффективность сочетания MCTS с персистентным хранением знаний для создания быстрых, надёжных и адаптируемых агентов в сложных предметных областях.