🧩 왜 이게 ‘미친 난이도’였나?🗺️ 거대한 상태공간: 시야 제한(안개), 오브젝트 수백 개, 실시간 변수 폭발. 체스/바둑처럼 완전정보 게임이 아님.🧠 장기 계획 + 순간 판단: 라인전/한타/로샨/오브젝티브 등 수분~수십분짜리 전략과 프레임 단위 미세 컨트롤이 동시에 필요.👥 협업 의존도: 5명이 역할 분담과 시그널 공유를 못 하면 바로 패배. 개별 실력만으론 못 비빔.🎭 메타 변동: 패치 한 번이면 영웅·아이템 밸런스가 뒤집혀 학습 내성이 필요.🧠 학습 핵심: “자가 대전 + 대규모 분산 RL”🔁 Self-Play 루프: 스스로 팀을 이뤄 끝없이 붙어보며 승리 전략을 증류. 사람의 수작업 전략 주입 최소화.🧮 정책 기반 RL(PPO 계열): 거대한 연속·불연속 행동공간에서 안정적 업데이..