🩺 AgentRx 공개, 이제 AI 에이전트는 ‘잘 작동하느냐’보다 ‘왜 실패했는지 설명할 수 있느냐’가 더 중요해졌습니다 마이크로소프트 리서치가 2026년 3월 AgentRx 프레임워크와 AgentRx Benchmark를 공개했습니다. 얼핏 보면 연구용 진단 도구 발표처럼 들릴 수 있습니다. 하지만 내용을 자세히 보면, 이 뉴스는 AI 에이전트 시대의 핵심 과제를 정면으로 건드립니다. 바로 ‘에이전트가 실패했을 때 어디서, 왜, 어떻게 망가졌는지 추적할 수 있는가’라는 문제입니다. 📌 생성형 AI가 단순 질의응답을 넘어 웹 조작, 파일 작업, API 호출, 멀티스텝 자동화로 확장되면서 실패 양상도 훨씬 복잡해졌습니다. 예전에는 답변이 이상하면 프롬프트를 조금 바꾸는 정도로 끝났습니다. 하지만 에이전..